[Frage] "Indexed Search" und "Crawler": Indizierungseinstellungen vs. Crawler Configurations - Was ist der Unterscheid? TYPO3-Version: 8.7.27

  • miniton miniton
    T3PO
    0 x
    14 Beiträge
    1 Hilfreiche Beiträge
    20. 11. 2020, 13:20

    Hallo liebe Typo3-Gemeinde,

    ich versuche gerade das Zusammenspiel zwischen den Extensions "indexed_search" und "crawler" zu verstehen, da ich auf einer Webseite die Suche verbessern will.

    Für Crawler kann ich ja eine Konfiguration angelegen, mit der die Seite durchsucht wird. Das klappt.

    Nun gibt es ja auch noch die Indizierungseinstellungen von indexed_search, wozu werden diese benötigt? Der Crawler läuft auch ohne.

    Danke und viele Grüße
    Christian


  • 1
  • miniton miniton
    T3PO
    0 x
    14 Beiträge
    1 Hilfreiche Beiträge
    23. 11. 2020, 13:36

    Falls es jemanden nützt, schreibe ich mal hier auf, was ich mittlerweile selbst herausgefunden habe:

    Die Indizierungseinstellungen, die indexed_search liefert, können alternativ oder zusätzlich zu den "crawler configurations" verwendet werden.

    Die Indizierung wird allerdings unterschiedlich angestossen. Während bei Nutzung einer "crawler configuration" erstmal die Crawler Queue gefüllt werden muss (z.B. durch den entsprechenden Task im Planer), und dann die Queue verarbeitet wird (z.B. "Crawler Run" im Planer) geht das bei den Indizierungseinstellungen anders:

    Hier wird beim Starten des Crawler-Prozesses sowohl das Füllen wie auch das Bearbeiten der Queue angestossen. Neue Einträge in der Queue werden dann beim nächsten Crawling bearbeitet.

    Dabei wird auch der Eintrag für die nächste Indizierung in der Einstellung berücksichtigt. Zum Testen muss das Feld leer sein, damit die Indizierung sofort passiert. Darauf bin ich erst nach langem Probieren gekommen, das hat es für mich so undurchsichtig gemacht.

    Ach ja, ich verwende TYPO3 8.7., das ist erstmal nicht zu ändern.

    Und für das Crawlen dieser speziellen Webseite nutze ich jetzt was ganz anderes, nämlich ein Skript mit "wget". Damit kriege ich auch die Einträge im Calendarize-Kalender erfasst.

    Viele Grüße
    Christian

  • 1