[Frage] TYPO3 9+ Crawler für Indexierung richtig einstellen [Gelöst] TYPO3-Version: 9.5.19

  • PeterWadson PeterWads...
    Padawan
    0 x
    49 Beiträge
    0 Hilfreiche Beiträge
    30. 06. 2020, 10:35

    Hallo community,

    wir betreuen eine TYPO3 9+ Webseite die auch eine Index-Suche besitzt.
    Das System etwas älter aber wir sind mit dem Migrieren von Version 6 fast fertig.

    Was wir für die Suche gemacht haben:
    - Indexing angestellt + Caching der Seite aktiviert (funktioniert auch bei Seitenaufruf)
    - "crawler" Extension installiert (aktuelle Version: 9.0.1)
    - htaccess Passwortschutz entfernt
    - cronjob über php Datei: exec( "<path_to_project>/typo3/sysext/core/bin/typo3 crawler:buildqueue 1 default --depth 4 -–mode exec > /dev/null");
    - eine crawler config "default" in pid 1 angelegt (processing_instruction_filter -> Re-indexing aktivert + BaseURL eingetragen)
    - eine Indizierungseinstellungen mit "Seitenbaum" Option in pid 1 angelegt

    Leider wird die Seite nicht gecrawled und damit die Suche auch nicht aufgebaut.
    Was haben wir vergessen?

    Ach ja und wie kann man die Indexierung vorab zurücksetzen?
    Muss man dafür immer noch die index_ Tabellen leeren?

  • PeterWadson PeterWads...
    Padawan
    0 x
    49 Beiträge
    0 Hilfreiche Beiträge
    30. 06. 2020, 11:35 - Lösung

    Okay ich konnte es schon selber beantworten.
    Man sollte sich einfach mal die Fehler Ausgabe angucken, da gibt es manchmal Vorschläge:

    <?php
    // syntax: crawler:buildQueue [-d|--depth [DEPTH]] [-m|--mode [MODE]] [--number [NUMBER]] [--] <page> <conf>
    exec( '/usr/bin/php73 ' . $syspath . '/typo3/sysext/core/bin/typo3 crawler:buildQueue --depth 5 --mode exec 1 confname > /dev/null' );

    Außerdem unbedingt Cache leeren und PHP Cache leeren, wenn man die index_ Tabellen komplett geleert hat.

    =================

    Wie man aus der Indexierung PDF Dateien und JPGs rausnehmen kann:

    (page.)config{
    no_cache = 0
    index_enable = 1
    index_metatags = 0
    index_externals = 0
    }


  • 1
  • PeterWadson PeterWads...
    Padawan
    0 x
    49 Beiträge
    0 Hilfreiche Beiträge
    30. 06. 2020, 11:35

    Okay ich konnte es schon selber beantworten.
    Man sollte sich einfach mal die Fehler Ausgabe angucken, da gibt es manchmal Vorschläge:

    <?php
    // syntax: crawler:buildQueue [-d|--depth [DEPTH]] [-m|--mode [MODE]] [--number [NUMBER]] [--] <page> <conf>
    exec( '/usr/bin/php73 ' . $syspath . '/typo3/sysext/core/bin/typo3 crawler:buildQueue --depth 5 --mode exec 1 confname > /dev/null' );

    Außerdem unbedingt Cache leeren und PHP Cache leeren, wenn man die index_ Tabellen komplett geleert hat.

    =================

    Wie man aus der Indexierung PDF Dateien und JPGs rausnehmen kann:

    (page.)config{
    no_cache = 0
    index_enable = 1
    index_metatags = 0
    index_externals = 0
    }

  • 1