28. 05. 2018, 13:39

Im 'Crawler'-Lauf wird die Tabelle 'tx_crawler_queue' gefüllt.
Ein Beispieleintrag in der Spalte 'parameters' lautet
[code]a:4:{s:3:"url";s:37:"http://kk-lrasw-david/index.php?id=53";s:16:"procInstructions";a:1:{i:0;s:24:"tx_indexedsearch_reindex";}s:15:"procInstrParams";a:0:{}s:15:"rootTemplatePid";i:1;}
[/code]
Die angegebene URL kann ich im Browser aufrufen.

Dann führe ich ein 'Crawler Run' aus.
Dies füllt in der Tabelle 'tx_crawler_queue' ua. die Spalte 'result_data'.
Hier bekomme ich bei jedem Eintrag ein 404.
Beispieleintrag:
[code]a:3:{s:7:"request";s:154:"GET /index.php?id=53 HTTP/1.0
Host: kk-lrasw-david
Connection: close
X-T3crawler: 24193:1fb6750e328f7b174df8ed5234e25157
User-Agent: TYPO3 crawler

";s:7:"headers";s:166:"HTTP/1.1 404 Not FoundDate: Mon, 28 May 2018 11:31:24 GMTServer: Apache/2.4.18 (Ubuntu)Content-Length: 287Connection: closeContent-Type: text/html; charset=iso-8859-1";s:7:"content";s:287:"<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html><head>
<title>404 Not Found</title>
</head><body>
<h1>Not Found</h1>
<p>The requested URL /index.php was not found on this server.</p>
<hr>
<address>Apache/2.4.18 (Ubuntu) Server at kk-lrasw-david Port 80</address>
</body></html>
";}
[/code]

Ich habe mal die entsprechenden Stellen im Plugin debuggt. Ich bekomme für jeden Eintrag in der CrawlerController::getHttpResponseFromStream diesen Fehler.

Ich habe es getestet mit v8.7.13 und v8.7.15.
Ich kann auch mit Sicherheit sagen, dass es anfang letzter Woche noch funktioniert hat.

Hat jemand eine Idee?