Google indiziert sonderbare url Parameter

  • anderlk anderlk
    R2-D2
    0 x
    112 Beiträge
    1 Hilfreiche Beiträge
    16. 11. 2011, 09:53

    Hallo miteinander,

    habe in letzter Zeit festgestellt, dass Google einige sonderbare url Parameter bei unserem TYPO3 System indiziert hat.

    1. index.php?option=com_content&id=213&Itmid=161

    Könnt Ihr mir vielleicht weiterhelfen, woher diese Parameter kommen könnten? Kommt das vom Core, oder einer Extension? Habt Ihr dieses Phänomen bei Euch auch schon mal festgestellt?

    Danke, Anderl


  • 1
  • 0 x
    3243 Beiträge
    151 Hilfreiche Beiträge
    16. 11. 2011, 10:30

    Hallo.

    Sieht definitiv nicht nach TYPO3-Core aus. Eine Suche nach "option=com_content" liefert auf Platz 1+2 Treffer bei Joomla-Foren/-Portalen. Kann es sein, dass die Seite früher mal auf Joomla lief und jetzt noch alte URL indiziert sind oder alte URLs von extern verlinkt sind?

    Über ein passendes Handling bzw. Rewrites sollte sich das abstellen lassen, und die Crwaler auf den richtigen Weg geführt werden können.

    Viele Grüße
    Julian

  • anderlk anderlk
    R2-D2
    0 x
    112 Beiträge
    1 Hilfreiche Beiträge
    16. 11. 2011, 13:54

    Hallo Julian,

    das mit Joomla! hab ich auch schon rausgefunden. Die Seite ist noch nie auf Joomla gelaufen.

    Aber die Parameter muss es doch in TYPO3 geben, weil sonst müsste doch eigentlich beim Aufruf die Fehlerseite kommen.

    Gruß Anderl

  • 0 x
    3243 Beiträge
    151 Hilfreiche Beiträge
    16. 11. 2011, 14:00

    Die Seite muss es nicht geben bzw. nicht TYPO3-intern verlinkt sein. Und solange (aus Deinem Beispiel-Link) in TYPO3 eine Seite mit UID 213 existiert, bekommst Du auch eine (im Sinne von HTTP) korrekte Antwort vom Server/TYPO3. Du bekommst die Seite 213 - die weiteren Parameter werden dann ignoriert,w eil nichts innerhalb des TYPO3 sie auswertet.

  • anderlk anderlk
    R2-D2
    0 x
    112 Beiträge
    1 Hilfreiche Beiträge
    16. 11. 2011, 20:10

    Hallo Julian,

    stimmt. Dann werde ich mal versuchen, den Parameter durch die robots.txt von der Suche auszuschließen.

    Danke

  • 1