7 Februar 2013 11:10

Sinnlose Google-Indizierung

Vor einigen Wochen ist mir bei Änderungen an meiner Blog-Software BetaBlog ein schwerwiegender Fehler unterlaufen. Ich hatte das Archiv auf die einzelnen Jahre aufgeteilt, um es etwas übersichtlicher zu machen. Zum Wechseln der Jahre habe ich einen Zeitstrahl hinzugefügt.

Das Problem war nun, dass ich vergessen hatte, bei Jahren ohne einen Beitrag einen verständlichen Fehler zurückzugeben. Sinnvoll in dem Sinne, dass es auch von Suchmaschinen verstanden wird.

Es gab zwar eine Meldung "Keine Beiträge gefunden", aber zusammen mit einem 200er HTTP-Statuscode. Einen kleinen Ausschnitt der Folgen kann man im folgenden Screenshot sehen:

Den Fehler habe ich bereits nach wenigen Tagen entdeckt und behoben. Jetzt wird ein 404 zurückgegeben. Dennoch wird es einige Zeit dauern, bis die Einträge aus den Suchmaschinen wieder verschwunden sind.

Update 29.03.2012

Seit heute sind die Einträge aus Google raus! Der Cache und die Seitenvorschau funktionierten ja von Anfang an nicht (wird wohl jedes Mal überprüft, ob die Seite ein 404 zurück gibt), aber dennoch waren die Einträge im Index. Nun sind sie endlich raus, scheint also, als wenn sie knapp zwei Monate drin bleiben.

Update 31.03.2012

Seltsam. Seit heute sind die Seiten wieder im Index. Außerdem wird die Cache-Version angezeigt (aber immer noch keine Vorschau).

Kommentare

Unknown, 07.02.2013 20:06
Das Problem ist wahrscheinlich eher deine Blog-Engine, die auch zukünftige Jahre bereits als Link generiert und dann von Suchmaschinen ausgewertet wird. http://www.sammyshp.de/betablo...chive/4000
SammysHP, 08.02.2013 17:30
Jain. Es kann genauso davor oder dazwischen Jahre ohne Beiträge geben. Das Prinzip des Zeitstrahls hat da ja keine Grenzen.

Das Problem war einfach, dass mein System eine ausschließlich für Menschen verständliche Fehlermeldung ausgeben hat. Die Suchmaschine konnte daher nicht wissen, dass sie die Seite nicht indizieren soll. Jetzt wird ein 404 zurückgegeben, wodurch die Suchmaschine weiß, dass es auf der Seite nichts gibt. Andere Links werden aber weiterhin verfolgt, wodurch natürlich auch unendlich viele Jahre durchsucht werden (da müsste man nochmal genauer schauen, inwiefern es sinnvoll ist, das zu begrenzen - im Moment dürfte es die Indizierung und das Ranking negativ beeinflussen). Wenn ich wieder gesund bin, werde ich mir das nochmal anschauen (hab schon eine Liste diverser Dinge, die ich noch optimieren möchte).

PS: Wenn man keinen Namen angibt, wird der Beitrag automatisch als "Anonym" veröffentlicht.
Unknown, 09.02.2013 14:42
Es ging eher darum, dass im "Archiv" noch keine Beiträge aus dem Jahr 4000 existieren können und der Zeitstrahl bei "Jetzt" enden muss.

PS: Lass mir doch meinen Spaß mit dem Namen ;-)
Powered by BetaBlog
Login | RSS Beiträge RSS Kommentare Impressum