Neugierig ist der Googlebot. Fleißig. Und fast nicht aufzuhalten. Für das Index-Crawling sendet Google regelmäßig seine Spider aus, die alle wichtigen Informationen für das Ranking sammeln sollen. Jeder der eine Internetseite im world wide web betreibt, muss deshalb damit rechnen, dass er Besuch von den Maschinenrobots bekommt. Doch was tun, wenn man eine Seite gar nicht im Google Index sehen will? Dafür gibt es den Noindex Befehl.
Stoppschild für den Googlebot
Das Noindex Tag ist eine Anweisung, die prinzipiell von allen Suchmaschinen akzeptiert werden sollte. Sowohl die Google Spider als auch Bing Crawler machen grundsätzlich vor dem Noindex Hinweis halt. Webseitenbetreiber haben damit also so etwas wie ein großes Stoppschild, das sie vor ihrer Online-Seite aufstellen können. Normalerweise zieht der Suchmaschinencrawler dann unverrichteter Dinge wieder ab. Die Seiten werden nicht im Index abgespeichert. Sie tauchen dann auch nicht in Trefferlisten auf.
So sieht das Warnschild aus
Die Einfügung im Website-Code ist gar nicht schwer. Folgender Meta-Tag im <Head> Bereich genügt, um den Crawler auszuschließen:
<meta name=“robots“ content=“noindex“>
Mit dem Hinweis “robots” werden sämtliche Suchmaschinenrobots „angesprochen“. Mit dem Tag „noindex“ wird gesagt, was der robot machen soll. Nämlich nichts in diesem Fall: No Index, Nicht indexieren. Das ist so eindeutig gesagt, dass das sogar der einfältigste Spiderbot versteht.
Vorausgesetzt natürlich, dass sich der robot an diese Spielregel hält. Zu Bing ist immer wieder einmal zu lesen, dass die Anweisung „noindex“ nicht einheitlich funktioniert.
Noindex Googlebot
Falls jemand aus irgendeinem Grund nicht möchte, dass eine Seite zwar in allen anderen Search Engines erscheint, aber nicht bei Google, gibt es dafür einen eigenen Befehl. Dieser lautet:
<meta name=“googlebot“ content=“noindex“>
Dass sich Google an diese Vorgaben hält, wird ausdrücklich in den Hilfeseiten der Webmaster Tools beschrieben. Wie es andere robots damit halten, lässt sich aber nicht vorhersagen. Zumindest für die am häufigsten genutzte Suchmaschine hat der Seitenbetreiber damit aber eine Möglichkeit, um die Indexierung zu verhindern. Man kann davon also auch Gebrauch machen.
Bilder:
fotolia.com