Google will seinen Index an Webseiten weiter ausbauen, und zwar um solche Seiten, die versteckt hinter Formularen liegen. Wenn der Suchmaschinen-Robot namens GoogleBot auf hochwertigen Webseiten Formulare entdeckt, versucht er, an dahinter liegende Informationen zu gelangen. Es ist nicht neu, dass der Google-Crawler JavaScript und Flash-Inhalte nach Links zu anderen Webseiten durchsucht. Durch diese Technik sollen verborgene Inhalte ans Licht gebracht werden. Der nächste Schritt sind Formulare. Findet der GoogleBot Text-Eingabefelder so füllt er diese mit Begriffen, die
er auf der Webseite ausfindig macht. Er führt die Anfrage aus um an mögliche Folgeseiten zu gelangen.
Der Crawler beherrscht auch Menüs, Checkboxen und Radio-Buttons, die in den Vorgang miteinfließen. Werden Seiten gefunden, die für Google interessant zu sein scheinen, werden sie in den Index aufgenommen.
Von der Indexierung ausgeschlossen sind Inhalte hinter Formularen die mit einem Passwortfeld oder Daten wie User-IDs ausgestattet sind, so Google. Den Google-Zugriff auf einzelne Seiten kann der Webworker auch mit der Datei Robots.txt untersagen.
zurück zur Übersicht | Szene.News eintragen
Kommentare
Noch keine Kommentare vorhanden.
Kommentar anfügen