
Beschreibung
Mit diesem Script kann man WebPages komplett indexieren und diesen
Index dann per WebFormular von seinen Besuchern durchsuchen lassen.
Durch die Hintergrundindexierung der WebSeiten kann eine fast beliebig
grosse Anzahl von Einzelseiten durchsucht werden. Tests mit 5000 Seiten
und mehr waren kein Problem.
Bei der Indexierung der WebPage wird
für jedes vorkommende Wort eine eigene Datei angelegt und darin die
URLs gespeichert, in denen dieses Wort vorkommt. So wird bei einer
Suche direkt die Datei des gesuchten Wortes geöffnet und die URLs ausgegeben.
Die Performance ist somit sehr hoch und kann kaum noch verbessert werden. Der
Nachteil dieser Methode ist allerdings, dass nicht nach Wortteilen gesucht
werden kann, sondern nun nach ganzen Worten.
Die Indexierung der WebPage muss per Kommandozeile (Telnet oder DOS-Fenster)
gestartet werden, die Dauer kann bei vielen 1000 Seiten einige Stunden
dauern. Beim Start über das Web per Browser ist ein Timeout sehr wahrscheinlich.
Zudem ist ausreichend Platz erforderlich, allein für diese Seite werden
in ca. 4 Minuten über 7500 Dateien angelegt und insgesamt 5MB Plattenplatz belegt.
Nutzungsbedingungen
Das Script kann frei genutzt werden, solange die Copyright-Hinweise bei der
Ausgabe und im Script vorhanden bleiben. Um das Script ohne Copyright-Hinweis
nutzen zu können, ist eine Lizenz zu erwerben - der Preis einer Lizenz
beläuft sich auf 30,- EUR inkl. MwSt. - die Bestellung erfolgt einfach per
Mail mit komplette Anschrift, worauf eine Rechnung per Post zugesandt wird.
Download
Der Download im ZIP-Format enthält alle relevanten Scripts und Dateien und
eine Anleitung für die Installation des Scripts und Anpassung der Templates.

Download WebIndex+

Für die Sonderzeichenumwandlung wird das Modul HTML::Entities und für die rekursive
Suche im Verzeichnisbaum das Modul File::Find verwendet. Beide Module sollten auf
jedem Web-Server standardmässig installiert sein sollte.
Weitere relevante Links
WebSearch+-Script für die Live-Suche auf WebPages
Cron: Zeitgesteuerte Ausführung von Programmen und Scripts
Frage zum Script, dann ab ins Forum
Erweiterung der Apache WebServer-Konfiguration durch .htaccess (Passwortschutz)
Was tun, wenn ein Script nicht läuft?
Zugriffsrechte unter Unix im Detail
CGI-Service: Installationsservice für alle perlunity-Scripts
Kommentare zu diesem Script/Snipplet

22.04.2002 - 17:56 | Ingo Siemon | mail@spaceart.info
Dank der netten Hilfe von Markus Wolf habe ich dieses wirklich tolle Script nun zum Laufen... 
Alle Kommentare anzeigen - Kommentar hinzufügen

|