perlunity.de - PERL | JAVASCRIPT | PHP | MySQL | APACHE



#!/COMMUNITY

Members: 5598
davon online: 1
weitere User: 1
Click for quality!



21.04.2018 / 11:37

Community-Member werden   |   Paßwort vergessen   |   OnlineMonitor (1) Wer ist online ... OnlineMonitor starten !
     

 

Home


PERLscripts


PHPscripts


JAVAscripts


Hilfreiches


Links2www


Newscenter


Community


Interna




Download  »  WebIndex+


Beschreibung

Mit diesem Script kann man WebPages komplett indexieren und diesen Index dann per WebFormular von seinen Besuchern durchsuchen lassen. Durch die Hintergrundindexierung der WebSeiten kann eine fast beliebig grosse Anzahl von Einzelseiten durchsucht werden. Tests mit 5000 Seiten und mehr waren kein Problem.

Bei der Indexierung der WebPage wird für jedes vorkommende Wort eine eigene Datei angelegt und darin die URLs gespeichert, in denen dieses Wort vorkommt. So wird bei einer Suche direkt die Datei des gesuchten Wortes geöffnet und die URLs ausgegeben. Die Performance ist somit sehr hoch und kann kaum noch verbessert werden. Der Nachteil dieser Methode ist allerdings, dass nicht nach Wortteilen gesucht werden kann, sondern nun nach ganzen Worten.

Die Indexierung der WebPage muss per Kommandozeile (Telnet oder DOS-Fenster) gestartet werden, die Dauer kann bei vielen 1000 Seiten einige Stunden dauern. Beim Start über das Web per Browser ist ein Timeout sehr wahrscheinlich. Zudem ist ausreichend Platz erforderlich, allein für diese Seite werden in ca. 4 Minuten über 7500 Dateien angelegt und insgesamt 5MB Plattenplatz belegt.


Nutzungsbedingungen

Das Script kann frei genutzt werden, solange die Copyright-Hinweise bei der Ausgabe und im Script vorhanden bleiben. Um das Script ohne Copyright-Hinweis nutzen zu können, ist eine Lizenz zu erwerben - der Preis einer Lizenz beläuft sich auf 30,- EUR inkl. MwSt. - die Bestellung erfolgt einfach per Mail mit komplette Anschrift, worauf eine Rechnung per Post zugesandt wird.


Download

Der Download im ZIP-Format enthält alle relevanten Scripts und Dateien und eine Anleitung für die Installation des Scripts und Anpassung der Templates.
-
Download  Download WebIndex+
-
Für die Sonderzeichenumwandlung wird das Modul HTML::Entities und für die rekursive Suche im Verzeichnisbaum das Modul File::Find verwendet. Beide Module sollten auf jedem Web-Server standardmässig installiert sein sollte.



Weitere relevante Links

  • WebSearch+-Script für die Live-Suche auf WebPages
  • Cron: Zeitgesteuerte Ausführung von Programmen und Scripts
  • Frage zum Script, dann ab ins Forum
  • Erweiterung der Apache WebServer-Konfiguration durch .htaccess (Passwortschutz)
  • Was tun, wenn ein Script nicht läuft?
  • Zugriffsrechte unter Unix im Detail
  • CGI-Service: Installationsservice für alle perlunity-Scripts



    Kommentare zu diesem Script/Snipplet

    1 Kommentar(e) vorhanden

    22.04.2002 - 17:56 | Ingo Siemon | mail@spaceart.info
    Dank der netten Hilfe von Markus Wolf habe ich dieses wirklich tolle Script nun zum Laufen... Kommentar anzeigen

    Alle Kommentare anzeigen - Kommentar hinzufügen


    -






  • -
    -