html einlesen und durchsuchen
|
Seitenanfang |
| Hallo, ich habe bereits im Netz gesucht, zu meinem Problem aber noch keine Lsg gefunden. Ich bin noch newbie, also verzeiht evt. "dumme" Fragen! Ich möchte ein einfaches Perl-Skript schreiben, welches eine html-Seite im Netz einliest und anschließend benötigte Daten daraus parst. Die Datei sieht etwa so aus: <td width=44% align=left><strong> Temperatur</strong> (°C) </td> <td width=50>-6.2</td> <td vAlign=center align=left height=24> <B>Taupunkt</B> (°C) </td> <td width=50>-9.2</td> und ich möchte dann z.B. die Werte für Temperatur(-6.2) oder Taupunkt(-9.2) auslesen. Gruß CommSter
Datum: 09.01.2006-12:08

|
re: html einlesen und durchsuchen
|
Seitenanfang |
| Hi, das Abrufen und Einlesen der HTML Datei realisierst am einfachsten über das LWP Modul. Frequentiere mal die Perldokumentation.
perldoc LWP perldoc LWP::UserAgent
Der Rest ergibt sich dann von selbst. Dann noch einige Links, die ich Beginnern gerne mit auf den Weg gebe. (gibt schon einen Thread zum Thema ;-) http://www.perlunity.de/sid19520233126133/cgi-bin/forum/forum_thread.cgi?tid=19011&mid=37461&fid=8&pn= -uw
Datum: 09.01.2006-13:59

|
re: html einlesen und durchsuchen
|
Seitenanfang |
| Danke für die schnelle Antwort das parsen ist inzwischen auch schon fertig, nur halt mit einer html-Datei auf der Platte. Schaue mir das mit LWP mal an und hoffe, ich komme weiter. Bis dann CommSter
Datum: 09.01.2006-14:37

|
re: html einlesen und durchsuchen
|
Seitenanfang |
| Muss ich beim benutzen von LWP besondere Rechte haben? Habe: require LWP::UserAgent; require HTTP::Request; my $url="http://www.bla.de/bla.html"; my $ua=new LWP::UserAgent; my $request=new HTTP::Request 'GET', $url; my $response=$ua->request($request); if ($response->is_success) { print $response->content(); } und auch use LWP::Simple; my $url = "http://www.bla.de/bla.html"; unless (defined (my $content = get $url)) { die "could not get $url\n"; } ausprobiert. Es kommen keine Fehler-Meldungen, jedoch kehrt das Programm nicht zur Kommandozeile zurück und es wird auch nichts ausgegeben.
Datum: 09.01.2006-15:31

|
re: html einlesen und durchsuchen
|
Seitenanfang |
| Hallo, hat sich erledigt. Hab' vergessen den Proxy mit anzugeben. Klappt nun einwandfrei. Danke CommSter
Datum: 10.01.2006-10:02

|