perlunity.de - PERL | JAVASCRIPT | PHP | MySQL | APACHE



#!/COMMUNITY

Members: 5374
davon online: 1
weitere User: 27
Click for quality!




11.02.2012 / 08:24

Community-Member werden   |   Paßwort vergessen   |   OnlineMonitor (1) Wer ist online ... OnlineMonitor starten !
     

 

Home


PERLscripts


PHPscripts


JAVAscripts


Hilfreiches


Links2www


Newscenter


Community


Interna




Community  »  Perl: Allgemeines Forum zur Themenübersicht Themensuche Themenansicht in Thread-Modus


BeitragPDF/TXT Inhalt in MySQL einlesen
Seitenanfang
Hallo Leute,

ich bin neu hier und hoffe Ihr könnt mir bei folgendem Problem weiterhelfen:

Ich habe ca. 500 PDF Dokumente die alle das gleiche Format (Layout) haben. Das sieht ungefähr so aus:

Vorname: Max
Nachname: Mustermann
Strasse: Schlossallee usw...

Die Inhalte dieser PDF´s muss ich jetzt in eine MySQL DB eingeben.
Meine Frage ist, ob ich mit Perl jetzt die Daten aus den PDF auslesen und in die DB speichern kann?
Ich habe schon ausgiebig gegoogelt aber leider immer nur Teillösungen gefunden. Da ich im coden nicht sehr versiert bin, kann ich mir nix zusammenbasteln.

Es würde mir reichen, wenn ich die PDF´s einzeln "einlese".

Zur Not kann ich die PDF´s vorher auch mit OCR in .txt verwandeln.

Ich freue mich auf eure Antworten.

Vielen Dank
Hias

Datum: 04.03.2008-09:17

Beitragre: PDF/TXT Inhalt in MySQL einlesen
Seitenanfang
Klar kannst Du das alles machen. Zum Auslesen der PDF kannst Du CAM::PDF (http://search.cpan.org/dist/CAM-PDF/) verwenden, für die Datenbankanbindung DBI (http://search.cpan.org/dist/DBI/)

Datum: 04.03.2008-13:49

Beitragre: PDF/TXT Inhalt in MySQL einlesen
Seitenanfang
Hi Renée,

danke für die Links. leider habe ich nicht genug Ahnung vom Umgang mit lib´s als das ich das bewerkstelligen könnte.

Kennst du eine einfachere Lösung für txt files?

Grüße
Hias

Datum: 04.03.2008-19:57

Beitragre: PDF/TXT Inhalt in MySQL einlesen
Seitenanfang
Einfach die genannten Module installieren (siehe http://wiki.perl-community.de/bin/view/Wissensbasis/ModuleWieInstalliereIchEinModul) und dann loslegen...

#!/usr/bin/perl
use strict;
use warnings;
use CAM::PDF;
my $pdf = '/pfad/zur/datei.pdf';
my $handler = CAM::PDF->new( $pdf );
my @pages = $handler->numPages;
for my $page ( @pages ){
print $handler->getPageText($page);
}

(ungetestet)

Datum: 05.03.2008-14:18

-






-
-