Registriert seit: 6. Jun 2005
74 Beiträge
Delphi 2007 Architect
|
Brainstorm: Text aus PDF Dokument lesen
24. Jun 2009, 20:33
Hallo,
ich habe massenhaft PDFs, die alle gleich aufgebaut sind. Ich will diese zum Teil auslesen und weiterverabeiten. Mich interessiert dabei nur der Text von ein paar Seiten. Das Problem ist (wie auf dem Bild im Anhang einsehbar), dass einige Informationen in Spalten festgelegt sind - und die sind nicht statisch. Hier versagen leider alle externe Programme pdf2txt, die ich bis jetzt getestet habe. Ich weiss ab einer gewissen Zeile nicht mehr, welche Information zu welcher Zeile gehört.
Wie komme ich an die rechte Spalte und weiß gleichzeitig, welche linke Spailte dazugehört?
Vielen Dank für jegliche Art von Hilfe
Henning
|