Einzelnen Beitrag anzeigen

Benutzerbild von erich.wanker
erich.wanker

Registriert seit: 31. Jan 2008
Ort: im schönen Salzburger Land
460 Beiträge
 
Delphi XE4 Professional
 
#1

PDF .. Text extrahieren

  Alt 18. Feb 2017, 14:40
Hallo Leute...
nach stundenlanger Suche bin ich leider immer noch nicht sicher, was ich verwenden kann und soll ...

Problemstellung:
Man kann in meiner Software PDF´s hinterlegen .. Jetzt suche ich einen günstigen Weg, wie ich an den Text der PDF´s gelange...


Ich hab 2 verschiedene PDF-Files
  • "normaler Text" im PDF eingebettet ...
  • Text als Bild -> benötigt also OCR ...

Ich bräuchte eine Art Batch-Stapelverarbeitung - die mir aus automatisch aus den 2 möglichen PDF-Typen ein TEXT-File generiert..

Pseudocode: extrahiere("c:\mein.pdf","C:\das_textfile.txt");


kostenpflichtige Online Service möchte ich wenn möglich nicht verwenden ...
Genausowenig wie "Adobe Acrobat Pro"

Hat jemand einen Rat?

Vielen Dank
Erich
Erich Wanker - for life:=1971 to lebensende do begin ..
O
/H\
/ \
  Mit Zitat antworten Zitat