AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren

PDF Text lesen

Ein Thema von michael.cohrs · begonnen am 23. Apr 2014 · letzter Beitrag vom 24. Apr 2014
Antwort Antwort
michael.cohrs

Registriert seit: 11. Nov 2005
Ort: Hamburg
130 Beiträge
 
#1

AW: PDF Text lesen

  Alt 24. Apr 2014, 05:11
Guten Morgen,

ich kann in unserer Firma voraussetzen das der Adobe Reader auf jeder Maschine installiert ist, es geht um ein internes Firmenproblem. Gibt es denn so gar keine Möglichkeit den Text aus einer PDF zu lesen?

viele Grüße

Michael
Michael Cohrs
  Mit Zitat antworten Zitat
mkinzler
(Moderator)

Registriert seit: 9. Dez 2005
Ort: Heilbronn
39.874 Beiträge
 
Delphi 11 Alexandria
 
#2

AW: PDF Text lesen

  Alt 24. Apr 2014, 06:33
PDF ist ja nur ein Containerformat. Viele beinhalten statt Text aber nur Bilder der Seiten ( wenn eingescannt). In diesem Fall existiert dann kein Text, den Du so leicht auselesen kannst. Man müsste in diesem Fall einen Textindex (per OCR) erzeugen lassen (z.B. mit Vollversion von Adobe).
Diesen könnte man dann über den IFILTER auslesen. Dieser ist aber m.W. nicht mehr Teil des Readers.
Markus Kinzler
  Mit Zitat antworten Zitat
arnof

Registriert seit: 25. Apr 2013
1.261 Beiträge
 
Delphi 10.1 Berlin Enterprise
 
#3

AW: PDF Text lesen

  Alt 24. Apr 2014, 08:55
PDF ist ja nur ein Containerformat. Viele beinhalten statt Text aber nur Bilder der Seiten ( wenn eingescannt). In diesem Fall existiert dann kein Text, den Du so leicht auselesen kannst. Man müsste in diesem Fall einen Textindex (per OCR) erzeugen lassen (z.B. mit Vollversion von Adobe).
Diesen könnte man dann über den IFILTER auslesen. Dieser ist aber m.W. nicht mehr Teil des Readers.
Wenn es von einer OCR kommt oder manuelle erzeugt wurde, dann sollte es möglich sein das dort ein PDF (A-Format) ist, da sind die Texte für DMS Systeme lesbar drin.

Ich hätte mal gesagt schau doch mal in die Datei
  Mit Zitat antworten Zitat
Sigi55

Registriert seit: 3. Jan 2010
36 Beiträge
 
Delphi 5 Professional
 
#4

AW: PDF Text lesen

  Alt 24. Apr 2014, 10:31
Hallo und Moin erstmal,

der Code vom swissdelphicenter löppelt nur mit installiertem Arcobat, der Reader reicht da nicht. Ich nutze die pdftext.dll von
http://www.pdf-analyzer.com/,
dort gibt's auch ne Demoversion komplett mit Delphi-Sourcen.

Gruß

Sigi
  Mit Zitat antworten Zitat
Perlsau
(Gast)

n/a Beiträge
 
#5

AW: PDF Text lesen

  Alt 24. Apr 2014, 06:54
Gibt es denn so gar keine Möglichkeit den Text aus einer PDF zu lesen?
Vermutlich kann man das Kommandozeilen-Tool pdftotext via Delphi steuern und so aus PDF-Dateien, die garantiert Text enthalten, eine Textdatei generieren. Die Syntax meiner alten Version ist ganz einfach: pdftotext PdfDatei.pdf Textdatei.txt. Diverse parameter können zum Steuern wie z.B. der Angabe der ersten zu extrahierenden Seite oder dem Unterdrücken von Fehlermeldungen usw. eingesetzt werden. Funktioniert wie gesagt nur mit reinen Text-PDFs. Sobald Grafik oder undefinierbare Codes im PDF vorkommen, streikt das Tool.
  Mit Zitat antworten Zitat
Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.222 Beiträge
 
Delphi 10.4 Sydney
 
#6

AW: PDF Text lesen

  Alt 24. Apr 2014, 08:21
Gibt es denn so gar keine Möglichkeit den Text aus einer PDF zu lesen?
Ich habe doch eine Aufgeschrieben. Ist das wohl keine Möglichkeit?

Mit dem Adobe Reader gibt es (falls du dich darauf bezogen hast) keine Mögichkeit.
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat
Antwort Antwort

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 21:53 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz