Registriert seit: 28. Feb 2009
78 Beiträge
|
AW: PDF-Doks auf doppelte Seiten vergleichen
13. Jun 2015, 11:19
Hallo Harry,
ok, darauf hätte man natürlich selbst kommen können. Da die einzelnen Seiten sehr wahrscheinlich eine gemeinsame Quelle haben (also alles mal aus einem einzigen Scan stammte und dann dateispezifisch Seiten kombiniert wurden), müsste das mit dem Rendern/Fingerprint hinhauen.
Hast Du zufällig auch einen Tipp zu dem Problem PDF->RTF-Problem?
Edit: Die Alternative, erst alles in TIFF und dann zurück OCR-Erkennung geht zwar, aber die OCR-Erkennungsqualität ist um Meilen schlechter als die bereits in den PDF-Quelldateien vorliegende...
Danke!
Schöne Grüße,
der Frieder
Geändert von frieder2008 (13. Jun 2015 um 11:33 Uhr)
|