![]() |
Office 2003 OCR Engine benutzen
Hallo,
hat schon jemand das hier in Delphi umgesetzt und zum Laufen gebracht: ![]() Gruß, Matthias |
Re: Office 2003 OCR Engine benutzen
ne, aber ich fänds hätte auch interresse daran...
|
Re: Office 2003 OCR Engine benutzen
also ich habe alles fertig,
wenn interesse besteht, kann ich es ins forum posten. |
Re: Office 2003 OCR Engine benutzen
Klasse!
Lass doch bitte Deine Arbeit mal sehen! |
Re: Office 2003 OCR Engine benutzen
Zitat:
![]() hat denn schon mal jemand mit gearbeitet bzw erste ferahrungen gesammelt? bin da nämlich brennend dran interessiert, da wir überlegen die scansoft oder abby SDK zu erwerben.... |
Re: Office 2003 OCR Engine benutzen
also ich habe ein OCR Erkennung relativ weit mittlerweile fertig. Problematisch ist bei mir zur Zeit das Scannen von Teilausschnitten des Bildes.
Wichtig zu wissen, bevor ich euch die Sourcen poste ist, welche Delphi Version ihr benutzt. Ich habe mit Delphi 7 angefangen. Dabei werden viele Funktionen der OCR Komponente nicht unterstützt. Als ich auf Delphi 2006 umgestiegen bin, klappte alles wunderbar. Ich kann eine Anleitung machen und ein kleines Demo Prog. Was ich daraus auch wieder brauche ist ein Textdokument, welches genau die Spalten wieder erzeugt. Ich denke, wenn ich diesen Source mitposte, könnte man gemeinsam das ganze realisieren. Bei Interesse, dass ich die Delphi 2006 Sourcen postet, dann mache ich über das Wocheende was fertig. Das Produkt was ich zur Zeit entwickele ist mit Datenbank anbindung, etc, also denke ich nicht so interessant. Das ganze funktioniert eigentlich wunderbar mit dieser quasi kostenlosen OCR Erkennung. Wir haben uns zuerst überlegt die Schnittstelle von KADMOS (ca 1000 Euro pro Runtime) einzusetzen, wobei die MDIL um einiges besser funktioniert. Grüße Oliver |
Re: Office 2003 OCR Engine benutzen
klingt echt vielversprechend,
vor allem wenn man die preise für die abby und scansoft engine mit ca 5000 euro + lizenzgebühren bedenkt :thumb: |
Re: Office 2003 OCR Engine benutzen
Liste der Anhänge anzeigen (Anzahl: 1)
Ok, wenn die Antwort so schnell kommt.
Ich hab das Programm mal eben gemacht. Ziel der OCR ist bei mir, das ich ein Dokument raus bekomme, welches in Zeilen und Spalten wieder annähernd mit dem Original übereinstimmt. Dabei ist es egal, wie viele Leerzeichen zwischen den Spalten sind. Hauptsache, die Spalten stehen nachher wieder untereinander. Da dass Ergebnis vom OCR Scan nur einen unformatierten Text liefert konnte ich diesen schonmal nicht nehmen, sondern musste jedes Wort einzeln neu auf meiner Matrix einsetzen. Dazu habe ich erstmal die Pixel Positionen interpoliert. Ein "E" fängt anders an als ein "M" und kann so einen Verschub der X Position zur folge haben. Das ganze Prog ist noch ziemlich Buggy und das Ergebnis eines Tages. ------------------------------------------------------------------------------ Um die nötigen Änderungen in Delphi 2006 vorzunehmen müssen folgende Schritte vorgenommen werden: Komponenten -> Komponente importieren -> Active X -> Microsoft Document Image Library Danach die MODI_TLB.pas in irgendein Package zufügen und schon stehen unter Active X die Sachen zur verfügung (so die Theorie) Leider sind in der MODI_TLB auf einmal neue Definitionen von TImage, TImageProperties, etc. Da das Package dann nicht kompiliert werden kann, habe ich die Komponenten in TMODIImage usw umbenannt. Den Quelltext habe ich mal mit in den Source Ordner unter MODI gepackt, damit bei allen die hier helfen die Objekte gleich heissen. So jetzt könnt ihr auch schon die Source Datei kompilieren. Wichtig, das ganze ist für Delphi 2006. Ob es in Delphi 2005 geht weiss ich nicht. Delphi 7 geht halt nicht ordnungsgemäß. Für Fragen schreibt mich direkt an unter oliver@oliver-ickler.de Achso, fast vergessen. Die Optische Anzeige des Scans habe ich nur mit Delphi 7 hinbekommen. Vielleicht klappt es ja bei einem von euch. |
Re: Office 2003 OCR Engine benutzen
@backdraft
Super, dass Du an dem OCR Projekt weiter arbeitest. :thumb: Leider habe ich kein D2006. Ich lade es mir gerade bei Borland runter. (ISDN, das kann dauern...) Kannst Du vielleicht eine fertig compilierte Version beifügen? Ich bin gespannt, wie es weiter geht. Go2EITS |
Re: Office 2003 OCR Engine benutzen
Hallo,
ich habe das auch mal versucht, habe aber ein kleines Problem beim Aufruf des Befehles OCR. Document1.OCR(miLANG_SYSDEFAULT,TRUE,TRUE); Sobald ich einen der beiden letzten Parameter auf true setze (automatisch drehen, automatisch glätten) bekomme ich eine Exception "File is empty or corrupted". Setze ich beide auf false funktioniert es, aber die Erkennungsergebnisse lassen dann natürlich zu wünschen übrig. Seltsamerweise kann ich das Programm (MS Document Imaging) problemlos starten und dort auch das gleiche Dokument mit automatischem Drehen und automatischem Glätten erkennen lassen. Hat jemand eine Idee woran das liegen könnte? Delphi 7 MS Office 2003 mit SP 3 Gruß, Peter. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:06 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz