AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Office 2003 OCR Engine benutzen

Ein Thema von Brainshock · begonnen am 20. Jun 2006 · letzter Beitrag vom 20. Nov 2007
Antwort Antwort
Brainshock

Registriert seit: 26. Nov 2004
Ort: 37345
214 Beiträge
 
Delphi 7 Professional
 
#1

Office 2003 OCR Engine benutzen

  Alt 20. Jun 2006, 09:52
Hallo,

hat schon jemand das hier in Delphi umgesetzt und zum Laufen gebracht:

Link: Document Processing Part I: OCR with Microsoft® Office

Gruß,
Matthias
Matthias
  Mit Zitat antworten Zitat
backdraft

Registriert seit: 19. Apr 2005
Ort: Hückeswagen
335 Beiträge
 
Delphi 11 Alexandria
 
#2

Re: Office 2003 OCR Engine benutzen

  Alt 26. Jun 2006, 16:34
ne, aber ich fänds hätte auch interresse daran...
Oliver
  Mit Zitat antworten Zitat
backdraft

Registriert seit: 19. Apr 2005
Ort: Hückeswagen
335 Beiträge
 
Delphi 11 Alexandria
 
#3

Re: Office 2003 OCR Engine benutzen

  Alt 28. Jun 2006, 16:43
also ich habe alles fertig,

wenn interesse besteht, kann ich es ins forum posten.
Oliver
  Mit Zitat antworten Zitat
Go2EITS

Registriert seit: 25. Jun 2006
519 Beiträge
 
Delphi 7 Personal
 
#4

Re: Office 2003 OCR Engine benutzen

  Alt 28. Jun 2006, 16:55
Klasse!
Lass doch bitte Deine Arbeit mal sehen!
  Mit Zitat antworten Zitat
Benutzerbild von semo
semo

Registriert seit: 24. Apr 2004
755 Beiträge
 
Delphi 2010 Professional
 
#5

Re: Office 2003 OCR Engine benutzen

  Alt 28. Jun 2006, 18:11
Zitat:
The page you requested cannot be found.
richtige url: http://www.codeproject.com/csharp/modi.asp

hat denn schon mal jemand mit gearbeitet bzw erste ferahrungen gesammelt?
bin da nämlich brennend dran interessiert, da wir überlegen die scansoft oder abby SDK zu erwerben....
  Mit Zitat antworten Zitat
backdraft

Registriert seit: 19. Apr 2005
Ort: Hückeswagen
335 Beiträge
 
Delphi 11 Alexandria
 
#6

Re: Office 2003 OCR Engine benutzen

  Alt 29. Jun 2006, 21:40
also ich habe ein OCR Erkennung relativ weit mittlerweile fertig. Problematisch ist bei mir zur Zeit das Scannen von Teilausschnitten des Bildes.

Wichtig zu wissen, bevor ich euch die Sourcen poste ist, welche Delphi Version ihr benutzt.

Ich habe mit Delphi 7 angefangen. Dabei werden viele Funktionen der OCR Komponente nicht unterstützt.
Als ich auf Delphi 2006 umgestiegen bin, klappte alles wunderbar.

Ich kann eine Anleitung machen und ein kleines Demo Prog.
Was ich daraus auch wieder brauche ist ein Textdokument, welches genau die Spalten wieder erzeugt.
Ich denke, wenn ich diesen Source mitposte, könnte man gemeinsam das ganze realisieren.

Bei Interesse, dass ich die Delphi 2006 Sourcen postet, dann mache ich über das Wocheende was fertig.
Das Produkt was ich zur Zeit entwickele ist mit Datenbank anbindung, etc, also denke ich nicht so interessant.

Das ganze funktioniert eigentlich wunderbar mit dieser quasi kostenlosen OCR Erkennung. Wir haben uns zuerst überlegt die Schnittstelle von KADMOS (ca 1000 Euro pro Runtime) einzusetzen, wobei die MDIL um einiges besser funktioniert.

Grüße Oliver
Oliver
  Mit Zitat antworten Zitat
Benutzerbild von semo
semo

Registriert seit: 24. Apr 2004
755 Beiträge
 
Delphi 2010 Professional
 
#7

Re: Office 2003 OCR Engine benutzen

  Alt 29. Jun 2006, 21:48
klingt echt vielversprechend,
vor allem wenn man die preise für die abby und scansoft engine mit ca 5000 euro + lizenzgebühren bedenkt
  Mit Zitat antworten Zitat
backdraft

Registriert seit: 19. Apr 2005
Ort: Hückeswagen
335 Beiträge
 
Delphi 11 Alexandria
 
#8

Re: Office 2003 OCR Engine benutzen

  Alt 29. Jun 2006, 22:02
Ok, wenn die Antwort so schnell kommt.
Ich hab das Programm mal eben gemacht.

Ziel der OCR ist bei mir, das ich ein Dokument raus bekomme, welches in Zeilen und Spalten wieder annähernd mit dem Original übereinstimmt. Dabei ist es egal, wie viele Leerzeichen zwischen den Spalten sind. Hauptsache, die Spalten stehen nachher wieder untereinander.

Da dass Ergebnis vom OCR Scan nur einen unformatierten Text liefert konnte ich diesen schonmal nicht nehmen, sondern musste jedes Wort einzeln neu auf meiner Matrix einsetzen.
Dazu habe ich erstmal die Pixel Positionen interpoliert. Ein "E" fängt anders an als ein "M" und kann so einen Verschub der X Position zur folge haben.

Das ganze Prog ist noch ziemlich Buggy und das Ergebnis eines Tages.

------------------------------------------------------------------------------

Um die nötigen Änderungen in Delphi 2006 vorzunehmen müssen folgende Schritte vorgenommen werden:
Komponenten -> Komponente importieren -> Active X -> Microsoft Document Image Library
Danach die MODI_TLB.pas in irgendein Package zufügen und schon stehen unter Active X die Sachen zur verfügung (so die Theorie)
Leider sind in der MODI_TLB auf einmal neue Definitionen von TImage, TImageProperties, etc.
Da das Package dann nicht kompiliert werden kann, habe ich die Komponenten in TMODIImage usw umbenannt.
Den Quelltext habe ich mal mit in den Source Ordner unter MODI gepackt, damit bei allen die hier helfen die Objekte gleich heissen.

So jetzt könnt ihr auch schon die Source Datei kompilieren.
Wichtig, das ganze ist für Delphi 2006. Ob es in Delphi 2005 geht weiss ich nicht. Delphi 7 geht halt nicht ordnungsgemäß.


Für Fragen schreibt mich direkt an unter oliver@oliver-ickler.de

Achso, fast vergessen. Die Optische Anzeige des Scans habe ich nur mit Delphi 7 hinbekommen. Vielleicht klappt es ja bei einem von euch.
Angehängte Dateien
Dateityp: rar modi_test_209.rar (38,4 KB, 155x aufgerufen)
Oliver
  Mit Zitat antworten Zitat
Go2EITS

Registriert seit: 25. Jun 2006
519 Beiträge
 
Delphi 7 Personal
 
#9

Re: Office 2003 OCR Engine benutzen

  Alt 30. Jun 2006, 05:47
@backdraft
Super, dass Du an dem OCR Projekt weiter arbeitest.
Leider habe ich kein D2006. Ich lade es mir gerade bei Borland runter.
(ISDN, das kann dauern...)
Kannst Du vielleicht eine fertig compilierte Version beifügen?
Ich bin gespannt, wie es weiter geht.

Go2EITS
  Mit Zitat antworten Zitat
PeterRettig

Registriert seit: 4. Jun 2003
Ort: Schleiz
65 Beiträge
 
Delphi 4 Client/Server
 
#10

Re: Office 2003 OCR Engine benutzen

  Alt 20. Nov 2007, 12:33
Hallo,

ich habe das auch mal versucht, habe aber ein kleines Problem
beim Aufruf des Befehles OCR.

Document1.OCR(miLANG_SYSDEFAULT,TRUE,TRUE);

Sobald ich einen der beiden letzten Parameter auf
true setze (automatisch drehen, automatisch glätten) bekomme
ich eine Exception "File is empty or corrupted".
Setze ich beide auf false funktioniert es, aber die
Erkennungsergebnisse lassen dann natürlich zu wünschen übrig.

Seltsamerweise kann ich das Programm (MS Document Imaging) problemlos
starten und dort auch das gleiche Dokument mit automatischem
Drehen und automatischem Glätten erkennen lassen.

Hat jemand eine Idee woran das liegen könnte?

Delphi 7
MS Office 2003 mit SP 3

Gruß, Peter.
Warum kann man Atommüll nicht auf dem Mars lagern?
Mars bringt verbrauchte Energie sofort zurück!
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 23:11 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz