Registriert seit: 27. Jun 2004
450 Beiträge
|
Simples OCR Programm erstellen (Texterkennung)
24. Apr 2005, 17:58
Hallo,
ich möchte mir ein simples Texterkennungsprogramm selbst bauen,
vielmehr sollen lediglich einzelne Buchstaben oder Zahlen erkannt werden.
Bisher habe ich mein Programm schon soweit dazu bewegen können ein Bild
entsprechend zu konvertieren (Graustufen) und relevante Bereiche (Buchstaben)
auszuschneiden. Jetzt fehlt mir allerdings ein vernünftiger Ansatz
um die OCR Implementation umzusetzen.
Meine Überlegung war nun eine auf Textdateien basierende Datenbank anzulegen
die ich dann über TStringList laden und auswerten kann. Wobei jede Textdatei
für einen Buchstaben oder aber eine Zahl steht. Jede Textdatei enthält
60 Zeilen mit jeweils 60 Zeichen (Nullen und Einsen) um eine Grafik (Buchstaben)
von 60x60 Pixeln darzustellen.
Um eine Texterkennung durchzuführen würde ich die vorhandenen Stringlisten
aus der Datenbank mit der Stringliste der Grafik vergleichen und
die Anzahl der "Treffer" ermitteln. Vergleichen würde ich hier
allerdings die Datenbank mit der Grafik und nicht umgekehrt.
Was haltet Ihr davon, würdet Ihre eine anderen Ansatz wählen?
Mfg
|