Re: Simples OCR Programm erstellen (Texterkennung)
24. Apr 2005, 18:13
Ich würde vermutlich einen anderen Ansatz wählen, da dieser Binäre Vergleich zu unflexibel ist.
Wenn z.B. der Buchstabe kursiv ist, hast du auf einmal viel weniger Treffer, oder wenn er (z.B. wegen dieser Serifen) leicht versetzt ist ...
Ich würde versuchen, den Buchstaben in (Teilkreis-)Linien aufzuteilen, also Linie, Halbkreis, Kreis ... und dann über die Ähnlichkeit dieser Merkmale gehen. Wenn der Buchstabe plötzlich Kursiv ist, hast du "nur" eine Änderung der Neigung der Linien, und wenn er versetzt ist, macht das gar nichts. So würdest du ein R als eine senkrechte linie, einen Halbkreis und eine schräge Linie speichern. Das bringt neben dem Speicherplatzvorteil auch den Vorteil, dass die Buchstaben verschieden groß sein können.
Die Hauptarbeit wird hier auf jeden Fall, einen Algo zu entwickeln, der aus einem Bild diese Linien folgert.
Falls du deinen Ansatz nehmen möchtest, würde ich dir auf jeden Fall Raten, nicht die Nullen und Einsen zu speichern, sondern jedes Bit einzeln, dann brauchst du nur noch ein Achtel an Speicherplatz ...
|