Hi,
ich habe darüber eine besondere Lernleistung geschrieben, welche ich beim diesjährigen Abitur einbringen möchte.
Ich wollte auch zuerst mit neuronalen Netzen komplette Texte in Form von Bildern digitalisieren, also in
ASCII-Form umwandeln.
Ich darf diese Arbeit leider noch nicht veröffentlichen,
ABER: Mir ist relativ früh bewusst geworden, dass allein die Extrahierung der einzelner Zeichen (sehr) komplizierte Algorithmen erfordert. Da ich mich aber mit neuronalen Netzen beschäftigen wollte, habe ich mein Thema auf die Zeichenerkennung selbst beschränkt. Ich hab die Algorithmen zwar gut hinbekommen, sodass sie "saubere" Dokumente relativ gut in Zeichen zerlegen konnten, aber sobald der Text ein wenig unsauberer war gabs Probleme.
Gut ein Vorteil bei deiner Aufgabe ist die Tatsache, dass der Text im Bild immer einheitlich vorliegt, was die Programmierung der Algorithmen zur Extrahierung sehr vereinfacht. Aber trotzdem, statt mit Kanonen auf Spatzen zu schießen würde ich auch weiter am Admin rumnörgeln, es ist ja wohl kein Problem, die Infos auch in ner Textdatei auf dem Server abzuladen
lg,Flips
Philipp F.