Einzelnen Beitrag anzeigen

Benutzerbild von jokerfacehro
jokerfacehro

Registriert seit: 13. Feb 2007
306 Beiträge
 
Delphi 7 Enterprise
 
#27

Re: Text aus Image extrahieren

  Alt 12. Okt 2007, 19:25
hey bin am wieder on in der DP ^^

ich hatte Sommerferien und viel Zeit, zur Zeit sammle ich image codes für das Training, habe fast 100 bilde rzusammen worin jeweils 6 buchstaben stehen, die zerteile ich und drehe die buchstaben und gebe sie dann ein ^^

wenn ich noch en paar hundetr gesammelt habe, fange ich mit dem training an. ma schaun was draus ^^

ich ahbe imemr viele projekte gleichzeitig laufen, weshalb ich immer hin und herspringe.
meistens bringt die ruhe zwischendurch mehr durchsicht in dem thema und man kann neue ideen reinbringen.

dieses thema ist nur ein ansatz von und ich gebe euch, recht es gibt keinen universalen ansatz, NNs sind immer für spezialisierte Sachen. man müsste füür jeden image code verification typen eine eigene erkennungssoftware basteln, wobei weniger die zu verwendenden NNs das problem sind, sondern eher die benötigten trainingsdaten.

ich werde mindestens 500 bilder brauchen am besten 1000 und das training kann denn stunden bis tage laufen xD

das ist ein relativ geringer aufwand, je mehr variable größen wie schriftgröße, farbe und schriftart ins spiel kommen wird es schwieriger weil es noch mehr zu ebachtenden möglichkeiten gibt, am besten man hat jeden code der auftauchen aknn bereits im training, dann kann man davon ausgehen, wenn alle paramter im training richtig konfiguriert sind, dass der code richtig interpretiert wird.

bei mir wären das: 6zeichen pro code und von a-z A-Z 0-9 das heißt 64^5 möglichkeiten.

da man solche datenmengen schlecht bewältigen kann, ist die auswahl der richtigen trainingsdaten und die optimale konfiguration der parameter wichtig. WICHTIG ist: trainiert mein zeichen z.B. ein "U" und man weiß dass das zu erkennende "U" später unleserlich sein kann, sollte man das trainings "U" auch etwas unlerserlich machen, damit das NN nicht direkt nach dem "U" sucht, sondern nach besonderheiten in der struktur des "U"s um es variabler zu machen.

OCR ist was tolles und hat zukunft, wir stecken in den kindershcuhen und es gibt viel zu entdecken, aber zwischendurch ne pause einlegen und sich ins gedächtnis rufen welchen zweck das ganze später hat
  Mit Zitat antworten Zitat