AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Text aus Image extrahieren

Ein Thema von jokerfacehro · begonnen am 7. Aug 2007 · letzter Beitrag vom 13. Okt 2007
Antwort Antwort
Seite 3 von 4     123 4      
Benutzerbild von jokerfacehro
jokerfacehro

Registriert seit: 13. Feb 2007
306 Beiträge
 
Delphi 7 Enterprise
 
#21

Re: Text aus Image extrahieren

  Alt 9. Aug 2007, 04:48
bitte probiert den algorithmus aus und compiliert es einmal mit der zeile blackpix:=blindpix; und einmal ohne.

kommt bei euch ohne die zeile auch ein schlechteres ergebnis raus?

ich habe keine ahnugn warum, die variable wird garnicht bentuzt, trotzdem hat sie so einen großen einfluss auf das programm, als wenn mich delphi verarschen möchte

ich habe meinen gesamten quelltext, is ja nicht viel, nach dem variablen namen durchsucht, erkommt wirklich nur in der deklaration und in er einen zeile vor

PS: zuerst verbessere ich die schrift dann nehme ich den ganzen salat raus.
ich mache es ab jetzt immer so, weil es eigentlich immer eine bessere lesbarkeit für ocr software da ist.
  Mit Zitat antworten Zitat
Benutzerbild von jokerfacehro
jokerfacehro

Registriert seit: 13. Feb 2007
306 Beiträge
 
Delphi 7 Enterprise
 
#22

Re: Text aus Image extrahieren

  Alt 9. Aug 2007, 06:00
lag wohl daran dass er die units nicht neu compiliert hat lol

hier jetzt eine fertige exe
Angehängte Dateien
Dateityp: rar pixelremover_169.rar (243,1 KB, 48x aufgerufen)
  Mit Zitat antworten Zitat
BullsEye

Registriert seit: 8. Sep 2007
Ort: Werlte
872 Beiträge
 
Delphi 7 Personal
 
#23

Re: Text aus Image extrahieren

  Alt 2. Okt 2007, 07:07
hi,
i weiß gar net, was ihr alle habt. sicherlich kann es einem "bot" dienen. Aber man muss ja net immer gleich das böse in einem erwarten oder!? I persönlich versuche sowas auch, wobei mir dieser thread sicherlich hilfe gibt. aber net weil i nen "bot" wo auch immer für machen will, sondern weils mich einfach interessiert.
  Mit Zitat antworten Zitat
Benutzerbild von Matze
Matze
(Co-Admin)

Registriert seit: 7. Jul 2003
Ort: Schwabenländle
14.929 Beiträge
 
Turbo Delphi für Win32
 
#24

Re: Text aus Image extrahieren

  Alt 2. Okt 2007, 08:15
@jokerfacehro: Es freut mich, dass du so eifrig damit herumspielst, doch bitte editiere deine Beiträge doch zukünftig. 9 Beiträge hintereinander innerhalb von rund 9 Stunden sind zu viel. Bevor ein Beitrag zu lange wird, ist das meiner Meinung nach in Ordnung oder wenn der letzte deiner Beiträge älter als 24 Stunden ist.
  Mit Zitat antworten Zitat
Florian H

Registriert seit: 30. Mär 2003
Ort: Mühlacker
1.043 Beiträge
 
Delphi 6 Professional
 
#25

Re: Text aus Image extrahieren

  Alt 2. Okt 2007, 09:03
Joah, diese Postingwelle war doch ein bissl zu viel, auch wenn ich deinen Enthusiasmus voll verstehen kann, ging mir genauso, als ich mich damit beschäftigt habe [nein, ich wollte auch nix "hacken"]..
Florian Heft
  Mit Zitat antworten Zitat
Benutzerbild von brinkee
brinkee

Registriert seit: 27. Aug 2004
60 Beiträge
 
Delphi 7 Enterprise
 
#26

Re: Text aus Image extrahieren

  Alt 4. Okt 2007, 12:58
Mahlzeit,

also für das eine Captcha, was Du dort gezeigt hast, ist deine Lösung sehr schön. Aber was machst Du, wenn plötzlich ein ganz anderes Störbild die OCR mit nem neuronalen Netz hindert?

Hier zum Beispiel, beim StudiVZ, musst Du verschieden Schriftarten erkennen - ein komplett anderer Ansatz:

http://www.markusbrinkmann.net/images/captcha1.jpg

Und wenn ich mir sowas angucke, dann will ich nicht wissen, wieviele tausend Aufarbeitungsschritte nötig sind, um meinem NN sowas zumuten zu können.

http://www.mondoblog.it/wp-content/u...12/captcha.jpg

Es ist auf jeden Fall möglich, für eine bestimmte Website mit einem bestimmten Captcha-Format eine Lösung für diese Probleme zu entwickeln. Bösewichte wie die Entwickler des HoeBOT, einem StudiVZ-Crawler, können das ganz gut. Aber wenn man so etwas universell einsetzbar machen will: gute Nacht.

Nimm Dir doch lieber ein schöneres Projekt vor. Stell eine kleine Webcam an den Straßenrand und suche in deren Bild nach Nummernschildern. Ist garnicht so schwer... Und dann nimmst Du eine NN um das Nummernschild zu lesen. Objekt- und Schrifterkennung in realen Umgebungen machen tausendfach mehr Spaß, als einfach nur Captchas auszulesen.... Soll keine Standpauke sein, nur ein kleiner Anreiz

LG,
Markus
Markus Brinkmann
  Mit Zitat antworten Zitat
Benutzerbild von jokerfacehro
jokerfacehro

Registriert seit: 13. Feb 2007
306 Beiträge
 
Delphi 7 Enterprise
 
#27

Re: Text aus Image extrahieren

  Alt 12. Okt 2007, 19:25
hey bin am wieder on in der DP ^^

ich hatte Sommerferien und viel Zeit, zur Zeit sammle ich image codes für das Training, habe fast 100 bilde rzusammen worin jeweils 6 buchstaben stehen, die zerteile ich und drehe die buchstaben und gebe sie dann ein ^^

wenn ich noch en paar hundetr gesammelt habe, fange ich mit dem training an. ma schaun was draus ^^

ich ahbe imemr viele projekte gleichzeitig laufen, weshalb ich immer hin und herspringe.
meistens bringt die ruhe zwischendurch mehr durchsicht in dem thema und man kann neue ideen reinbringen.

dieses thema ist nur ein ansatz von und ich gebe euch, recht es gibt keinen universalen ansatz, NNs sind immer für spezialisierte Sachen. man müsste füür jeden image code verification typen eine eigene erkennungssoftware basteln, wobei weniger die zu verwendenden NNs das problem sind, sondern eher die benötigten trainingsdaten.

ich werde mindestens 500 bilder brauchen am besten 1000 und das training kann denn stunden bis tage laufen xD

das ist ein relativ geringer aufwand, je mehr variable größen wie schriftgröße, farbe und schriftart ins spiel kommen wird es schwieriger weil es noch mehr zu ebachtenden möglichkeiten gibt, am besten man hat jeden code der auftauchen aknn bereits im training, dann kann man davon ausgehen, wenn alle paramter im training richtig konfiguriert sind, dass der code richtig interpretiert wird.

bei mir wären das: 6zeichen pro code und von a-z A-Z 0-9 das heißt 64^5 möglichkeiten.

da man solche datenmengen schlecht bewältigen kann, ist die auswahl der richtigen trainingsdaten und die optimale konfiguration der parameter wichtig. WICHTIG ist: trainiert mein zeichen z.B. ein "U" und man weiß dass das zu erkennende "U" später unleserlich sein kann, sollte man das trainings "U" auch etwas unlerserlich machen, damit das NN nicht direkt nach dem "U" sucht, sondern nach besonderheiten in der struktur des "U"s um es variabler zu machen.

OCR ist was tolles und hat zukunft, wir stecken in den kindershcuhen und es gibt viel zu entdecken, aber zwischendurch ne pause einlegen und sich ins gedächtnis rufen welchen zweck das ganze später hat
  Mit Zitat antworten Zitat
Benutzerbild von negaH
negaH

Registriert seit: 25. Jun 2003
Ort: Thüringen
2.950 Beiträge
 
#28

Re: Text aus Image extrahieren

  Alt 13. Okt 2007, 14:18
Naja ich sag's mal so: wer von Euch hat Probleme alle obigen Codes zu erkennen ? Fast keiner nehme ich an, ergo wird es auch eine technologische Möglichkeit geben das Computer das genausogut können. Nur mal als Gedankenansatz, das die Behauptung, das sowas niemals per Computer geht weil diese immer erst darauf trainiert werden müssten, widerlegt. Wir sind ja auch in der Lage neue Codes sofort zu erkennen, und in beiden Fällen handelt es sich um Neuronale Netze. Die Frage ist also nur, welches NN benötigen wir und welche Rechenpower ist dafür nötig. Wenn man sich so einige neue Netzwerke so anschaut dann ist deren Leistungsfähigkeit sehr erstaunlich. Zb. wurde erst kürzlich ein NN vorgestellt das gerademal 11 Neuronen enthält und bei der Objekterkennung aus Videokameras erstaunliches leistet.

Gruß Hagen
  Mit Zitat antworten Zitat
Benutzerbild von brinkee
brinkee

Registriert seit: 27. Aug 2004
60 Beiträge
 
Delphi 7 Enterprise
 
#29

Re: Text aus Image extrahieren

  Alt 13. Okt 2007, 15:03
Ja, sicherlich. Es ist immer eine Frage, welche Informationen man aus einem komplexen Datensystem extrapolieren kann. Natürlich ist es mit unserem neuralen Netzwerk im Hirn ein Leichtes, sechs Zeichen aus einem Kasten zu lesen. Wir sind es ja auch nicht gewohnt, immer nur bei diffusem Licht schwarzen Text auf weißem Grund zu lesen. War könnte da noch die Bild-Zeitung entschlüsseln. Allerdings ist es eine Frage des vorausgesetzten Modells, wie leistungsfähig ein Netz wirklich sein kann. Man sollte nicht glauben, dass man mit einem effen Backpropagation-System und einer großen Anzahl von Trainingsdaten alles erreichen kann. In dem Captcha auf meiner Homepage zum Beispiel (markusbrinkmann.net/guestbook.php) wird der Text in dem immer gleich groß bleibenden Bild immer an einer anderen Stelle angezeigt. Auch die Bildgröße könnte ich noch variieren. Und da reicht es nicht, viele Trainingsdaten zu haben. Ich habe mal einen Versuch mit meinem NN gemacht (einfachste Backpropagation, Link: hier) und dabei festgestellt, dass die Position logischerweise eine enorme Rolle spielt. Man sollte nicht erwarte, dass so ein Netzwerk für einen zaubert.
Also mein Tipp: vorher die Buchstaben einzeln freistellen und dann kannst Du es mit Backpropagation versuchen. Ansonsten wirst Du mehrere Zwischenschichten brauchen.

LG, Markus
Markus Brinkmann
  Mit Zitat antworten Zitat
Benutzerbild von jokerfacehro
jokerfacehro

Registriert seit: 13. Feb 2007
306 Beiträge
 
Delphi 7 Enterprise
 
#30

Re: Text aus Image extrahieren

  Alt 13. Okt 2007, 18:01
hallo,


danke für eure antworten

Zitat:
Nur mal als Gedankenansatz, das die Behauptung, das sowas niemals per Computer geht weil diese immer erst darauf trainiert werden müssten, widerlegt.
ich wollte deutlich machen, dass die traininigsdaten eine wichtige rolle für das NNs spielen.
die art des NNs ist mindestens genauso wichtig, da gebe ich dir recht

Auch die Bildgröße könnte ich noch variieren. Und da reicht es nicht, viele Trainingsdaten zu haben. Ich habe mal einen Versuch mit meinem NN gemacht (einfachste Backpropagation, Link: hier) und dabei festgestellt, dass die Position logischerweise eine enorme Rolle spielt. Man sollte nicht erwarte, dass so ein Netzwerk für einen zaubert. man bräcuhte mehrere erkennungsfunktionen, einmal eine zur bestimmung der position des textes,
dann die erkennung der drehung des gesamten textes, dann die einzelnen buchstaben, schriftgröße, schriftart etc.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 3 von 4     123 4      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 00:08 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz