Delphi-PRAXiS - Funktionsweise von Erkennungssoftware

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)

- Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)

- - Funktionsweise von Erkennungssoftware (https://www.delphipraxis.net/131673-funktionsweise-von-erkennungssoftware.html)

Funktionsweise von Erkennungssoftware

Hi,

nach sehr langer Zeit melde ich mich hier auch mal wieder. ;)

Ich habe mich schon immer gefragt, wie (Bild-)Erkennungssoftware arbeitet. Sicherlich sind es komplexe Abläufe, doch mich würde interessieren, welches Verfahren diesen Programmen zugrunde liegt.
Wie werden zB bestimmte Formen (Menschen) in Bildern erkannt oder auch: Wie werden Körperteile (Augen, Mund, ...) im Foto eines Gesichts erkannt? Oder wie werden Buchstaben in Bildern erkannt?

Eine weitergehende Fragestellung, aber das wird wohl äußerst komplex, wäre, wie man die Programme dann auch noch "lernfähig" macht (wie zB bei Schreiberkennungssoftware). Aber momentan interessiert mich mehr der erste Teil.

Es wäre ein "Traumprojekt" von mir, ein Programm zu entwickeln, mit dem ich beginne, sehr einfache Formen zu erkennen (also anfangs wirklich in der Richtung, Dreiecke von Vierecken zu unterscheiden o.ä.).
Nur muss man dazu ja irgendwie das "feste Pixelnetz" verlassen und Formen als Ganzes betrachten.

Wie gesagt - würde mich freuen, wenn da jemand Informationen, Links, Empfehlungen o.ä. hat. Danke schonmal :)

air

Re: Funktionsweise von Erkennungssoftware

Zitat:

Zitat von Airblader

Es wäre ein "Traumprojekt" von mir, ein Programm zu entwickeln, mit dem ich beginne, sehr einfache Formen zu erkennen (also anfangs wirklich in der Richtung, Dreiecke von Vierecken zu unterscheiden o.ä.).

Eine Paradedisziplin für Neuronale Netzte. Du bringst dem Netz einfach alle Formen bei, die es erkennen können soll (in den Grenzen des Lernabren, was von der Anzahl der Neuronen abhängt) und das kann dir dann aus einer Eingabe einen dieser Zustände widerherstellen (womit er dann erkannt wäre)

Beispiele mit Sourcen findest du hier in der DP. Das ganze ist garnicht so kompliziert, wie es sich zunächst anhört ;) Für den Anfang würd ich dir die Implementation eines Hopfield-NNs empfehlen.

Re: Funktionsweise von Erkennungssoftware

Es gibt verschiedene Herangehensweisen. Ein Stichpunkt sind wie schon gesagt wurde

neuronale Netze oder für den Anfang eine

Hough-Transformation.

Dazu gab es auch schon einige Fragen:

http://www.delphipraxis.net/internal...t.php?t=115847

http://www.delphi-forum.de/viewtopic.php?p=537981

http://www.delphi-forum.de/viewtopic.php?p=540739

Re: Funktionsweise von Erkennungssoftware

Hi,

vielen Dank euch Beiden!
Werde mich da jetzt mal etwas einlesen ... ;)

air