![]() |
Funktionsweise von Erkennungssoftware
Hi,
nach sehr langer Zeit melde ich mich hier auch mal wieder. ;) Ich habe mich schon immer gefragt, wie (Bild-)Erkennungssoftware arbeitet. Sicherlich sind es komplexe Abläufe, doch mich würde interessieren, welches Verfahren diesen Programmen zugrunde liegt. Wie werden zB bestimmte Formen (Menschen) in Bildern erkannt oder auch: Wie werden Körperteile (Augen, Mund, ...) im Foto eines Gesichts erkannt? Oder wie werden Buchstaben in Bildern erkannt? Eine weitergehende Fragestellung, aber das wird wohl äußerst komplex, wäre, wie man die Programme dann auch noch "lernfähig" macht (wie zB bei Schreiberkennungssoftware). Aber momentan interessiert mich mehr der erste Teil. Es wäre ein "Traumprojekt" von mir, ein Programm zu entwickeln, mit dem ich beginne, sehr einfache Formen zu erkennen (also anfangs wirklich in der Richtung, Dreiecke von Vierecken zu unterscheiden o.ä.). Nur muss man dazu ja irgendwie das "feste Pixelnetz" verlassen und Formen als Ganzes betrachten. Wie gesagt - würde mich freuen, wenn da jemand Informationen, Links, Empfehlungen o.ä. hat. Danke schonmal :) air |
Re: Funktionsweise von Erkennungssoftware
Zitat:
Beispiele mit Sourcen findest du hier in der DP. Das ganze ist garnicht so kompliziert, wie es sich zunächst anhört ;) Für den Anfang würd ich dir die Implementation eines Hopfield-NNs empfehlen. |
Re: Funktionsweise von Erkennungssoftware
Es gibt verschiedene Herangehensweisen. Ein Stichpunkt sind wie schon gesagt wurde
![]() ![]() Dazu gab es auch schon einige Fragen: ![]() ![]() ![]() |
Re: Funktionsweise von Erkennungssoftware
Hi,
vielen Dank euch Beiden! Werde mich da jetzt mal etwas einlesen ... ;) air |
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:21 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz