![]() |
Grafiken erkennen. Library ?
Hallo,
ich müsste für ein Projekt Grafiken erkennen. Das soll so funktionieren, dass die zu erkennende Grafik als .bmp eingelesen wird, und diese Grafik soll in einer anderen Grafik (zB auf dem Desktop) erkannt werden. Das ganze soll auch funktionieren, wenn sich die Größe der gesuchten Grafik verändert. Gibt es für diese Aufgabe irgendwelchen libs ? Wie kann man so eine optische Erkennung am besten umsetzen.. TBitmap ist ja auch nicht alzu flexibel... und jeden Pixel einzeln auszulesen macht jetzt auch nicht viel Sinn und ist auch recht langsam !? ~stiftII PS: Arbeite mit Lazarus |
AW: Grafiken erkennen. Library ?
Zitat:
![]() Ansonsten finde ich oft ![]() Zitat:
|
AW: Grafiken erkennen. Library ?
man kann jedes Pixel auslesen, man kann aber auch scanline verwenden (schneller)
|
AW: Grafiken erkennen. Library ?
Zitat:
Auf jeden Fall ist ![]() |
AW: Grafiken erkennen. Library ?
Es muss nicht direkt pattern matching sein, es reicht ja eine Ähnlichkeitssuche. Das Schlagwort hier wäre "Korrelationsfunktion" (nicht die aus der Statistik, sondern die Umkehrung zur Convolution/Faltung in der Bildverarbeitung).
Leichte Kost ist das auch nicht gerade. Man sollte in der Lage sein, ein Bild per Fourier-Transformation (FFT) in den Frequenzraum zu transformieren (und wieder zurück) und auch komplexe Zahlen sollte einem nicht fremd sein. Zur Belohnung kann man dann ein kleineres Bild in einem größeren suchen und bekommt X- und Y-Koordinaten am Ende raus (als Maxima der Funktion, die die Ähnlichkeit der Bilder darstellt). Zum schnellen Testen, kann man MatLab hernehmen:
Code:
wobei hier w das gesuchte Muster und f das Gesamtbild ist. In I und J stehen dann nachher die Koordinaten (I=Y, J=X, weil Matlab spaltenweise arbeitet).
functiong = dftcorr(f,w)
[M,N] = size(f); F = fft2(f); G = conj(fft2(w,M,N)); g = real(ifft2(G.*F)); gs= im2uint8(mat2gray(g)); figure; imtool(gs); [I,J]= find(g == max(g(:))) Das ganze in fertiger Form für Delphi kenne ich leider nicht, aber wenn dich das bisher nicht abgeschreckt hat: Zumindest zur Theorie dahinter hab ich noch ein wenig rumfliegen. |
AW: Grafiken erkennen. Library ?
Hi,
die eierlegende Wollmilchsau zum Thema Bilderkennung etc. dürft vermutlich ![]() LG, Frederic |
AW: Grafiken erkennen. Library ?
Zitat:
Würde mich interessieren, was du noch so zum Thema hast. Und vllt kannste ja sogar eine Beispielfunktion in FPC basteln ?? Und was macht diese "Ähnlichkeitssuche" genau ?. Wandelt sie das Bild in ein verainfachtes Format um, und vergleicht gefundene Muster und formen ? Oder geht die im Endeffekte jeden Pixel durch und vergleicht ? Danke schonmal. ~stiftII |
AW: Grafiken erkennen. Library ?
Zitat:
Würde das ganze gerne in Lazarus umsetzen. |
AW: Grafiken erkennen. Library ?
Wie performant muss das ganze sein, wo willst du es genau einsetzen?
Darf das gesuchte Bild Abweichungen haben oder ist es exakt so im Bild enthalten? |
AW: Grafiken erkennen. Library ?
Zitat:
- vorher in einem Pointer-Array alle Scanlines zwischenspeichern und schon hat man eine Art zweidimensionales Array - sich den Zeiger auf die letzte Scanline holen (diese Bitmaps werden von unten nach oben gespeichert) und schon kann man über eine Art eindimensionales Array drauf zugreifen (alle Zeilen hintereinander) |
AW: Grafiken erkennen. Library ?
xD
Genau dies habe ich implementiert und warte nun auf seine Antwort auf meine letzte Frage ^^ (+SAD, einfach und langsam) |
AW: Grafiken erkennen. Library ?
Zitat:
Nein, diese Suche transformiert die Bilder vom Ortsraum in den Frequenzraum, führt eine skaleninvariante Minimabestimmung einer Differenz der Faltung durch, und transformiert das gefundene Minimum zurück in den Ortsraum. Edit: Oder ist das das Maximum im Sinne einer Autokorrelation im Frequenzraum? Der Wein... Was mich brennend interessieren würde: Gibt es dafür auch eine skalen- und rotationsinvariante Version in ähnlicher Einfachheit? |
AW: Grafiken erkennen. Library ?
der Algorithmus zum Finden eines Suchbildes in einer großen Vorlage ist :
NORMALIZED CROSS CORRELATION - BZW. FAST NCC unter ![]() Für unser Testbild benötigt die Version auf Source forge ~ 30 sec auf meinem Laptop, aktuell haben wir eine optimierte Version von FAST NCC entwickelt, die Suche geht ca. 500 x schneller, dh. ist aber aktuell kein Open Source code. Falls Di ein Suchprojekt bearbeitest reicht Dir event. die Public Version des Algorithmuses. |
AW: Grafiken erkennen. Library ?
Hier, die einfache Variante mit SAD (Sum of Absolute Differences (siehe Wikipedia))
Delphi-Quellcode:
Edit: Das liefert die linke obere Ecke des Bereiches. Der Bereich hat klarerweise dieselbe Dimension wie "Picture"
function findPicture(const Source, Picture: TBitmap): TPoint;
type TPRGBTripleRow = Array of PRGBTriple; var SourceScanlineRow : TPRGBTripleRow; PictureScanlineRow : TPRGBTripleRow; function getRGBDifference(const ColorA, ColorB: PRGBTriple): Integer; begin Result := abs(ColorA.rgbtBlue - ColorB.rgbtBlue) + abs(ColorA.rgbtGreen - ColorB.rgbtGreen) + abs(ColorA.rgbtRed - ColorB.rgbtRed); end; function getPColor(const ScanlineRow: TPRGBTripleRow; const X, Y: Integer): PRGBTriple; begin Result := PRGBTriple(Integer(ScanlineRow[y]) + x * 3); end; procedure buildScanlineRows; var y: Integer; begin SetLength(SourceScanlineRow, Source.Height); for y := 0 to Source.Height - 1 do SourceScanlineRow[y] := Source.ScanLine[y]; SetLength(PictureScanlineRow, Picture.Height); for y := 0 to Picture.Height - 1 do PictureScanlineRow[y] := Picture.ScanLine[y]; end; function _findPicture: TPoint; var x, y, i, j : Integer; SAD : Integer; curSAD : Integer; begin SAD := -1; // not assigned for y := 0 to Source.Height - Picture.Height do for x := 0 to Source.Width - Picture.Width do begin curSAD := 0; for j := 0 to Picture.Height - 1 do for i := 0 to Picture.Width - 1 do inc(curSAD, getRGBDifference(getPColor(SourceScanlineRow, x + i, y + j), getPColor(PictureScanlineRow, i, j))); if (SAD = -1) or (curSAD < SAD) then begin SAD := curSAD; Result := Point(x, y); if SAD = 0 then Exit; end; end; end; begin if (Picture.Width > Source.Width) or (Picture.Height > Source.Height) or (Picture.PixelFormat <> pf24bit) or (Source.PixelFormat <> pf24bit) then Result := Point(-1, -1) else begin buildScanlineRows; Result := _findPicture; end; end; |
AW: Grafiken erkennen. Library ?
Zitat:
![]() Allerdings weiss ich nicht ob das Lazarus kompatibel ist. Es gibt da auch Möglichkeiten mit opencv zu linken. Allerdings muss das training "von Hand" gemacht werden. Ähnlichkeitssuche ist aber out of the box möglich. Edit: Soeben habe ich gesehen dass nun sogar das ![]() |
AW: Grafiken erkennen. Library ?
Zitat:
Was macht die Funktion, die du gepostet hast genau ? PS: Wenn ich die ausprobieren möchte bekomme ich ein "PRGBTriple not found" |
AW: Grafiken erkennen. Library ?
Welche Delphiversion verwendest du?
Ich schätz mal, eine etwas ältere, in der es diesen Typ nicht gibt. Du kannst sie hier definieren:
Delphi-Quellcode:
Die Funktion liefert dir die Koordinaten der linkeren oberen Ecke im Bild, wo es halt gefunden wurde.
type
PRGBTriple = ^TRGBTriple; TRGBTriple = record rgbtBlue: Byte; rgbtGreen: Byte; rgbtRed: Byte; end; TPRGBTripleRow = Array of PRGBTriple; Anwendung:
Delphi-Quellcode:
Edit: Skalierung wird nicht berücksichtigt! Dies ginge aber auch ganz einfach (jedoch übelst unperformant) indem man das Suchbild zuerst mal richtig runterskaliert, dann schrittweise hochskaliert bis man dieselben Dimensionen wie das "RiesngroßeBild" hat und meine Suchfunktion drüberjagt!
var
Position: TPoint; begin Position := findPicture(RiesengroßesBild, SuchBild); ShowMessage('Gefunden an der Stelle: ' + IntToStr(Position.X) + ' - ' + IntToStr(Position.Y)); end; Edit2: Das Ganze ist mehr oder weniger die Implementierung von dem ![]() ![]() |
AW: Grafiken erkennen. Library ?
Zitat:
Wie genau würde diese Funktion denn das skalierte Bilder erkennen ? Beim skallieren gibt es ja auch immer einen qualitätsverlust, wenn das Original-Bild zB kleiner ist als das zu suchende "fragment". PS: Ich arbeite mit Lazarus (fpc) und hab gerade festgestellt, dass es scanline dort nicht gibt :x .... |
AW: Grafiken erkennen. Library ?
Pff, um ehrlich zu sein, habe ich keine Lust, dir das anzupassen =/
Scanline ist einfach ein direkterer Weg, auf den Farbspeicher zuzugreifen. Evt. gibts unter Lazarus Pixels[]? |
AW: Grafiken erkennen. Library ?
Zitat:
jetzt fehlt aber "PixelFormat" |
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:00 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz