![]() |
Speed von gleichen Threads unterschiedlich
Hallo,
ich da mal eine Frage. In einem Projekt, in dem ich einige tausend Bilder verwalte, habe ich eine Prozedur mit der ich ähnliche oder gleiche Bilder suchen kann. Um diese Prozedur zu beschleunigen, teile ich die Liste der zu überprüfenden Bilder durch die Anzahl der Prozessorkerne und lagere die Überprüfung in die entsprechenden Anzahl von Threads aus. Wenn zur Suche die Funktion "VergleicheHorizontal" (Code sieh unten) verwendet wird, geht es mit 4 Threads fast 3 x so schnell. Wenn ich aber zur Suche die Funktion "VergleicheVertikal" verwende, dauert es mit den 4 Thread 4 x länger als in der ursprünglichen Prozedur. Wenn ich für diese Funktion nur 1 Thread starte, geht zwar etwas schneller. Aber je mehr Threads ich verwende, desto länger dauert es mit dieser Funktion. Ich vermute, die Threads bremsen sich gegenseitig aus. Nur wo? Wieso steigt bei der Funktion "VergleicheHorizontal" die Geschwindigkeit mit der Anzahl der Threads und bei "VergleicheVertikal" nicht? Dort ist es genau umgekehrt. Der Code unterscheidet sich im wesentlichen doch nur in der unterschiedlichen Anzahl der Verwendung von Scanline. Über ein paaar Tips würde ich mich sehr freuen. Viele Grüße Klaus Hier der Code der beiden Funktionen:
Delphi-Quellcode:
Der Code des Threads:
function VergleicheBmp(bmp0, bmp1: TBitmap; VerglMode: TBmpVerglMode; toleranz: integer; SollProz: double = 0): double;
function VergleicheHorizontal(bmp0, bmp1: TBitmap; toleranz: Integer): double; var x, y, r0, g0, b0, r1, g1, b1, size0, diff : LongInt; p0, p1 : pRGBValue; begin diff := 0; size0 := bmp0.Height; for y := 0 to bmp0.Height-1 do begin p0 := bmp0.Scanline[y]; p1 := bmp1.Scanline[y]; r0 := 0; g0 := 0; b0 := 0; r1 := 0; g1 := 0; b1 := 0; for x := 0 to bmp0.Width-1 do begin inc(r0, p0.Red); inc(g0, p0.Green); inc(b0, p0.Blue); inc(r1, p1.Red); inc(g1, p1.Green); inc(b1, p1.Blue); Inc(p1); Inc(p0); end; r0 := r0 div bmp0.Width; g0 := g0 div bmp0.Width; b0 := b0 div bmp0.Width; r1 := r1 div bmp1.Width; g1 := g1 div bmp1.Width; b1 := b1 div bmp1.Width; if abs(r1-r0) > toleranz then inc(diff) else if abs(g1-g0) > toleranz then inc(diff) else if abs(b1-b0) > toleranz then inc(diff); end; result := diff*100/size0; end; function VergleicheVertikal(bmp0, bmp1: TBitmap; toleranz: Integer): double; var x, y, r0, g0, b0, r1, g1, b1, size0, diff : LongInt; p0, p1 : pRGBValue; begin diff := 0; size0 := bmp0.Width; for x := 0 to bmp0.Width-1 do begin r0 := 0; g0 := 0; b0 := 0; r1 := 0; g1 := 0; b1 := 0; for y := 0 to bmp0.Height-1 do begin p0 := bmp0.Scanline[y]; p1 := bmp1.Scanline[y]; inc(p0, x); inc(p1, x); inc(r0, p0.Red); inc(g0, p0.Green); inc(b0, p0.Blue); inc(r1, p1.Red); inc(g1, p1.Green); inc(b1, p1.Blue); end; r0 := r0 div bmp0.Height; g0 := g0 div bmp0.Height; b0 := b0 div bmp0.Height; r1 := r1 div bmp1.Height; g1 := g1 div bmp1.Height; b1 := b1 div bmp1.Height; if abs(r1-r0) > toleranz then inc(diff) else if abs(g1-g0) > toleranz then inc(diff) else if abs(b1-b0) > toleranz then inc(diff); end; result := diff*100/size0; end; begin // bmp auf gleiche Größe bringen: if bmp0.Height*bmp0.Width <> bmp1.Height*bmp1.Width then NewSizeToBitmap(bmp1, bmp0.Height, bmp0.Width); // Pixelformat egalisieren: if bmp0.PixelFormat <> pf24bit then bmp0.PixelFormat := pf24bit; if bmp1.PixelFormat <> pf24bit then bmp1.PixelFormat := pf24bit; // Bereichsüberprüfung des Compilers ggf. abschalten: {$IFOPT R+} {$R-} {$DEFINE RangCheck} {$ENDIF} // bmp vergleichen: case VerglMode of cvLineH : result := VergleicheHorizontal(bmp0, bmp1, toleranz); cvLineV : result := VergleicheVertikal(bmp0, bmp1, toleranz); cvLineHV : begin result := VergleicheHorizontal(bmp0, bmp1, toleranz); if result > Sollproz then result := (result+VergleicheVertikal(bmp0, bmp1, toleranz))/2; end; else result := -1; end; // Bereichsüberprüfung des Compilers ggf. wieder einschalten: {$IFDEF RangCheck} {$R+} {$UNDEF RangCheck} {$ENDIF} end;
Delphi-Quellcode:
unit ThreadSuchImage;
interface uses Classes, Graphics, Forms, FilterGrid, ExtCtrls, ClassAlbum; const cThreadMsgMode_Find = 1; cThreadMsgMode_Msg = 2; cThreadMsgMode_Ende = 512; cModFaktor = 10; type ThreadMsgDat = packed record Mode, idx, RefNr, ImgNr, Anz : Integer; sv : Boolean; end; pThreadMsgDat = ^ThreadMsgDat; TThreadSuchImg = class(TThread) private { Private declarations } FAlb : TAlbum; FDat : ThreadMsgDat; Fbmp0 : TBitmap; ImNr : Integer; proz : double; FMsgLst : TList; procedure AddToGrd; procedure SetMsg; procedure SetEndeMsg; public constructor Create(aAlb: TAlbum; tmd: ThreadMsgDat; RefBmp: TBitmap; MsgLst: TList); function VerglImg: Boolean; protected procedure Execute; override; end; implementation uses SysUtils, ClassImage, DlgVergImg, AlbenText, Alben, AlbenConst, ClassEinst, ToolGrafik; constructor TThreadSuchImg.Create(aAlb: TAlbum; tmd: ThreadMsgDat; RefBmp: TBitmap; MsgLst: TList); begin inherited Create(True); FAlb := aAlb; FDat := tmd; Fbmp0 := RefBmp; FMsgLst := MsgLst; Priority := tpHighest; FreeOnTerminate := True; end; procedure TThreadSuchImg.AddToGrd; var ptmd : pThreadMsgDat; begin new(ptmd); ptmd^.Mode := cThreadMsgMode_Find; ptmd^.idx := FDat.idx; ptmd^.RefNr := FDat.RefNr; ptmd^.ImgNr := ImNr; ptmd^.Anz := round(Proz*100); FMsgLst.Add(ptmd); end; procedure TThreadSuchImg.SetMsg; var ptmd : pThreadMsgDat; begin new(ptmd); ptmd^.Mode := cThreadMsgMode_Msg; ptmd^.idx := FDat.idx; ptmd^.ImgNr := ImNr; FMsgLst.Add(ptmd); end; procedure TThreadSuchImg.SetEndeMsg; var pTmd : pThreadMsgDat; begin new(pTmd); pTmd^.Mode := cThreadMsgMode_Ende; pTmd^.idx := FDat.idx; FMsgLst.Add(pTmd); end; function TThreadSuchImg.VerglImg: Boolean; var i, toleranz : Integer; bmp1 : TBitmap; sv1 : boolean; SollProz : double; VerglDat : TVerglImgDatRec; // ist ein record in dem die Sucheinstellungen gespeichert werden lst : TStringList; function GetBmpFilename(ai: TAlbImg): string; begin if FAlb.VerglImg.DiaMode then result := FAlb.FileNameDia[ai] else result := FAlb.FileNameImg[ai]; end; begin toleranz := round(255*FAlb.VerglImg.Toleranz/100); SollProz := 100-FAlb.VerglImg.Proz; VerglDat := FAlb.VerglImg.VerglImgDat; lst := TStringlist.Create; try for i := FDat.ImgNr to FDat.ImgNr+FDat.Anz-1 do if i <> FDat.RefNr then lst.Add(GetBmpFilename(FAlb.ImgLst[i])); for i := 0 to lst.Count-1 do begin if Terminated then Break; bmp1 := TBitmap.Create; try LoadGrafikToBmp(bmp1, lst[i]); sv1 := bmp1.Height > bmp1.Width; if not(VerglDat.Sv) or (FDat.sv = sv1) then proz := VergleicheBmp(FBmp0, bmp1, VerglDat.VerglMode, toleranz, VerglDat.Proz) else proz := SollProz+1; finally bmp1.Free; end; ImNr := FDat.ImgNr+i; if proz <= SollProz then AddToGrd; if i mod cModFaktor = 0 then SetMsg; end; finally lst.Free; end; end; procedure TThreadSuchImg.Execute; begin try VerglImg; finally SetEndeMsg; end; end; end. |
Re: Speed von gleichen Threads unterschiedlich
Hallo!
Zitat:
|
Re: Speed von gleichen Threads unterschiedlich
Danke für die schnelle Antwort.
Zitat:
Das Erklärt mir aber noch nicht, warum 1 Thread mit 1000 Bilder viel viel schneller ist als 4 parallel laufende Threads mit jeweils 250 Bilder die Windows Vista auf jeweils einen Prozessorkern verteilt hat. Viele Grüße Klaus |
Re: Speed von gleichen Threads unterschiedlich
Zitat:
Delphi-Quellcode:
Der Code rotiert das übergeben TBitmap um 90 Grad im Uhrzeigersinn.
procedure RotateBitmap(const Bitmap: TBitmap);
var tmpBitmap: TBitmap; Points: array[0..2] of TPoint; begin tmpBitmap:= TBitmap.Create; try tmpBitmap.Assign(Bitmap); Bitmap.Width := tmpBitmap.Height; Bitmap.Height := tmpBitmap.Width; Points[0] := Point(tmpBitmap.Height, 0); Points[1] := Point(tmpBitmap.Height, tmpBitmap.Width); Points[2] := Point(0, 0); PlgBlt(Bitmap.Canvas.Handle, Points, tmpBitmap.Canvas.Handle, 0, 0, tmpBitmap.Width, tmpBitmap.Height, 0, 0, 0); finally tmpBitmap.Free(); end; end; Zitat:
Aber es wird garantiert daran liegen, dass Du beim vertikalen vergleichen Scanline Width*Height-Mal aufrufst und dann jeweils nur ein Pixel vergelichst, anstatt pro Zeile nur einmal Scanline aufzurufen und die komplette Zeile abzuarbeiten. |
Re: Speed von gleichen Threads unterschiedlich
Danke nochmals.
Ich werde das heute Abend mal testen. Jetzt muß ich mich erst einmal um die liebe Verwandtschaft kümmern. Ich habe ich die Bude voll Besuch. Viele Grüße Klaus |
Re: Speed von gleichen Threads unterschiedlich
Hallo,
Ich habe an dem Problem jetzt etliche Stunden getestet und probiert, bin aber nicht viel weiter gekommen. Ich hatte den Vorschlag von Dunkel in der Methode VergVertikalNew (Code siehe unten) umgesetzt. Lief Anfangs so wie gewollt. Als ich die Datenmenge erhöhte, wurden immer weniger Bilder gefunden. Als ich das Häckchen in der Debuggeroption "Stop on Delphi Exceptions" gesetzt hatte, kam ich der Ursache auf die Spur. Die Threads wurden nach 2 bis ca 50 Schleifendurchläufen mit der Fehlermeldung "Project Fotoalbum3.exe raised exception class EOutOfResources with message 'Das Handle ist ungültig.'" in der Prozedur GDIError (Unit Graphics) abgebrochen. Was wird da nicht richtig freigegenen? Statt RotateBitmap habe ich nun meine bisherige Prozedur (Code siehe auch unten) zum Drehen verwendet. Es geht zwar langsamer als mit RotateBitmap, aber es funktioniert. Auch sind 4 Threads schneller als nur 1 Thread. Es kann also nicht an Scanline liegen. Diese Methode wird ja jetzt wesentlich mehr verwendet als vorher. Aber was kann nun die Ursache sein das die alte Methode VergleicheVertikal nicht funktioniert?
Delphi-Quellcode:
function VerglVertikalNew(bmp0, bmp1: TBitmap; toleranz, SollProz: Integer): double;
var TempBmp : TBitmap; begin TempBmp := TBitmap.Create; try TempBmp.Assign(bmp0); // RotateBitmap(TempBmp); // RotateBitmap(bmp1); DreheBmpNachRechts(TempBmp,1); DreheBmpNachRechts(bmp1, 1); result := VergleicheHorizontal(TempBmp, bmp1, toleranz, SollProz); finally TempBmp.Free; end; end;
Delphi-Quellcode:
Hat jemand eine Idee?
procedure DreheBmpNachRechts(bmp: TBitmap; Anz: integer);
type TMyHelp = array[0..0] of TRGBQuad; var RowOut : ^TMyHelp; P : pRGBQuad; //^THelpRGB; x, y, b, h : integer; help : TBitmap; OldPixForm : TPixelFormat; i : integer; begin OldPixForm := bmp.PixelFormat; bmp.PixelFormat := pf32bit; help := TBitmap.Create; // Bereichsüberprüfung des Compilers für RowOut[x] ggf. abschalten: {$IFOPT R+} {$R-} {$DEFINE RangCheck} {$ENDIF} try help.PixelFormat := pf32bit; for i := 1 to Anz do begin b := bmp.Height; h := bmp.Width; help.Width := b; help.height := h; for y := 0 to (h-1) do begin RowOut := help.ScanLine[y]; P := bmp.scanline[bmp.height-1]; inc(p,y); for x := 0 to (b-1) do begin RowOut[x] := p^; inc(p,h); end; end; bmp.Assign(help); end; bmp.PixelFormat := OldPixForm; finally help.Free; // Bereichsüberprüfung des Compilers ggf. wieder einschalten: {$IFDEF RangCheck} {$R+} {$UNDEF RangCheck} {$ENDIF} end; end; Grüße Klaus |
Re: Speed von gleichen Threads unterschiedlich
Hallo und Hurra,
ich weiß nicht wieso, aber es funktioniert jetzt. Falls jemand ähnliche Probleme hat, hier meinen Lösung: Die Fehlermeldungen: Zitat:
Delphi-Quellcode:
wegbekommen.
Bitmap.HandleType := bmDDB;
Das Problem, das 1 Thread schneller als 4 Threads ist habe ich auch wegbekommen. Die Ursche war das Referenzbild mit dem die Bilder in der Liste verglichen wurden. Obwohl ich es im Thread lokal geladen habe, hat vermutlich das "System" dieses Bitmap global verwaltet und die Thread haben sich beim lesen gegeseitig behindert. Ich lade das Refenz-Bitmap nun beim Start des Threads, werte es aus, speichere die Ergebnisse in einer TList und gebe dieses Bild wieder frei. Dann werden die einzelnen Bilder geladen und mit den in TList gespeicherten Daten verglichen. Das funktioniert jetzt so wie ich es will. Viele Grüße Klaus |
Re: Speed von gleichen Threads unterschiedlich
Für rechenintensive Threads (also Thread, die ausschlieslich im RAM arbeiten und keine I/O-Operationen haben) gilt folgende Regel:
Die Anzahl der Thread soll mit der Anzahl der CPU-Kerne übereinstimmen. Jeder einzelne Thread kann dann jeweils einen Kern auf 100% Auslastung bringen. Verwendet man z.B. 4 Threads auf einer CPU mit nur einem Kern, dann ist die Gesamtleistung geringer als mit nur einem Thread. Dafür gibt es zwei Gründe: 1.) der Overhead für die Threadumschaltung bremst 2.) im Level 1 und Level 2 Cache entstehen mehr ![]() |
Re: Speed von gleichen Threads unterschiedlich
Zitat:
dann kann jeder Thread wirklich 100% eines Kernes belegen (man muß nur dafür sorgen, daß sonst kein anderer Prozeß auf denjenigen Kernen läuft und für Windows, sowie die anderen Prozesse, bleibt dennoch etwas rechenleistung übrig) |
Re: Speed von gleichen Threads unterschiedlich
Hallo,
Zitat:
Bei einem Thread wird 1 CPU-Kern zu fast 100% ausgelastet. Macht ca 25% Gesamtauslastung. Die 4 Threads verteilt Windows automatisch auf je einen Kern. Ich komme da auf eine Gesamtauslastung von ca. 65%, was mehr als doppelt so schnell ist. Grüße Klaus. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:56 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz