Der Benchmark ist Blödsinn, denn in TestMov wird der erste jle immer genommen, also ist der Branchpredictor ziemlich happy.
Branchy Code, bei dem ein conditional branch immer genommen wird oder nie genommen wird, ist für einen solchen Test Unfug.
Generell gilt: Conditional branches sind ok, wenn sie sehr predictable sind - d.h. es wird meist der eine Branch und selten der andere genommen. Sie funktionieren auch, wenn es immer abwechselnd ist, die Branchpredictors auf modernen CPUs sind ziemlich schlau. Schlimm wird es allerdings, wenn sie nicht vorhersehbar sind - selbst wenn es im Schnitt 50/50 ist aber ob der Sprung genommen wird oder nicht, ist z.B nicht immer abwechselnd, dann wirds schlimm und man ist mit einem cmov besser aufgehoben.
Übrigens schreibt man
dec ecx
und nicht
sub ecx, 1
-
dec ist 1 byte instruction, sub benötigt 3 byte
FWIW:
https://codereview.stackexchange.com...he-range-0-255
Zu "Übrigens schreibt man dec ecx und nicht sub ecx, 1 - dec ist 1 byte instruction, sub benötigt 3 byte"
Da sind die Hersteller meiner CPU anderer Meinung.
Zitat aus Kapitel 2-12 in "IA-32 Intel® Architecture Optimization Reference Manual" (Siehe Anhang)
Zitat:
The inc and
dec instructions should always be avoided. Using add
and sub instructions instead avoids data dependence and improves
performance.
Merke: Kürzere Instruction bedeutet nicht automatisch "schneller".
Mir ist bewusst, dass bei heutigen Prozessoren (auch bei meinem schon etwas älteren I7 2600K) ein
dec/inc und sub 1/add 1 gleich schnell abgearbeitet werden, bei früheren Prozessoren war sub/add (mit #-Werten) deutlich schneller als
dec/inc.
Ich benutze trotzdem i.d.R. sub/add weil hier, anders als bei
dec/inc, auch das CF Flag gesetzt wird.
Zu "Der Benchmark ist Blödsinn, denn in TestMov wird der erste jle immer genommen"
Nein. Der jle @Z wird nur dann genommen, wenn eax <= 0 ist.
Bei @1 wird edx = -255 gesetzt.
Bei @2 wird edx in eax kopiert und dann eax mit 0 verglichen und gejumpt, wenn eax <= 0 ist.
Bei @N wird edx um 1 erhöht und zu @2 gejumpt, solange edx <= 255 ist.
Bei @2 kann edx und dann eax also Werte im Bereich -255 bis 255 haben.
Merke: Worte wie "Blödsinn" oder"Quatsch" sollte man vermeiden,
Delphi-Quellcode:
PROCEDURE TestMov;
const S:String='
';
asm
push 0
mov edi,0
mov esi,255
mov ecx,Count
@1: mov edx,-255
@2: mov eax,edx
cmp eax,0
jle @Z
cmp eax,255
jbe @S
mov byte[esp],255
jmp @N
@Z:
xor eax,eax
@S: mov [esp],al
@N: add edx,1
cmp edx,255
jbe @2
sub ecx,1
jne @1
@
End: pop ecx
end;
Das mov edi,0 und mov esi,255 ist übrigens überflüssig (resultierte aus copy/paste).