Zitat:
Ich glaube, du hast nicht verstanden, was dir versucht wird zu erklären. In
ASM baut man schleifen so auf, dass man die Zählvariable in ein Register packt, dieses immer dekrementiert und auf null prüft. Ein Register auf null prüfen ist einfacher und damit performanter als zwei von null verschiedenen Werte mit einander zu vergleichen.
Um das noch genauer auszudrücken:
Bei jeder mathematischen Operation mit Ganzzahlen auf einer Intel CPU wird nicht nur das Resultat berechnet sondern auch Flags gesetzt die bestimmte Besonderheiten des Resultates wiederspiegeln. Wird also ein Register dekrementiert dann wird in den Flags das ZERO Flag automatisch durch diesen
DEC Befehl gesetzt wenn das Resultat NULL wurde. D.h. also das solche Operationen implizit bestimmte Abfragen durchführen, und das sofort in diesem Befehl. Danach gibt es bedingte Sprungbefehle die IMMER diese Flags als Grundlage nehmen um zu detektieren ob sie verzweigen sollen. D.h. beim Dekrement eines Register's werden minimal 2 CPU Befehle nötig. Inkrementiert man aber bis zu einer Zahlengrenze so muß die CPU nach dem Inkrement das Resultat = Zählvariable mit dieser Zahl explizit vergleichen und dann erst springen. Das benötigt also 3 Befehle.
Die Optimierung des Compilers benötigt also weniger Befehle um das gleiche Ziel zu erreichen. Die dazu benutzen Befehle sind NICHT schneller als die Befehle des unoptimierten Codes, das ist ein Irrtum.
Willst du aus Debugtechnischen Gründen die Optimierung des Compilers unterdrücken dann schalte die Optimierung einfach aus beim Compilieren.
Gruß Hagen