hier ließ sich nur viel mit
ASM optimieren, da der Compiler die Variablen und Zwischenergebnise einzeln verwaltet und ich hier Vieles in sich selber belassen konnte,
also die ganze Berechnung komplett in die Register verlagert hatte, wärend der Compiler oftmals Zwischenergebnisse auf dem Stack ablegt (mir haben praktisch 4 Register gereicht, wärend Delphi mit allen Variablen und temporären Variablen, für Zwischenergebnisse, auf über 4 kommt ... wobei standardmäßig eh nur 3 Register frei veränderbar sind)
beim Suchen dagegen braucht man nicht viele Register, da dort eh vieles außerhalb (im
RAM) abläuft ... also reinladen/vergleichen und das kann der Compiler selber schon ganz gut.