[...] am liebsten in x86-Assember/Delphi inline
asm.
Kurz: Ich würde die Finger von Assembler lassen (außer einzelne Funktionen, die sehr große Datenmengen/-sätze bearbeiten).
Lang: Meines Wissens wird dadurch in Delphi erfolgreich die Optimierung verhindert; und das war wahrscheinlich die Idee hinter dem Wunsch Assembler zu verwenden. Wenn es Delphi sein soll/muss, sollte man es auch in Object Pascal schreiben. Delphi bietet seit einigen Versionen
inline als Hinweis an den Compiler an. Meiner Erfahrung nach ist eher der Algorithmus in der Anwendung das eigentliche Performance-Problem und eine Optimierung 'ganz unten' bringt keine relevante Verbesserung. Die Assembler-Funktion müsste schon größere Datensätze beabeiten, um signifikate Vorteile zu bringen.
ps:
fpc Int128Rec