@Shmia: Einen Vorteil kann ich daraus nicht erkennen
Aber Deine Funktion liefert Delphi/Windows bereits ohne den Assemblerteil:
QueryPerformanceCounter
Vergleiche mal die Werte, Du wirst sehen, daß die immer sehr ähnlich sind - halt nur ein paar CPU-Ticks auseinander
...

...