Hast du die Warnungen des Compiler deaktiviert? Denn "i" ist nach der Schleife undefiniert. Und nur weil der aktuelle Compiler hier die Schleife nicht optimiert, funktioniert das. Zukünfige Compiler könnten da aber schon mal Hand ansetzen. Eine C-for-Schleife muss nicht immer unbedingt in eine Pascal-for-Schleife umgewandelt werden.
Hast du auch die $STRINGCHECKS deaktiviert? Denn die fressen die Performance auf. Da ist dein "ein JMP gespart" belanglos, was es ohnehin dank Jump-Optimierung seitens Delphi bereits ist. Delphi erkennt, dass du mit "break" auf ein "goto" springst, und leitet den Sprung direkt weiter ohne den Zwischenstopp. (Einfach mal den Assemblercode im CPU-View anschauen).
Zudem könnte man die Subtraktion aus der inneren Schleife nehmen, indem man auf zwei PChar umstellt und beide mit
Dec() rückwärts laufen lässt ("- k"). Und wenn man schon dabei ist, kann man auch gleich noch die if-Abfrage in der inneren Schleife entfernen und dafür die for-Schleifen-Grenze anpassen.
Außerdem kann man sich den j=0 Durchlauf sparen, da dort für all i (und k) überhaupt nichts geschieht, außer ein vollständiger unnötiger i-Durchlauf.