Gibt es irgendeine Möglichkeit, um in einem MultiByte-String zu erkennen, ob 2 oder mehr Zeichen zusammenhängen.
Ich benötige dieses für eine verteilte Verarbeitung von Texten
und da müßte ich zwingend erkennen können, ob das letze Zeichen im Puffer ein Zeichen eines MultiByte-Verbundes ist und ob somit noch ein bissl Text nachgeladen werden müßte.
Ich würde mich da ungern auf Satz-, Steuerzeichen oder Wortanfänge verlassen.
(Aktuell suche ich Zeilenübergänge, aber das ist auch blöd, weil ich dann doppelt suchen müßte oder die Puffergrößen stark schwanken können, als wenn ich da blos das letzte Bytes/Zeichen prüfe und im Notfall
nur noch ein paar Bytes mehr nachladen bräuchte)
Im Grunde benötige ich dieses aber in Verbindung mit
TEncoding, weswegen
IsDBCSLeadByteEx schon wegfallen würde, da ich irgendwie keine CodePage aus dem TEncoding auslesen kann.
Und bei UTF-8 (CP_UTF8) funktioniert IsDBCSLeadByteEx eh nicht.
[edit]
hab grad mitbekommen, daß TMBCSEncoding intern die CodePage kennt, aber irgendwer so besch***t war und diese nicht nach außen freigibt.
(nichtmal über Class-Helper oder Ableitungen kommt man da ran)