Zitat von
nicodex:
UTF-16[/
url] hat auch Low/High-Surrogates, um Zeichen jenseits der BMP zu codieren (wird von Windows XP und Office unterstützt).
Hab ich denn was anderes behauptet? Bei UTF16 kann man aber beim Durchparsen des Strings die Surrogates ignorieren, da sie es keine Überschneidung mit der BMP gibt. Bei
ANSI gibt es jedoch Überschneidungen bei den Tail-Bytes. Auf mehr wollte ich (und bin ich nicht) hinaus.