Ich befürchte ein Fehler ist, dass es nur für \u0000 bis \u00FF funktioniert.
Wenn ich raten soll fehlt dir wenigstens \u0100 bis \uFFFF ... und wenn ich mich recht erinnere
hießen die Dinger "Multibyte-Zeichensätze", also könnte auch "\uFF1234" möglich sein, oder!?
Nein, gibt es nicht. Der Zeichensatz von JavaScript (intern und von \u-Escapes) ist UTF-16, der von Windows ist UTF-16 und der von WideString ist auch UTF-16. Ist zwar ein MBCS, interessiert aber nicht, da Quell- und Zielzeichensatz identisch sind. Da es anders als in
HTML kein Abschlusszeichen gibt, muss die Länge der Sequenz von vornherein klar sein. Nach \u kommen immer vier Zeichen. C kennt \U mit acht Zeichen, JavaScript kennt das nicht: In Firefox gibt '\U00010400' keine sinnvolle Ausgabe, '\uD801\uDC00' hingegen schon. Somit ist es unmöglich, Zeichen als UCS-4BE (aka UTF-32BE) auszudrücken.
Der Thread ist doch eigentlich durch:
- Dem TE wurde ans Herz gelegt, eine richtige Bibliothek zu verwenden.
- Ich habe einen funktionierenden und korrekten Algorithmus gepostet.
Da muss man jetzt doch nicht weiter mit Halbwissen irritieren.