Zitat von
marabu:
wirklich? Oder wolltest du
Unicode anstelle von UTF-16 schreiben - 4 byte characters nennt der Standard doch eigentlich UTF-32...
Nene, ist schon so gemeint.
http://www.unicode.org/faq/utf_bom.html#37
Was du unterschlägst sind die sog. "Surrogates" (Zeichen, die aus einer Kombination von einem "Leading 'Byte'" und dem Verweis in die "erweiterte" Zeichentabelle bestehen).