Ich habe eine
XML-Datei mit folgenden Inhalt (Beispielhaft).
XML-Code:
<?
xml version="1.0" encoding="UTF-8" ?>
<Test>
<Element>Test à‚°</Element>
<Element>Test °</Element>
</Test>
Jedoch ist nach meinem Verständnis (und des von meinem
Parser (OpenXML)) die erste Text im Element-Tag fehlerhaft Codiert. Diverse
XML-Testsseiten sind auch dieser Meinung. IE stört sich nicht daran aber Firefox bemängelt ebenfalls diese Codierung.
Meine Vermutung. Beim dekodieren dieser nicht Well Formed-Angabe kommen z.B. der IE auf einen
Unicode-Wert von #$E00B0 und "erleidet" einen WORD-Overflow, so das dann der korrekte
Unicode-Wert #$00B0 herauskommt.
Gibt es eine
XML-UTF8-Codierungsregel die diese Angabe erlaubt? Die Utf8ToUnicode-Funktion in System.pas codiert die Daten ebenfalls so falsch, da es ein Abschneiden von 32-Bit nach 16-Bit erleidet.
Windows Vista - Eine neue Erfahrung in Fehlern.