Einzelnen Beitrag anzeigen

Benutzerbild von Bernhard Geyer
Bernhard Geyer

Registriert seit: 13. Aug 2002
17.197 Beiträge
 
Delphi 10.4 Sydney
 
#14

Re: Deppenfrage: Wie sieht UTF-8 aus?

  Alt 2. Okt 2007, 13:39
Zitat von alzaimar:
Nur, wenn ich den BOM nicht wegschnipple, dann ....
Zitat von Das Exception-Fenster:
The data at the root level is invalid. Line 1, position 1, Zeile:1
Der BOM gehöhrt ja auch nicht zum XML-Definierten Bereich deiner Datei und ist primär auch nur eine MS-Ausgeburt.
Ein Parser arbeitet ja grundsätzlich erst mal mit Stream. Und die ersten Bytes die er vorgesetzt bekommen muß sind <?xml version="1.0". Wenn Du nun einen BOM in deiner Datei hast so muß entweder dein Parser dies berücksichtigen das hier noch 3 Bytes kommen wenn die Datei mit diversen MS-Tools (Notepad) bearbeitet wurde und sie ignorieren denn nach XML beginnt ja erst mit der coding-Angabe wie die Datei interpretiert werden muss. Und wenn der BOM vorhanden ist müßten die Datei erstmal komplett "ent-utf8" werden um dann den Ergebnisstream dem Parser zu übergeben.

Ich hab mal ein paar Dateien angehängt. Einfach mal z.B. mit IE6/7, Firefox, MS Notepad 2007, ... ausprobieren. Da kann man nur sagen: Danke, Microsoft.
Angehängte Dateien
Dateityp: xml test-utf8-utf8_121.xml (85 Bytes, 6x aufgerufen)
Dateityp: xml test-utf8-iso_148.xml (90 Bytes, 3x aufgerufen)
Dateityp: xml test-iso-utf8_145.xml (82 Bytes, 5x aufgerufen)
Dateityp: xml test-iso-iso_158.xml (84 Bytes, 3x aufgerufen)
Windows Vista - Eine neue Erfahrung in Fehlern.
  Mit Zitat antworten Zitat