Einzelnen Beitrag anzeigen

Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.056 Beiträge
 
Delphi 12 Athens
 
#8

Re: TidHTTP.Get um TXMLDocument zu füllen

  Alt 13. Jan 2010, 18:14
Zitat von nahpets:
wenn ich die Datei direkt mit Indy hole (ohne irgendeinen Browser...) bekomme ich kein UTF-8 sondern ANSI (1 Byte pro Zeichen). Die A0 ist da aber auch drin enthalten.
Wenn eine Datei kein BOM und auch keine Kodierung ( <?xml encoding="..." ?> ) enthält, dann wird es standardmäßig als UTF-8 angesehn ... so schreiben es die XML-Spezifikationen vor.

Und demnach ist die A0 ein ungültiges Zeichen.

Darum auch meine Frage,
Zitat:
Habt ihr mal mitbekommen, wie/ob dort Umlaute kodiert sind?
denn so wie es aussieht, könnte es ein Implementierungsfehler seitens Google sein.
lade mal bitte Berlin runter http://www.google.de/ig/api?weather=Berlin - dort ist grad ein ö drinnen

ps: himXML kann ungültige Zeichen "ignorieren" (xoChangeInvalidChars ist standardmäßig sogar schon gesetzt und wandelt alles Ungültige in ein Leerzeichen um)

Wie gesagt, wenn kein BOM und kein <?xml ?> enthalten ist, dann setze einfach ein entsprechendes <?xml ...?> für einen ANSI-Kodierung davor.
Neuste Erkenntnis:
Seit Pos einen dritten Parameter hat,
wird PoSex im Delphi viel seltener praktiziert.
  Mit Zitat antworten Zitat