Zitat von
nahpets:
wenn ich die Datei direkt mit
Indy hole (ohne irgendeinen Browser...) bekomme ich kein UTF-8 sondern
ANSI (1 Byte pro Zeichen). Die A0 ist da aber auch drin enthalten.
Wenn eine Datei kein BOM und auch keine Kodierung ( <?
xml encoding="..." ?> ) enthält, dann wird es standardmäßig als UTF-8 angesehn ... so schreiben es die
XML-Spezifikationen vor.
Und demnach ist die A0 ein ungültiges Zeichen.
Darum auch meine Frage,
Zitat:
Habt ihr mal mitbekommen, wie/ob dort Umlaute kodiert sind?
denn so wie es aussieht, könnte es ein Implementierungsfehler seitens Google sein.
lade mal bitte Berlin runter
http://www.google.de/ig/api?weather=Berlin - dort ist grad ein ö drinnen
ps: himXML kann ungültige Zeichen "ignorieren" (xoChangeInvalidChars ist standardmäßig sogar schon gesetzt und wandelt alles Ungültige in ein Leerzeichen um)
Wie gesagt, wenn kein BOM und kein <?
xml ?> enthalten ist, dann setze einfach ein entsprechendes <?
xml ...?> für einen
ANSI-Kodierung davor.