Danke für deine Antwort
Die erste Variante ändert nix: Selbst mit ordentlichem
XML-Header kommt der Encoding-Fehler.
Der zweite Vorschlag bringt etwas Besserung, allerdings erhalte ich später dann die Meldung
Zitat von
himXML:
EXMLException (TXMLNodeList.Add):
text node can't constain subnodes.
wenn ich versuche, auf einen Knoten zuzugreifen.
Ich denke es hängt damit zusammen, das himXML bei der Zuweisung an .TExt davon ausgeht, dass es wirklich nur Text ist, und somit diesen nicht weiter parst.
Ich habe auch probiert, statts .Text das .XMLText zum zuweisen zu verwenden, doch dann bekomme ich den Fehler
Zitat von
himXML:
EXMLException (TXMLFile.ParsingTree):
unexcepting end of data - not all opened tags are closed
error at byte position 11.498 ("#000D#000A " on line 75)
wobei der zugewiesene String wohlgeformtes
XML ist.
Als Information:
Die Quelldaten habe ich mit zuvor als XHTML-Datei aus dem Internet geladen, und bereits das genauer zu analysierende <div> extrahiert. Das heißt ich habe ein <div> als Wurzelknoten im String, was dann natürlich alles mögliche noch enthält. Der extrahierte Code ist dabei gültiges XHTML, sollte also keine Probleme geben.
Das Dokument liegt dabei als UTF-8 vor, und ich lade es mittels IdHTTP.Get in einen String. Nach ein paar String-Operationen (Extrahieren des gewünschten divs) will ich diesen nun als
XML interpretieren lassen um ihn weiter analysieren zu können (wird sonst mot Pos/PosEx etwas mühselig ^^).
(Btw: Habe ich schon erwähnt, dass ich Delphi2009 unter Windows7 verwende? Keine Ahnung, ob das irgendwie Auswirkungen hat, Delphi2009 wird laut erstem Post auf jeden Fall unterstützt, Windows7 laut Seite 5 des Threads oder so auch.)