![]() |
IXMLDocument und Sonderzeichen
Hi,
ich habe eine kurze Frage bezüglich Sonderzeichen und dem IXMLDocument.
Delphi-Quellcode:
Das zwischenwandeln auf WideString ist lediglich enthalten da es der späteren Einsatzumgebung entspricht (xml wird vom Hauptprogramm erzeugt und als WideString an eine dll übergeben)
procedure xmlTest();
var xml: IXMLDocument; rootNode, childNode: IXMLNode; logNode: IXMLNode; logMessage: string; logWideString: Widestring; begin logMessage := 'Test äöüß<>"&'; // write xml data xml := NewXMLDocument(); xml.Encoding := 'iso-8859-1'; xml.Options := [doNodeAutoIndent]; rootNode := xml.AddChild('result'); logNode := rootNode.AddChild('logData'); logNode.AddChild('message').Text := logMessage; logWideString := xml.XML.Text; ShowMessage(logWideString); // read xml data xml := LoadXMLData(logWideString); rootNode := xml.DocumentElement; childNode := rootNode.ChildNodes[0]; logWideString := childNode.childNodes['message'].Text; logMessage := logWideString; ShowMessage(logMessage); end; Das Erste ShowMessage gibt die Sonderzeichen alle in der korrekten XML Notation aus (< > ...) Das zweite ShowMessage hingegen verschluckt das "&" Zeichen die anderen Sonderzeichen werden korrekt angezeigt. Woran liegt das ? Die Wandlung der unerlaubten Sonderzeichen in erlaubte XML Notation funktioniert ja scheinbar. |
AW: IXMLDocument und Sonderzeichen
Warum vergisst man eigentlich immer die wichtigsten Informationen?
Ach ja, außschließlich xml.SaveToStream und xml.SaveToFile beachten das Encoding. Aber dir ist ja bestimmt noch nicht aufgefallen, daß in deinem logWideString kein Encodeing angegeben ist. (Standard ist UTF-8 und in diesem Fall von WideString natürlich UTF-16) |
AW: IXMLDocument und Sonderzeichen
Zitat:
Zitat:
Zitat:
Zitat:
Wenn ich den Messagetext im Message Fenster mit Str+C Strg+V in einem Texteditor einfüge ist das & wieder da. Zitat:
Zitat:
Verstehe nicht was damit gemeint ist ? Bei der reinen Wandlung String -> WideString -> WideString -> String dürften doch eigentlich keine Informationen verloren gehen. Zumindest sagt das die Delphi Dokumentation so. |
AW: IXMLDocument und Sonderzeichen
Testweise würde ich das Dokument mal als Datei speichern und sehen, was Notepadd++ als Kodierung erkennt: iso-8859-1 oder utf-8?
|
AW: IXMLDocument und Sonderzeichen
Hi,
Notepad++ erkennt es als iso-8859-1 Edit. Aber wenn das encoding sich wirklich nur auf xml.SaveToStream und xml.SaveToFile beziehen dürfte das ja auch keinen Unterschied machen. Was aber viel interessanter ist. Ich konnte das Problem noch weiter reduzieren. Wie es aussieht das die XML und WiderString Geschichte nicht mit dem eigentlichen Problem zu tun. Nichtmal das hier funktioniert:
Delphi-Quellcode:
Auch dabei wird das "&" nicht angezeigt. Zusätzlich ist mir noch aufgefallen das wenn das & nicht am Ende steht sondern am Anfang sprich logMessage := '&Test äöüß<>"'; dann wird im ShowMessage Fenster das T mit einem Strich drunter angezeigt.
logMessage: String;
logMessage := 'Test äöüß<>"&'; ShowMessage(logMessage); |
AW: IXMLDocument und Sonderzeichen
XML ist systemunabhängig, aber nicht alle "String"-Ausgaben sind unabhängig, sondern "absichtlich" für das jeweilige Ausgabemedium ausgelegt ... drum ist in xmldoc.xml.irgendwas der String vor D2009 immer ANSI und danach immer Unicode, da .XML eine TStringList ist.
Siehe ![]() Dazu zählen z.B. einige ältere Dialoge, wie z.B. ShowMessage, wo intern auch ein TLabel für die Anzeige genutzt wurde und bei dem man vergaß diese &-Behandlung zu deaktieren. :stupid: |
AW: IXMLDocument und Sonderzeichen
Okay vielen Dank das erklärt natürlich das gezeigte Verhalten :)
Nochmal eine Rückfrage zu folgendem Punkt: Zitat:
Delphi-Quellcode:
Ich hatte jetzt vermutet das hier das encoding benötigt wird um sicher zu gesehen das die Gegenseite sprich die dll an die der XML-String als WideString übergeben wird weiß wie die Zeichen zu interpretieren sind. (Die dll könnte ja durchaus in einer andere Programmiersprache oder einer anderen Delphi Version erstellt werden also mit anderem default Zeichensatz)
<?xml version="1.0" encoding="iso-8859-1"?>
|
AW: IXMLDocument und Sonderzeichen
Wenn der Text/String immer als Unicode (WideString aka UTF-16 oder als UTF-8) behandelt wird, dann ist das nicht nötig.
Es wäre sogar "falsch", wenn iso-8859-1 drinstünde und es dann doch als Unicode-Text gespeichert würde, drum lässt MS-XML dabei auch das Encoding weg. xmldoc.SaveToString in einen WideString/UnicodeString ist immer Unicode, genauso wie seit Delphi 2009 auch xmldoc.xml.Text . XML-Dateien, bzw. ANSI-Strings ohne Encodingangabe sind per Standard UTF-8. |
AW: IXMLDocument und Sonderzeichen
Okay vielen Dank :)
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 02:03 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz