![]() |
XML mit UTF-8 encoded in nem Editor darstellen
Hi,
Ich habe folgende XML-Datei
Code:
Alles klar: UTF-8 kodierte ASCII-Datei. Wenn ich die mit dem IE/FF, Notepad++ oder sonstwem öffne, sehe ich genau das oben angezeigte, also eben die UTF-8 kodierten Zeichen. Is ja klar, die XML-Datei enthält ja keinen BOM.
<?xml version="1.0" encoding="UTF-8"?>
<Sample>Rückwärts</Sample> Mit welchem Tool schaffe ich es, das die XML-Datei gelesen und das "encoding" Attribut korrekt angewendet wird? Ziel: Ich möchte ohne BOM folgendes sehen:
Code:
<?xml version="1.0" encoding="UTF-8"?>
<Sample>Rückwärts</Sample> |
AW: XML mit UTF-8 encoded in nem Editor darstellen
Zitat:
Notepad ++ zeigt bei mir auch korrekt "UTF-8 ohne BOM" an, wenn ich das Dokument <?xml version="1.0" encoding="UTF-8"?> <Sample>Rückwärts</Sample> öffne, und es steht lesbar der Text "Rückwärts" im Editor. Nachtrag: Auch mit ShowMessage(UTF8Decode('Rückwärts')); kann man es leicht testen es ist eine korrekte UTF-8 Codierung. |
AW: XML mit UTF-8 encoded in nem Editor darstellen
Wenn man hier etwas postet, kommt man selbst drauf.
Der XML-String wird UTF-8 kodiert und dann nochmals UTF-8 kodiert gespeichert, nur wo-frag ich mich gerade (C# code) edit... thema erledigt.... C# speichert von sich aus als UTF-8 und kodiert also nochmals... Na ja.. Wo sitzt das größte Problem?.. :mrgreen: |
AW: XML mit UTF-8 encoded in nem Editor darstellen
Zitat:
"Text"-Dateien ohne BOM sind standardmäßig ANSI und werden in der Standard-CodePage des Systems ausgewertet. "XML"-Dateien sollten sowieso keine BOMs enthalten und wenn weder BOM, noch ein Encoding-Attribut (in der Processing-Instruction) angegeben ist, dann wird sie standardmäßig als UTF-8 interpretiert. Wenn man die eine XML-Datei aber mit einem "Text"-Editor öffnet, welcher nicht das enthaltene Encoding-Attribut beachtet, dann soll man sich auch nicht wundern, wenn die Datei als ANSI interpretiert wird. Es gibt einige "höherentwickelte" Text-Editoren, welche XML-Prozessoranweisungen interpretieren, sowie sich den Text ansehn, ob sie z.B. für UTF-8 typische Zeichen-/Bytekombinationen entdecken und dann dementsprechend die (vermutlich) richtige Codierung verwenden. |
AW: XML mit UTF-8 encoded in nem Editor darstellen
Zitat:
Aus Wikipedia: Zitat:
|
AW: XML mit UTF-8 encoded in nem Editor darstellen
Da Delphi noch nicht für Linux kompiliert ... ja. :stupid:
|
AW: XML mit UTF-8 encoded in nem Editor darstellen
Zitat:
Es kommt weniger darauf an, von welcher Programmiersprache aus die UTF-8 Datei erzeugt wird als dass man sich darauf einigen muss, welches Encoding verwendet wird. Wenn UTF-8 mit BOM Probleme mit anderen Anwendungen bereiten kann, die die UTF-8 Dateien ohne BOM problemlos verarbeiten könnten, würde ich eher der Empfehlung des Unicode Standards folgen und kein BOM verwenden (siehe mein Nachtrag). |
AW: XML mit UTF-8 encoded in nem Editor darstellen
Zitat:
es stellt den Dateiinhalt Rückwärts als "Rückwärts" dar. Damit zählt notepad.exe jetzt zu den höherentwickelten Editoren. Es interpretiert den Dateiinhalt nicht als ANSI, trotz fehlendem BOM... Aber ansonsten gehe ich natürlich auch davon aus, dass Windows Anwendungen bei fehlendem BOM von der aktuellen Systemeinstellung (ANSI) ausgehen - irgendein Default muss man ja haben. |
AW: XML mit UTF-8 encoded in nem Editor darstellen
Zitat:
![]() Wenns noch etwas komfortabler seins soll, den guten, alten, zwar nicht kostenlosen, aber dennoch lohnenswerten ![]() Oder, wenn du den Speicherplatz einer kompletten IDE nicht scheust, das kostenlose ![]() (und ist auch sonst ein unglaublich praktisches Tool für alle möglichen Sachen, nicht nur fürs reine Programmieren, ich wünschte, die Delphi-IDE wäre so *g*) |
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:02 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz