![]() |
Textdatei utf8-kodiert speichern!
Hallo zusammen,
ich habe eine Frage: wie kann ich erzwingen (unabhängig vom Inhalt), dass ein String in eine UTF-8 codierte Textdatei gespeichert wird. Ich habe bereits mit Utf8Encode(mystr), dann write(f, mystr) versucht, doch die Textdatei wird immer als ANSI gespeichert. Für Eure Hilfe bedanke ich mich im voraus! Grüße Robert |
Re: Textdatei utf8-kodiert speichern!
Wie siehst du das es nur ANSI wäre?
Doch etwa nicht mit Notepad? Für Notepad benötigst du nocht den Byte Order Mark für eine UTF8-Codierte Datei. |
Re: Textdatei utf8-kodiert speichern!
Hallo Bernhard,
doch, im Notepad! :) Und diesen Byte Order Mark für eine UTF8-Codierte Datei bekomme ich wie hin? Übrigens, Danke für die schnelle Antwort! Robert |
Re: Textdatei utf8-kodiert speichern!
Hat sich erledigt!
Schöne Grüße Robert |
AW: Textdatei utf8-kodiert speichern!
Verdammt! Und genau hier hätte ich gerne gewusst, wie sich das erledigt hat. :evil:
Ich stehe vor einem sehr ähnlichen Problem. Ich bin im D2007 und hantiere mit UTF8Strings, die speicher ich dann irgendwann in ein TextFile (evtl. hier schon der Fehler?). Alles sieht im Editor nett aus, ein third-party-tool meckert auch erstmal nicht über das Format. Sobald Umlaute ins Spiel kommen, ist aber der Ofen aus. Das Tool jammert über "Ungueltiges Byte 2 von 3-Byte-UTF-8-Sequenz." und im NotePad++ (der übrigens annimmt, das wäre "UTF8 ohne BOM", stehen statt Umlauten Sonderzeichen...:pale: Kurz gesagt: Hülfe? Sherlock |
AW: Textdatei utf8-kodiert speichern!
Du Schreibst das UTF-8-BOM in die Datei und hinten drann deinen als UTF-8 kodierten Text.
Ab D2009 sollte man besser den UTF8String oder den RawByteString verwenden, anstatt dem AnsiString. Du mußt aber aufpassen, denn die alten Pascal-Prozeduren ala WriteLn arbeiten ausschließlich mit ANSI (auch in den neueren Unicode-Delphis) ... UTF8 kann zwar als ANSI behandelt werden, aber man sollte aufpassen, daß es nicht irgendwo zu einer automatischen Konvertierung kommt, bei einer Zuweisung von UTF8 an ANSI. Ab D2009 hätte ich eine TStringList vorgeschlagen, welcher man das Encoding mitgeben kann. Falls alles nichts hilft, schreib den UTF8String, inkl. BOM, in einen FileStream. |
AW: Textdatei utf8-kodiert speichern!
OK, das hatte ich befürchtet. TextFile und WriteLn geht nicht mit UTF8. Dann schau ich, daß ich das in einen hübschen Stream packe.
Danke, Himitsu. Sherlock |
AW: Textdatei utf8-kodiert speichern!
Es geht schon mit UTF8.
Man muß eben nur etwas aufpassen. |
AW: Textdatei utf8-kodiert speichern!
Klar geht es, das hab ich ja gesehen, nur bei Umlauten wirds halt kriminell. Und da kann ich nicht wirklich aufpassen, bzw. das einzige wäre Umlaute umzuwandeln in ihr zweibuchstabiges Pendant. Oder was meinst Du?
Mit dem Stream stosse ich übrigens auf andere Geschichten. Ich gebe zu, ich habe bisher Texte nur als TextFiles gespeichert und TFileStream nie verwendet. Mein Versuch:
Delphi-Quellcode:
Führt zu einer unleserlichen Datei. Muss ich mit dem BOM noch was anderes anstellen? Ist das die Falsche Art den BOM einzufügen?
var ExportText : UTF8String;
myfStream : TFileStream; . . . fExpFileName := fDateiPfad + GUIDohneKlammern + '.xml'; myfStream := TFileStream.Create(fExpFileName, fmCreate); ExportText := #239 + #187 + #191 + ExportText; // Ist das ausreichend als BOM? myfStream.Write(ExportText,Length(ExportText)); Sherlock |
AW: Textdatei utf8-kodiert speichern!
Delphi-Quellcode:
// besser als explizite Unicodeangabe, also 4-stellig, damit keine Codepage in die Quere kommen kann
ExportText := #$00EF#$00BB#$00BF + ExportText; // oder gleich das korrekte Zeichen (das #$FEFF ist der Unicodemarker ... all diese Text-BOMs sind dieses Zeichen, nur eben entsprechend kodiert) ExportText := UTF8Encode(#$FEFF) + ExportText; z.B. #$0085 ist nicht #$85 ... das hatte mich mal veräppeln wollen :cry: |
AW: Textdatei utf8-kodiert speichern!
Zitat:
|
AW: Textdatei utf8-kodiert speichern!
mjustin: Das ist absolut korrekt. Nur leider scheint Delphi oder meine Unfähigkeit an der Geschichte etwas zu verwürfeln. Ich tippe übrigens auf letzteres ;)
Ich habe mir jetzt mal die entstandene Datei im Hex-Editor näher angesehen. Es scheint ein Manifest zu sein. Also wird irgendwie die Resource abgespeichert...nicht mein XML-String! :wiejetzt: Mach ich was grundsätzlich falsch mit dem Stream? Der auf Seite 1 geposteter Code ist alles, was ich mit dem StreamObjekt treibe. Sherlock |
AW: Textdatei utf8-kodiert speichern!
...und das ist des Rätsels Lösung: Der Sherlock ist dooof. :stupid:
Hier wie man es richtig macht: Das eigentliche Schreiben:
Delphi-Quellcode:
Bei der Erzeugung des ExportStrings sollte man im Übrigen immer wieder mal ein UTF8Encode einstreuen...vor allem da, wo Non-ANSI-Zeichen erwartet werden.
var DerBOM : UTF8String;
ExportText : UTF8String; . . . DerBOM := #$00EF#$00BB#$00BF; f.WriteBuffer(PAnsiChar(DerBOM)^, Length(DerBOM)); // Könnte man sicher auch in einem Rutsch machen f.WriteBuffer(PAnsiChar(exporttext)^, Length(ExportText)); // Aber so gehts definitiv...Unterschied? ZEIGER Quelle zur letztlichen Lösung (die D2009 voraussetzt, das ich nicht habe): ![]() Sherlock |
AW: Textdatei utf8-kodiert speichern!
Hi Sherlock,
noch mal zu den TextFiles. Ich bin da mittlerweile auch ein bisschen von weg, aber habe unter D2007 auch einige Jahre problemlos mit TextFiles/writeln und UTF8 gearbeitet. Codebeispiel:
Delphi-Quellcode:
Damit das reibungslos funktioniert und Delphi nicht intern irgendwas umwandelt, was ich gar nicht will, war es gut, den Text selbst ganz normal als "string" zu benutzen und erst am Ende beim writeln mit "utf8encode" umzuwandeln.
procedure Demo;
var s:string; fileH: TextFile; begin s:='Ein ü ist ein ü!'; assignFile(fileH,'egal.txt'); rewrite(fileH); writeln(fileH,utf8encode(s)); closeFile(fileH); end; Alternativ geht das gleiche auch mit TStringList, also:
Delphi-Quellcode:
Und wenn du auf Delphi >=2009 umsteigst, musst du den Code eh wieder anfassen. ;)
[...}
StrList.Add(utf8encode(s)); StrList.SaveToFile('egal.txt'); [...] |
AW: Textdatei utf8-kodiert speichern!
Grrmml...hättest Du das nicht vor 4 Stunden schreiben können? :lol:
Egal, jetzt stehen hier für zukünftige Generationen zwei Lösungen ;) :dp: Sherlock |
AW: Textdatei utf8-kodiert speichern!
Zitat:
In "zukunft" (D2009+) reicht ein
Delphi-Quellcode:
StrList.SaveToFile('egal.txt', TEncoding.UTF8);
|
AW: Textdatei utf8-kodiert speichern!
Zitat:
Und wenn das zukünftige Suchende finden, sollte aber auch noch erwähnt werden, dass beide Beispiele von mir keinen BOM schreiben. Der müsste, falls benötigt, dann noch manuell davor ergänzt werden. Bis denn Bommel |
Alle Zeitangaben in WEZ +1. Es ist jetzt 17:59 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz