AGB  ·  Datenschutz  ·  Impressum  

Nützliche Links
Thema durchsuchen

DELPHI & TInifiles ASCII und UTF16

Ein Thema von bernhard_LA · begonnen am 4. Jul 2024 · letzter Beitrag vom 4. Jul 2024
Antwort Antwort

Registriert seit: 8. Jun 2009
Ort: Bayern
1.138 Beiträge
Delphi 11 Alexandria

DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 11:46
Delphi und TIni file kann ja nur ASCII und UTF 16 ohne BOM ( ) . Wir nutzen noch oft *.ini files. Wenn unsere Kunden mit anderen Editoren die *.ini file bearbeiten kommt es vor , daß das encoding verändert wird.
Aktuell habe ich diese 2 Funktionen angedacht :

checken or im Richtigen format, falls nein die DAtei im richtigen encosing neu schreiben.
Gibt es hierfür bessere Lösungsansätze ?


Detection ASCII UTF-16:

function IsAsciiOrUtf16WithoutBOM(const FileName: string): Boolean;
  FileStream: TFileStream;
  Buffer: TBytes;
  i: Integer;
  NumRead: Integer;
  Result := True; // Assume the file is ASCII or UTF-16 without BOM

  FileStream := TFileStream.Create(FileName, fmOpenRead or fmShareDenyNone);
    SetLength(Buffer, FileStream.Size);
    NumRead := FileStream.Read(Buffer[0], FileStream.Size);

    // Check the first few bytes for BOMs
    if NumRead >= 2 then
      if (Buffer[0] = $FF) and (Buffer[1] = $FE) then
        Exit(False); // UTF-16 Little Endian BOM
      if (Buffer[0] = $FE) and (Buffer[1] = $FF) then
        Exit(False); // UTF-16 Big Endian BOM

    // Check for non-ASCII characters, which could disqualify the file as ASCII
    for i := 0 to High(Buffer) do
      if Buffer[i] > 127 then
        Exit(False); // Non-ASCII character found

Conversion to UTF-16:

function Convert2UTF16(const FileName: string): Boolean;
  FileContent: TBytes;
  Encoding: TEncoding;
  Result := False; // Default to False

    // Read the file content into a byte array
    FileContent := TFile.ReadAllBytes(FileName);

    // Check if the file begins with the UTF-16 Byte-Order Mark (BOM)
    if (Length(FileContent) >= 2) then
      if (FileContent[0] = $FF) and (FileContent[1] = $FE) or
         (FileContent[0] = $FE) and (FileContent[1] = $FF) then
        Result := True; // It's UTF-16
        Exit; // No need to convert

    // Convert to UTF-16
    Encoding := TEncoding.Unicode; // Default to little endian UTF-16
    FileContent := TEncoding.Convert(TEncoding.Default, Encoding, FileContent);

    // Save the UTF-16 content back to the file, including BOM
    TFile.WriteAllBytes(FileName, Encoding.GetPreamble + FileContent);

    Result := True; // Successfully converted to UTF-16
    // Handle exceptions (e.g., file not found, access denied)
    // You can customize the error handling as needed

Geändert von bernhard_LA ( 4. Jul 2024 um 12:00 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Olli73

Registriert seit: 25. Apr 2008
Ort: Neunkirchen
774 Beiträge

AW: DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 11:57
Hast du Mal TMemIniFile probiert?
  Mit Zitat antworten Zitat
Benutzerbild von Gausi

Registriert seit: 17. Jul 2005
901 Beiträge
Delphi 11 Alexandria

AW: DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 12:37
Eine Heuristik zur Erkennung der Codierung kann nie 100%ig funktionieren - und nichts anderes versuchst du hier ja. Besser wäre es imho, für die Ini-Datei ein klar definiertes Format anzugeben. Sinnvoll wäre imho UTF-8 und die Verwendung von TMemInifile im Code.

Dann bringst du glaube ich auch ANSI und ASCII durcheinander. Die TIniFiles unterstützen afaik durchaus mehr als ASCII - Umlaute sind z.B. kein Problem, solange die Ini-Datei nicht auch auf anderen Systemen mit anderen Ländereinstellungen gelesen wird. Deine Funktion IsAsciiOrUtf16WithoutBOM macht dann auch nicht das, was sie soll, denn mit
if Buffer[i] > 127 then
  Exit(False); // Non-ASCII character found
wird z.B. bei so einer Ini (die als UTF-16 ohne BOM gespeichert wird)
trotzdem false zurückgeliefert, weil das "ö" als $F6 $00 kodiert wird - und $F6 ist größer als 127.
Being smart will count for nothing if you don't make the world better. You have to use your smarts to count for something, to serve life, not death.
  Mit Zitat antworten Zitat
Benutzerbild von himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.336 Beiträge
Delphi 12 Athens

AW: DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 14:47
Ein UTF-8 mit BOM hat, selbst wenn es nur ASCII-Zeichen im Text gibt, dennoch das BOM als Unicodezeichen #$FEFF zu Beginn.
Bei UTF-16 jeweils entsprechend der ByteReihenfolge, aber auch die 3 BOM-Bytes des UTF-8 sind eigentlich dieses #$FEFF (nur als UTF-8 kodiert).
Ein Therapeut entspricht 1024 Gigapeut.
  Mit Zitat antworten Zitat
Antwort Antwort


Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 14:26 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz