AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

DELPHI & TInifiles ASCII und UTF16

Ein Thema von bernhard_LA · begonnen am 4. Jul 2024 · letzter Beitrag vom 4. Jul 2024
Antwort Antwort
bernhard_LA

Registriert seit: 8. Jun 2009
Ort: Bayern
1.137 Beiträge
 
Delphi 11 Alexandria
 
#1

DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 11:46
Delphi und TIni file kann ja nur ASCII und UTF 16 ohne BOM ( https://www.delphipraxis.net/208415-...-vs-ascii.html ) . Wir nutzen noch oft *.ini files. Wenn unsere Kunden mit anderen Editoren die *.ini file bearbeiten kommt es vor , daß das encoding verändert wird.
Aktuell habe ich diese 2 Funktionen angedacht :

checken or im Richtigen format, falls nein die DAtei im richtigen encosing neu schreiben.
Gibt es hierfür bessere Lösungsansätze ?



Delphi-Quellcode:

Detection ASCII UTF-16:

function IsAsciiOrUtf16WithoutBOM(const FileName: string): Boolean;
var
  FileStream: TFileStream;
  Buffer: TBytes;
  i: Integer;
  NumRead: Integer;
begin
  Result := True; // Assume the file is ASCII or UTF-16 without BOM

  FileStream := TFileStream.Create(FileName, fmOpenRead or fmShareDenyNone);
  try
    SetLength(Buffer, FileStream.Size);
    NumRead := FileStream.Read(Buffer[0], FileStream.Size);

    // Check the first few bytes for BOMs
    if NumRead >= 2 then
    begin
      if (Buffer[0] = $FF) and (Buffer[1] = $FE) then
        Exit(False); // UTF-16 Little Endian BOM
      if (Buffer[0] = $FE) and (Buffer[1] = $FF) then
        Exit(False); // UTF-16 Big Endian BOM
    end;

    // Check for non-ASCII characters, which could disqualify the file as ASCII
    for i := 0 to High(Buffer) do
    begin
      if Buffer[i] > 127 then
      begin
        Exit(False); // Non-ASCII character found
      end;
    end;
  finally
    FileStream.Free;
  end;
end;

Conversion to UTF-16:

function Convert2UTF16(const FileName: string): Boolean;
var
  FileContent: TBytes;
  Encoding: TEncoding;
begin
  Result := False; // Default to False

  try
    // Read the file content into a byte array
    FileContent := TFile.ReadAllBytes(FileName);

    // Check if the file begins with the UTF-16 Byte-Order Mark (BOM)
    if (Length(FileContent) >= 2) then
    begin
      if (FileContent[0] = $FF) and (FileContent[1] = $FE) or
         (FileContent[0] = $FE) and (FileContent[1] = $FF) then
      begin
        Result := True; // It's UTF-16
        Exit; // No need to convert
      end;
    end;

    // Convert to UTF-16
    Encoding := TEncoding.Unicode; // Default to little endian UTF-16
    FileContent := TEncoding.Convert(TEncoding.Default, Encoding, FileContent);

    // Save the UTF-16 content back to the file, including BOM
    TFile.WriteAllBytes(FileName, Encoding.GetPreamble + FileContent);

    Result := True; // Successfully converted to UTF-16
  except
    // Handle exceptions (e.g., file not found, access denied)
    // You can customize the error handling as needed
  end;
end;

Geändert von bernhard_LA ( 4. Jul 2024 um 12:00 Uhr)
  Mit Zitat antworten Zitat
Benutzerbild von Olli73
Olli73

Registriert seit: 25. Apr 2008
Ort: Neunkirchen
741 Beiträge
 
#2

AW: DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 11:57
Hast du Mal TMemIniFile probiert?
  Mit Zitat antworten Zitat
Benutzerbild von Gausi
Gausi
Online

Registriert seit: 17. Jul 2005
880 Beiträge
 
Delphi 11 Alexandria
 
#3

AW: DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 12:37
Eine Heuristik zur Erkennung der Codierung kann nie 100%ig funktionieren - und nichts anderes versuchst du hier ja. Besser wäre es imho, für die Ini-Datei ein klar definiertes Format anzugeben. Sinnvoll wäre imho UTF-8 und die Verwendung von TMemInifile im Code.

Dann bringst du glaube ich auch ANSI und ASCII durcheinander. Die TIniFiles unterstützen afaik durchaus mehr als ASCII - Umlaute sind z.B. kein Problem, solange die Ini-Datei nicht auch auf anderen Systemen mit anderen Ländereinstellungen gelesen wird. Deine Funktion IsAsciiOrUtf16WithoutBOM macht dann auch nicht das, was sie soll, denn mit
Delphi-Quellcode:
if Buffer[i] > 127 then
begin
  Exit(False); // Non-ASCII character found
end;
wird z.B. bei so einer Ini (die als UTF-16 ohne BOM gespeichert wird)
Code:
[Greetings]
value1=Hallöle
trotzdem false zurückgeliefert, weil das "ö" als $F6 $00 kodiert wird - und $F6 ist größer als 127.
The angels have the phone box.
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.062 Beiträge
 
Delphi 12 Athens
 
#4

AW: DELPHI & TInifiles ASCII und UTF16

  Alt 4. Jul 2024, 14:47
Ein UTF-8 mit BOM hat, selbst wenn es nur ASCII-Zeichen im Text gibt, dennoch das BOM als Unicodezeichen #$FEFF zu Beginn.
Bei UTF-16 jeweils entsprechend der ByteReihenfolge, aber auch die 3 BOM-Bytes des UTF-8 sind eigentlich dieses #$FEFF (nur als UTF-8 kodiert).
Neuste Erkenntnis:
Seit Pos einen dritten Parameter hat,
wird PoSex im Delphi viel seltener praktiziert.
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:20 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz