Thema: Delphi Probleme mit UTF-8

Einzelnen Beitrag anzeigen

xaromz

Registriert seit: 18. Mär 2005
1.682 Beiträge
 
Delphi 2006 Enterprise
 
#6

Re: Probleme mit UTF-8

  Alt 7. Mär 2007, 08:48
Hallo,
Zitat von Ydobon:
Ganz so automatisch ist es nicht, LoadFromFile erwartet immer eine UTF-16 Datei.
Doch, es geht so automatisch. Die Klasse TntStrings ruft in der Methode "LoadFromFile" die Methode "AutoDetectCharacterSet" auf, welche das BOM auswertet. Wenn kein BOM vorhanden ist, geht diese Methode von ANSI aus.

Übrigens lässt sich UTF16 zumindest bei Inhalt in westlicher Sprache wesentlich leichter erkennen als UTF8 (nämlich wegen der NULL-Zeichen). Wenn bei einer UTF8-codierten Datei nur der letzte von einer Million Buchstaben codiert ist, muss die gesamte Datei geparst werden. Und vielleicht sollen da ja genau die zwei Bytes stehen und es ist gar nicht codiert. Insofern ist ein BOM schon nützlich.

Gruß
xaromz
I am a leaf on the wind - watch how I soar
  Mit Zitat antworten Zitat