Einzelnen Beitrag anzeigen

Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.184 Beiträge
 
Delphi 12 Athens
 
#6

AW: IDE Dateicodierung: was sollte man da einstellen

  Alt 4. Mai 2023, 17:34
Jupp, Delphi prüft inwischen wenn ohne BOM
und auch das "neue" Notepad (Editor) prüft inzwischen
aber ...

Auch haben die es repariert, dass wenn die Datei ohne BOM geladen wurde, sie auch wieder ohne BOM gespeichert wird (XE lädt auch UTF-8 ohne BOM problemlos, aber speichert es dann oft mit BOM ab)



Frag mal die Wiki
ByteOrderMark ... eine Markierung am Dateianfang, wie die nachfolgenden Bytes kodiert sind

Es gibt ANSI (ohne BOM)
UTF-8 ohne BOM
* im Linux Standard
* im Windows meisten Standard=ANSI
* * "einige" Programme prüfen, wenn kein BOM da ist, ob es sich als UTF-8 laden lässt (ja=UTF-8 und nein=ANSI)
* * andere laden es dann oft blind als ANSI (womit dann die Umlaute nicht mehr stimmen)
UTF-8 mit BOM
UCS2 bzw. UTF-16 mit BOM (einmal sorum oder die zwei Bytes jedes Chars in anderer Reihenfolge)




Bei UTF-8 mit BOM ist klar, dass es UTF-8 ist.
Ohne BOM, kommt es drauf an, ob und wie jedes Programm reagiert.

Im Gegenzug gibt es aber auch Programme, die wollen unbedingt UTF-8, aber ohne BOM.
Das BOM ist in Wirklichkeit ein Unicode-Zeichen #$FEFF.
Auch das $EF BB BF vom UTF-8 ist die utf8-codierte Darstellung dieses $FEFF.
Jene Programme würden dann als erstes das "Zeichen" $FEFF finden und wenn sie es nicht mögen, dann knallen sie gern. (z.B. die Linux-Version der PSQL.exe des PostgreSQL)




Im Prinzip mal Emba fragen, ob sie die neue Default-Einstellung dieser IDE-Option auf UTF-8 setzen, anstatt auf ANSI.
$2B or not $2B

Geändert von himitsu ( 4. Mai 2023 um 17:42 Uhr)
  Mit Zitat antworten Zitat