Jupp, Delphi prüft inwischen wenn ohne BOM
und auch das "neue" Notepad (Editor) prüft inzwischen
aber ...
Auch haben die es repariert, dass wenn die Datei ohne BOM geladen wurde, sie auch wieder ohne BOM gespeichert wird (XE lädt auch UTF-8 ohne BOM problemlos, aber speichert es dann oft mit BOM ab)
Frag mal die Wiki
ByteOrderMark ... eine Markierung am Dateianfang, wie die nachfolgenden Bytes kodiert sind
Es gibt
ANSI (ohne BOM)
UTF-8 ohne BOM
* im Linux Standard
* im Windows meisten Standard=
ANSI
* * "einige" Programme prüfen, wenn kein BOM da ist, ob es sich als UTF-8 laden lässt (ja=UTF-8 und nein=
ANSI)
* * andere laden es dann oft blind als
ANSI (womit dann die Umlaute nicht mehr stimmen)
UTF-8 mit BOM
UCS2 bzw. UTF-16 mit BOM (einmal sorum oder die zwei Bytes jedes Chars in anderer Reihenfolge)
Bei UTF-8 mit BOM ist klar, dass es UTF-8 ist.
Ohne BOM, kommt es drauf an, ob und wie jedes Programm reagiert.
Im Gegenzug gibt es aber auch Programme, die wollen unbedingt UTF-8, aber ohne BOM.
Das BOM ist in Wirklichkeit ein
Unicode-Zeichen #$FEFF.
Auch das $EF BB BF vom UTF-8 ist die utf8-codierte Darstellung dieses $FEFF.
Jene Programme würden dann als erstes das "Zeichen" $FEFF finden und wenn sie es nicht mögen, dann knallen sie gern. (z.B. die Linux-Version der PSQL.exe des PostgreSQL)
Im Prinzip mal Emba fragen, ob sie die neue Default-Einstellung dieser
IDE-Option auf UTF-8 setzen, anstatt auf
ANSI.