Delphi-PRAXiS
Seite 2 von 4     12 34      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Websiteumstellung auf UTF-8, wie geht's? (https://www.delphipraxis.net/107651-websiteumstellung-auf-utf-8-wie-gehts.html)

Matze 31. Jan 2008 12:27

Re: Websiteumstellung auf UTF-8, wie geht's?
 
@Mike: Ah ok, dann muss ich das wirklich machen.

Zitat:

Zitat von Xong
Der ANSI-Zeichensatz ist in UTF-8 enthalten!
Du speicherst also schon in UTF-8... :thumb:

Das heißt doch nicht, dass ich es als UTF-8 speichere. ;)

Irgendwan konvertiere ich die ganzen Dateien, doch Iconv ist unter Windows eine Krankheit und manuell habe ich jetzt keinen Kopf dafür. Ich melde mich dann, wenn es mal soweit ist.

Xong 31. Jan 2008 13:12

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Zitat:

Zitat von Matze
Das heißt doch nicht, dass ich es als UTF-8 speichere. ;)

Nunja. Doch!
Ein Editor kann nämlich nicht unterscheiden, ob eine Textdatei im ANSI- oder um UTF-8-Zeichensatz gespeichert wurde.
Weil ANSI eben eine Untermenge von UTF-8 ist.
Es gibt nun Editoren, die automatisch die kleinst mögliche Untermenge auswählen. (Notepad2 z.B.)

Bsp.: { 1, 65, 23423, 32, 2 }
Sind die Elemente dieser Menge Natürliche oder Ganze Zahlen?
Beides natürlich... =)
Notepad2 würde nun festlegen, dass es Natürliche Zahlen seien.
Ich würde die Ganzen Zahlen bevorzugen. Aber das ist jedem selbst überlassen.

Ich hoffe, ich konnte etwas helfen.

LG,
Xong

Matze 31. Jan 2008 13:17

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Hm ok, danke. Ich habe die relevanten Dateien nun konvertiert (in Eclipse: "Set Encoding").

Also Umlaute wie ä, ö, ü werden korrekt eingetragen und dargestellt, wenn ich das richtig sehe. Doch sobald ich chinesische zeichen wie 文字 einfüge, steht in der Datenbank nur 文字, was so auch auf der Website angezeigt wird. :?

Edit: Die DP stellt das sogar richtig dar. Daher vermute ich, muss generell ein utf8_decode kommen, auch wenn ich nicht ganz verstehe wieso. Oben fügte ich übrigens als zweites: 文字 ein.

Xong 1. Feb 2008 08:21

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Zitat:

Zitat von Matze
Edit: Die DP stellt das sogar richtig dar. Daher vermute ich, muss generell ein utf8_decode kommen, auch wenn ich nicht ganz verstehe wieso. Oben fügte ich übrigens als zweites: 文字 ein.

文 und 字 sind Entitäten. Die Zahlen, die zwischen & und ; stehen kodieren sozusagen ein Zeichen. Deshalb werden 文 und 字 auch unabhängig von der Kodierung der darstellenden Seite angezeigt (vorausgesetzt, es gibt eine Schriftart, die diese Zeichen enthält).
Bei einer echten UTF-8 Kodierung würde das Zeichen 文 Hexadezimal als E6 96 87 gespeichert werden.

Und wenn du weiterhin Probleme mit UTF-8 bzw. Datenübertragung zwischen Datenbank und Webseite haben solltest, dann wendest du dich am besten ans Selfhtml-Forum. Da sind sehr kompetente Leute.

LG,
Xong

marabu 1. Feb 2008 09:32

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Herzlich willkommen in der Delphi-PRAXiS, Xong.

Zitat:

Zitat von Xong
... Der ANSI-Zeichensatz ist in UTF-8 enthalten!
Du speicherst also schon in UTF-8...

Du meintest sicher ASCII statt ANSI, denn ASCII und nicht ANSI (CP1252) wird identisch abgebildet.

Freundliche Grüße

Xong 1. Feb 2008 09:37

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Zitat:

Zitat von marabu
Herzlich willkommen in der Delphi-PRAXiS, Xong.

Danke! =)

Zitat:

Zitat von marabu
Zitat:

Zitat von Xong
... Der ANSI-Zeichensatz ist in UTF-8 enthalten!
Du speicherst also schon in UTF-8...

Du meintest sicher ASCII statt ANSI, denn ASCII und nicht ANSI (CP1252) wird identisch abgebildet.

Nene! Ich meinte schon ANSI bzw. EASCII.

ASCII: Die ersten 128 Unicode-Zeichen.
ANSI: Die ersten 256 Unicode-Zeichen.

marabu 1. Feb 2008 10:51

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Hallo,

Zitat:

Zitat von Xong
...
ASCII: Die ersten 128 Unicode-Zeichen.
ANSI: Die ersten 256 Unicode-Zeichen.

bitte überprüfe das nochmal: Die Unicode Blöcke 0 und 1 (0x00-0xFF) entsprechen ISO Latin 1, die control character mit gesetztem high bit inklusive DEL (0x7F-0x9F) sind in Latin1 nicht belegt, aber ANSI (CP1252) nutzt diesen Bereich durchaus. Als Prüfstein mag das Euro-Zeichen (0x80) gelten.

EASCII ist für mich ein informelles Akronym und ich verbinde es mit dem von IBM 1981 auf dem Ur-PC benutzten Extended ASCII (8 bit statt 7 bit). EASCII ist heute CP437. Kennst du eine andere Definition, vorzugsweise mit URL dazu?

Freundliche Grüße

Xong 1. Feb 2008 12:16

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Ich schreibe hier über ein Thema, womit ich mich eher oberflächlich beschäftigt habe.
Ich nutze UTF-8 und komme damit gut zurecht. Mit anderen Zeichensätzen musste ich mich also auch nicht großartig auseinandersetzen

Jedenfalls habe ich mich mit ANSI auf ISO 8859-1, nicht CP1252 bezogen. =)
(Die DP scheint sich auch darauf zu beziehen. Siehe DP-Akronyme)


Die Bezeichnung ANSI bzw. EASCII scheint kein expliziter Standard zu sein, sondern umfasst mehrere Zeichensätze.

Aber du hast wahrscheinlich recht und Matze nutzt im Moment ISO-8859-1 oder CP1252 und damit keine Untermenge von UTF-8.

marabu 1. Feb 2008 13:16

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Dafür, dass Zeichensätze nicht zu deiner Spezialität gehören, hast du aber bemerkenswert klarsichtig beraten.

Ich freue mich auf weitere Beiträge von dir.

Schönes Wochenende

cruiser 2. Feb 2008 03:33

Re: Websiteumstellung auf UTF-8, wie geht's?
 
Zum Thema... um MySQL UTF-8 beizubringen (so wie ich es wollt) hab ich der Connection erst mal sagen müssen, dass sie überhaupt im UTF-8 Modus arbeiten soll.

Erst dannach ging alles wie gewünscht:

Code:
// mysqli Object
$DB->set_charset("UTF-8");

// proceduraler ansatz
mysql_set_charset("UTF-8", $dbconn);
Wenn alle Stricke reissen notfalls eine Query:

Code:
mysql_query('SET CHARACTER SET "UTF-8"', $dbconn);


Alle Zeitangaben in WEZ +1. Es ist jetzt 22:18 Uhr.
Seite 2 von 4     12 34      

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz