![]() |
AW: Versteht hier jemand Unicode?
Also, ich habe innerhalb des 16-Bit Bereichs, dem BMP, wo die Zeichen mit 16-Bit kodiert sind einen Bereich, der reserviert ist. Innerhalb dieses Bereiches werden die Zeichen mit zwei mal 16-Bit kodiert. Wobei bei diesen beiden 16-Bit die oberen sechs Bits zur Kennzeichnung dienen, dass es sich um Zeichen in diesen Reservierten Bereich handelt.
Stimmt die Erklärung des Prinzips soweit? Wie die die Kodierung im Einzelnen zu Stande kommt, ist erst mal nicht so wichtig. Ich will nur wissen, ob ich das Prinzip verstanden habe. |
AW: Versteht hier jemand Unicode?
Zitat:
Zitat:
|
AW: Versteht hier jemand Unicode?
Zitat:
|
AW: Versteht hier jemand Unicode?
Ja.
x wäre dann das High-Surrogate und y das Low-Surrogate. |
AW: Versteht hier jemand Unicode?
Ich habe es jetzt so formuliert:
Zitat:
![]() |
AW: Versteht hier jemand Unicode?
Zitat:
Hyroglyphen schreibt man mit "ie": Hieroglyphen. "auf acht Bit erweiter" -> "auf acht Bit erweitert" Der zweite Absatz klingt als sei ASCII erweitert worden, was aber nicht stimmt. ASCII waren und sind exakt 7bit. Außerdem wäre es lesbarer wenn die Zahlen mit Ziffern geschrieben würden, zumindest bei Computerthemen. "128 bis 256" -> "128 bis 255" "Dies Kodierung wurde" -> "Diese Kodierung wurde" Statt Byte würde ich die Bezeichnung Oktett benutzen, oder eine Definition für Byte geben. Denn ein Byte ist nicht immer 8bit. Und für diese Diskussion ist es relevant. "Fangt das Byte" -> "Fängt das Byte" "immer mit einer null" -> "immer mit einer Null" "einzelne Zeichen mit mit zwei mal" -> "einzelne Zeichen mit zwei mal" Bei dem zitierten Text solltest du den Permalink (zur aktuellen Version) angeben. Habe sicher noch was übersehen. Zitat:
Übrigens kann ich nicht zustimmen, daß UTF-16 die komplizierteste Kodierung ist. Worauf stützt du diese Aussage? Eine sorgfältigere Begriffswahl wäre angesagt: * "code unit" (1 Oktett, 2 Oktette, 4 Oktette) * "code point" * "glyph" * "grapheme" * "character" Alles diese Begriffe stehen bei der Diskussion von Unicode in einer Beziehung, aber wenn man sie korrekt einsetzt und jeder im Bilde ist, kann man Verwirrung leichter vermeiden als wenn man bspw. "character" (Zeichen) für mehrere dieser Begriffe verwendet. Frohes Fest. |
AW: Versteht hier jemand Unicode?
Danke fürs Lesen, werde ich die Tage überarbeiten.
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 16:23 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz