AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Versteht hier jemand Unicode?

Ein Thema von Luckie · begonnen am 18. Dez 2010 · letzter Beitrag vom 25. Dez 2010
 
Benutzerbild von Assarbad
Assarbad

Registriert seit: 8. Okt 2010
Ort: Frankfurt am Main
1.234 Beiträge
 
#20

AW: Versteht hier jemand Unicode?

  Alt 24. Dez 2010, 20:20
So, ich habe meinen Unicode Artikel fertiggestellt: UTF für die Westentasche. Wenn ihr keine Korrekturen mehr habt, dann veröffentliche ich ihn auch hier als Einführungstutorial.
"Wikipeia"? Ganz unten in deinem Artikel

Hyroglyphen schreibt man mit "ie": Hieroglyphen.

"auf acht Bit erweiter" -> "auf acht Bit erweitert"

Der zweite Absatz klingt als sei ASCII erweitert worden, was aber nicht stimmt. ASCII waren und sind exakt 7bit.

Außerdem wäre es lesbarer wenn die Zahlen mit Ziffern geschrieben würden, zumindest bei Computerthemen.

"128 bis 256" -> "128 bis 255"

"Dies Kodierung wurde" -> "Diese Kodierung wurde"

Statt Byte würde ich die Bezeichnung Oktett benutzen, oder eine Definition für Byte geben. Denn ein Byte ist nicht immer 8bit. Und für diese Diskussion ist es relevant.

"Fangt das Byte" -> "Fängt das Byte"

"immer mit einer null" -> "immer mit einer Null"

"einzelne Zeichen mit mit zwei mal" -> "einzelne Zeichen mit zwei mal"

Bei dem zitierten Text solltest du den Permalink (zur aktuellen Version) angeben.

Habe sicher noch was übersehen.

Zitat:
Ursprünglich wurden Zeichen im sogenannten ASCII (American Standard Code for Information Interchange) Format kodiert.
Greift zu kurz, da hier genau das passiert, was schon immer passierte: Konzentration auf den Bedarf des westlichen Kulturkreises unter Ausschluß des nahen oder fernen Ostens, Afrikas usw. Wie westlich orientiert es ist, sieht man an der Tatsache, daß in der "westlichen Codepage" ein einziges Zeichen für Türkisch fehlte, während Isländisch - eine Sprache von damals vielleicht 250.000 Sprechern - voll vertreten ist/war.

Übrigens kann ich nicht zustimmen, daß UTF-16 die komplizierteste Kodierung ist. Worauf stützt du diese Aussage?

Eine sorgfältigere Begriffswahl wäre angesagt:
* "code unit" (1 Oktett, 2 Oktette, 4 Oktette)
* "code point"
* "glyph"
* "grapheme"
* "character"

Alles diese Begriffe stehen bei der Diskussion von Unicode in einer Beziehung, aber wenn man sie korrekt einsetzt und jeder im Bilde ist, kann man Verwirrung leichter vermeiden als wenn man bspw. "character" (Zeichen) für mehrere dieser Begriffe verwendet.


Frohes Fest.
Oliver
"... aber vertrauen Sie uns, die Physik stimmt." (Prof. Harald Lesch)
  Mit Zitat antworten Zitat
 


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 10:58 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz