AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Sonstige Fragen zu Delphi Delphi Windows 10: Unicode UTF-8 Einstellung verwenden
Thema durchsuchen
Ansicht
Themen-Optionen

Windows 10: Unicode UTF-8 Einstellung verwenden

Ein Thema von Scurra · begonnen am 7. Apr 2020 · letzter Beitrag vom 9. Apr 2020
Antwort Antwort
Redeemer

Registriert seit: 19. Jan 2009
Ort: Kirchlinteln (LK Verden)
1.116 Beiträge
 
Delphi 2009 Professional
 
#1

AW: Windows 10: Unicode UTF-8 Einstellung verwenden

  Alt 7. Apr 2020, 21:08
Problem könnte sein, dass es zwar RawByteString gibt, aber kein RawByteChar. Man kann es auch nicht analog mit Codepage $FFFF deklarieren. Jetzt könnte man sich fragen, was rbs: RawByteString[4] wäre und was konvertiert wird, wenn man Stream.Read(rbs[1], 4); aufruft.
Außerdem kann man sich fragen, was passiert wenn man const Header: RawByteString = '‰PNG'; deklariert.
Und die beiden Geschichten kann man jetzt noch mit den beiden Zuständen der Delphi-Referenz durchsuchenHIGHCHARUNICODE-Direktive probieren.

Mich wundert übrigens, dass Stream.Read(name, 4); geht und das nicht Stream.Read(name[0], 4); heißen muss. Aber gut, das wäre einem anders um die Ohren geflogen.
Janni
2005 PE, 2009 PA, XE2 PA
  Mit Zitat antworten Zitat
Benutzerbild von Uwe Raabe
Uwe Raabe
Online

Registriert seit: 20. Jan 2006
Ort: Lübbecke
11.629 Beiträge
 
Delphi 12 Athens
 
#2

AW: Windows 10: Unicode UTF-8 Einstellung verwenden

  Alt 8. Apr 2020, 09:34
Mich wundert übrigens, dass Stream.Read(name, 4); geht und das nicht Stream.Read(name[0], 4); heißen muss.
Das geht deswegen, weil name ein statisches Array ist und damit name und name[0] auf denselben Speicherbereich zeigen.
Delphi-Quellcode:
type
  TChunkName = array [0..3] of AnsiChar;
Uwe Raabe
Certified Delphi Master Developer
Embarcadero MVP
Blog: The Art of Delphi Programming
  Mit Zitat antworten Zitat
Scurra

Registriert seit: 19. Jan 2015
81 Beiträge
 
Delphi 10.3 Rio
 
#3

AW: Windows 10: Unicode UTF-8 Einstellung verwenden

  Alt 9. Apr 2020, 07:08
Danke erst einmal für die zahlreichen Reaktionen

Zitat:
Ich würde daher meinen, dass du das problem löst, indem du diese Option abdrehst +ü wartest, bis MS das gefixt hat.
Die Option ist nicht auf meinem Rechner aktiv sondern auf den potententiell Tausenden unserer Software-Nutzer. Warten ist für uns leider auch keine Option.

Zitat:
Einfach diese Bytes in ein Byte-Array schreiben und vergleichen.
So habe ich es jetzt gelöst. Bleibt nur zu hoffen, dass es sonst keine Stellen im Code von uns oder von unseren eingebundenen Komponenten gibt, die solche Dinge mit Strings machen.

Zitat:
Dein String '‰PNG' wird als Unicode interpretiert und dort ist das Promillezeichen U+2030.
Bevor die Software mit Unicode kompiliert wurde, wurde der String vermutlich mit Windows-1252 kodierung gespeichert, sodass dort 0x89 stand.
Kann mir noch einmal jemand genau erklären, was da Schritt für Schritt passiert, angefangen beim Speichern der .pas Datei bis hin zur falschen Interpretation auf dem Client-Rechner? Für mich ist denke ich jetzt der Zeitpunkt gekommen, an dem ich mich ausführlich mit Zeichenkodierungen beschäftigen muss und auch möchte, denn wenn man mal beginnt, sich mit dem Thema auseinanderzusetzen, ist es ganz interessant, wie aus ein paar Bytes ein lesbarer Text wird und umgekehrt.

Für alle, die auf dem Gebiet ebenso blutige Neulinge sind wie ich: Hier gibt es eine meiner Meinung nach schöne Einführung in die Grundlagen der Zeichensätze und Zeichenkodierungen: hier. Im Prinzip könnte man sagen, dass ich mich aktuell auf diesem Wissensstand befinde, wobei ich inzwischen schon viel mit meinen Kollegen über das Thema diskutiert habe. Falls jemand hier andere gute Links o. ä. hat, gerne her damit

Also mein bisheriges Verständnis reicht soweit:
1. Ich speichere den String '‰PNG' in der .pas-Datei. Beim Speichern verwendet die IDE die Kodierung, die in meinem System eingestellt ist, also wahrscheinlich die ANSI-Kodierung mit Codepage Windows-1252 für westeuropäische Sprachen. In der .pas-Datei steht dann das Byte 89 (hex).
2. Bei der Kompilierung auf unserem Build-Server (Windows) wird die 89 (hex) (wieder über die ANSI-Kodierung mit Codepage Windows-1252) als das Unicode-Zeichen U+2030 interpretiert.

Ab hier wäre es für mich Rätselraten, wie es weiter geht.
3. Wie wird der String beim Kompilieren in die .exe-Datei eingebettet?
4. Wie interpretiert der Client das Zeichen in der .exe-Datei (abhängig von der Unicode UTF-8 Einstellung?)?
5. Wie wird der Beginn der .png-Datei beim Kunden-Rechner ausgelesen (evtl. auch abhängig von der Unicode UTF-8 Einstellung?)?

Geändert von Scurra ( 9. Apr 2020 um 08:51 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 11:19 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz