![]() |
2-Byte-Characters lesen/ausgeben (Big Endian)
Hallo zusammen,
in der Datei, die ich mit einem TFileStream auslesen will, stehen Multibyte-/Unicode-Strings. D.h. alle Zeichen werden mit zwei Bytes kodiert. D.h. ich habe zum Beispiel folgenden Text in der Datei stehen (Hex-Code):
Code:
Die ersten vier Bytes geben mir die Länge des Strings an (i.e. 5 Zeichen). Dann folgen 10 Bytes (5 * 2 Bytes), die ich auslesen will.
00 00 00 05 00 65 00 6E 00 2D 00 55 00 53
Im Code sieht das jetzt bei mir so aus:
Delphi-Quellcode:
Dabei ist wbuf vom Typ WideString. Die Ausgabe ist dummerweise nur
fs.Read(bufSize, 4); bufSize := ChangeEndian32(bufSize);
wbuf := StringOfChar(#00, bufSize*2); fs.Read(wbuf[1], bufSize*2); writeln('Locale: ', wbuf);
Code:
Verwende ich UTF8String statt WideString bekomme ich immerhin eine Ausgabe. Die sieht jedoch so aus, als ob das zweite Byte nicht interpretiert wird (die Leerzeichen sind das Problem):
Locale: ?????
Code:
Kann das Problem im WideString-Fall damit zusammenhängen, dass die Datei im Big Endian-Format gespeichert ist oder bezieht sich das nur auf die Zahlwerte?
Locale: e n - U S
Wenn ja, wie kann ich geschickt einen String "umdrehen"? Meine ChangeEndian32-Routine (aus der Code-Lib übrigens) dreht nur DWORD-Werte um. Gruß Christopher |
Re: 2-Byte-Characters lesen/ausgeben (Big Endian)
Lese das zeug in den Widestring ein und gehe jedes Zeichen durch und ändere die Endianess (^^) indem du WideChar auf Word castest, umdrehst dann wieder zurück castest.
|
Re: 2-Byte-Characters lesen/ausgeben (Big Endian)
Hi Julius,
Delphi-Quellcode:
Das funktioniert. Und soweit ich das sehe, gibt es dafür auch keinen eleganteren Weg. Schade.
function SwapBytes(X: WideChar): WideChar;
asm xchg al, ah end; function SwapString(X: WideString): WideString; var idx: integer; begin for idx := 0 to Length(X) - 1 do X[idx+1] := SwapBytes(X[idx+1]); Result := X; end; Danke für deine Hilfe. Christopher |
Re: 2-Byte-Characters lesen/ausgeben (Big Endian)
neee, 'ne einfache Lösung gibt's nicht wirklich ...
theoretisch könnte man es via MultiByteToWideChar und der passenden CodePage machen, aber leider nur theoretisch, denn praktisch geht's nicht :cry: Zitat:
also bleibt nur der Weg des selbermachens, aber da ist es etwas unoptimal, wenn da auf jedes Zeichen direkt über den String zugegriffen würde, da Delphi dort dank der Compilermagic dort jedes Mal Einiges an Verwaltungskram einbaut...
Delphi-Quellcode:
weiß jetzt nicht ob das Pointer(...) unbedingt nötig ist ... ist es ja eigentlich nicht, also falls Delphi nicht meckert, dann einfach weglassen (bei Verwendung von P:PAnsiChar und C:AnsiChar würde Delphi zumindestens rumnörkeln)
function SwapString(const S: WideString): WideString;
var P, P2: PByte; i: Integer; begin SetLength(Result, Length(S)); P := Pointer(PWideChar(S)); P2 := Pointer(PWideChar(Result)); For i := Length(Result) - 1 downto 0 do Begin P[1] := P[0]; P[0] := P[1]; Inc(P, 2); Inc(P2, 2); End; end; oder direkt im String:
Delphi-Quellcode:
procedure SwapString(var S: WideString);
var P: PByte; C: Byte; i: Integer; begin // UniqueString(S); // reinmachen, falls UnicodeString, anstatt WideString genutzt werden soll P := Pointer(PWideChar(S)); For i := Length(S) - 1 downto 0 do Begin C := P[0]; P[0] := P[1]; P[1] := C; Inc(P, 2); End; end; |
Alle Zeitangaben in WEZ +1. Es ist jetzt 09:20 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz