AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Sonstige Fragen zu Delphi Delphi 2-Byte-Characters lesen/ausgeben (Big Endian)
Thema durchsuchen
Ansicht
Themen-Optionen

2-Byte-Characters lesen/ausgeben (Big Endian)

Ein Thema von CalganX · begonnen am 11. Mai 2009 · letzter Beitrag vom 14. Mai 2009
Antwort Antwort
CalganX

Registriert seit: 21. Jul 2002
Ort: Bonn
5.403 Beiträge
 
Turbo Delphi für Win32
 
#1

2-Byte-Characters lesen/ausgeben (Big Endian)

  Alt 11. Mai 2009, 11:44
Hallo zusammen,

in der Datei, die ich mit einem TFileStream auslesen will, stehen Multibyte-/Unicode-Strings. D.h. alle Zeichen werden mit zwei Bytes kodiert. D.h. ich habe zum Beispiel folgenden Text in der Datei stehen (Hex-Code):
Code:
00 00 00 05 00 65 00 6E 00 2D 00 55 00 53
Die ersten vier Bytes geben mir die Länge des Strings an (i.e. 5 Zeichen). Dann folgen 10 Bytes (5 * 2 Bytes), die ich auslesen will.
Im Code sieht das jetzt bei mir so aus:
Delphi-Quellcode:
    fs.Read(bufSize, 4); bufSize := ChangeEndian32(bufSize);
    wbuf := StringOfChar(#00, bufSize*2);
    fs.Read(wbuf[1], bufSize*2);
    writeln('Locale: ', wbuf);
Dabei ist wbuf vom Typ WideString. Die Ausgabe ist dummerweise nur
Code:
Locale: ?????
Verwende ich UTF8String statt WideString bekomme ich immerhin eine Ausgabe. Die sieht jedoch so aus, als ob das zweite Byte nicht interpretiert wird (die Leerzeichen sind das Problem):
Code:
Locale: e n - U S
Kann das Problem im WideString-Fall damit zusammenhängen, dass die Datei im Big Endian-Format gespeichert ist oder bezieht sich das nur auf die Zahlwerte?
Wenn ja, wie kann ich geschickt einen String "umdrehen"? Meine ChangeEndian32-Routine (aus der Code-Lib übrigens) dreht nur DWORD-Werte um.

Gruß
Christopher
  Mit Zitat antworten Zitat
Benutzerbild von jfheins
jfheins

Registriert seit: 10. Jun 2004
Ort: Garching (TUM)
4.579 Beiträge
 
#2

Re: 2-Byte-Characters lesen/ausgeben (Big Endian)

  Alt 11. Mai 2009, 12:24
Lese das zeug in den Widestring ein und gehe jedes Zeichen durch und ändere die Endianess (^^) indem du WideChar auf Word castest, umdrehst dann wieder zurück castest.
  Mit Zitat antworten Zitat
CalganX

Registriert seit: 21. Jul 2002
Ort: Bonn
5.403 Beiträge
 
Turbo Delphi für Win32
 
#3

Re: 2-Byte-Characters lesen/ausgeben (Big Endian)

  Alt 11. Mai 2009, 12:29
Hi Julius,

Delphi-Quellcode:
function SwapBytes(X: WideChar): WideChar;
asm
  xchg al, ah
end;

function SwapString(X: WideString): WideString;
var
  idx: integer;
begin
  for idx := 0 to Length(X) - 1 do
    X[idx+1] := SwapBytes(X[idx+1]);
  Result := X;
end;
Das funktioniert. Und soweit ich das sehe, gibt es dafür auch keinen eleganteren Weg. Schade.

Danke für deine Hilfe.
Christopher
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.078 Beiträge
 
Delphi 12 Athens
 
#4

Re: 2-Byte-Characters lesen/ausgeben (Big Endian)

  Alt 14. Mai 2009, 23:09
neee, 'ne einfache Lösung gibt's nicht wirklich ...

theoretisch könnte man es via MultiByteToWideChar und der passenden CodePage machen, aber leider nur theoretisch, denn praktisch geht's nicht

Zitat von himitsu:
Unicode (ISO-10646-UCS-2) > CodePage: 1200
Unicode - Big Endian > CodePage: 1201

also bleibt nur der Weg des selbermachens, aber da ist es etwas unoptimal, wenn da auf jedes Zeichen direkt über den String zugegriffen würde, da Delphi dort dank der Compilermagic dort jedes Mal Einiges an Verwaltungskram einbaut...
Delphi-Quellcode:
function SwapString(const S: WideString): WideString;
var P, P2: PByte;
  i: Integer;
begin
  SetLength(Result, Length(S));
  P := Pointer(PWideChar(S));
  P2 := Pointer(PWideChar(Result));
  For i := Length(Result) - 1 downto 0 do Begin
    P[1] := P[0];
    P[0] := P[1];
    Inc(P, 2);
    Inc(P2, 2);
  End;
end;
weiß jetzt nicht ob das Pointer(...) unbedingt nötig ist ... ist es ja eigentlich nicht, also falls Delphi nicht meckert, dann einfach weglassen (bei Verwendung von PAnsiChar und C:AnsiChar würde Delphi zumindestens rumnörkeln)

oder direkt im String:
Delphi-Quellcode:
procedure SwapString(var S: WideString);
var P: PByte;
  C: Byte;
  i: Integer;
begin
  // UniqueString(S); // reinmachen, falls UnicodeString, anstatt WideString genutzt werden soll
  P := Pointer(PWideChar(S));
  For i := Length(S) - 1 downto 0 do Begin
    C := P[0];
    P[0] := P[1];
    P[1] := C;
    Inc(P, 2);
  End;
end;
Neuste Erkenntnis:
Seit Pos einen dritten Parameter hat,
wird PoSex im Delphi viel seltener praktiziert.
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:46 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz