AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Stream mit UTF8-Daten dekodieren?

Ein Thema von ralfiii · begonnen am 20. Okt 2010 · letzter Beitrag vom 20. Okt 2010
Antwort Antwort
Benutzerbild von ralfiii
ralfiii

Registriert seit: 30. Mai 2007
489 Beiträge
 
Delphi 2010 Professional
 
#1

Stream mit UTF8-Daten dekodieren?

  Alt 20. Okt 2010, 17:48
Delphi-Version: 2010
Hallo!

Ich hole mir ein paar Settings von einer Komponente als Stream ab und möchte dann den Stream weiterverarbeiten. Im Stream stehen die Daten aber UFT8-kodiert und mit dem 3-byte BOM drin.
Wie wandle ich das gscheit um?

Im Moment mach ich das über den Umweg einer TStringList, müsste aber netter gehen, oder?

Delphi-Quellcode:
  strm:=TMemoryStream.Create;
  MyComp.SaveToStream(strm);

  // das hier sollte doch simpler gehen, oder?
  with TStringList.Create do
  begin
       strm.Position:=0;
       LoadFromStream(strm, TEncoding.UTF8);
       s:=Text;
       Free;
  end;
Danke,
Ralf
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#2

AW: Stream mit UTF8-Daten dekodieren?

  Alt 20. Okt 2010, 18:34
Delphi-Quellcode:
function StringSaveToFile( const Str, FileName : string;
  const EraseFile : boolean ) : boolean;
  var
    fs : TFileStream;
    Size : integer;
    Buffer, Preamble : TBytes;
    Encoding : TEncoding;
    CreateFile : boolean;
  begin
    Result := False;
    try
      CreateFile := EraseFile or not FileExists( FileName );
      if CreateFile then
        fs := TFileStream.Create( FileName, fmCreate )
      else
        fs := TFileStream.Create( FileName, fmOpenReadWrite );
      try
        if CreateFile then
          begin
            Encoding := TEncoding.default;
            Preamble := Encoding.GetPreamble;
            if Length( Preamble ) > 0 then
              fs.WriteBuffer( Preamble[ 0 ], Length( Preamble ) );
          end
        else
          begin
            Encoding := nil;
            Size := fs.Size - fs.Position;
            if Size > 64 then
              Size := 64;
            SetLength( Buffer, Size );
            TEncoding.GetBufferEncoding( Buffer, Encoding );
            fs.Seek( 0, soFromEnd );
          end;
        Buffer := Encoding.GetBytes( Str );
        fs.WriteBuffer( Buffer[ 0 ], Length( Buffer ) );
      finally
        fs.Free;
      end;

    except
      on E : Exception do
        ;
    end;
  end;

function StringLoadFromFile( const FileName : string ) : string;
  var
    fs : TFileStream;
    Size : integer;
    Buffer : TBytes;
    Encoding : TEncoding;
  begin
    Result := '';
    try

      Encoding := nil;
      if FileExists( FileName ) then
        begin
          fs := TFileStream.Create( FileName, fmOpenRead );
          try

            Size := fs.Size - fs.Position;
            SetLength( Buffer, Size );
            fs.read( Buffer[ 0 ], Size );

            Size := TEncoding.GetBufferEncoding( Buffer, Encoding );
            Result := Encoding.GetString
              ( Buffer, Size, Length( Buffer ) - Size );

          finally
            fs.Free;
          end;
        end;

    except
      on E : Exception do
        ;
    end;
  end;
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
shmia

Registriert seit: 2. Mär 2004
5.508 Beiträge
 
Delphi 5 Professional
 
#3

AW: Stream mit UTF8-Daten dekodieren?

  Alt 20. Okt 2010, 19:25
Anstelle eines MemoryStreams würde ich einen TStringStream verwenden.
Der Zugriff auf die Daten wird damit einfach bequemer.
Delphi-Quellcode:
strm:=TStringStream.Create;
MyComp.SaveToStream(strm);
strm.Seek(soFromBeginning   , 2); // BOM überspringen
utf8codierterstring := strm.ReadString(strm.Size);
// hier brauchst du nur noch eine Funktion, die UTF8 in
// einen AnsiString oder WideString wandelt, jenachdem
// was gewünscht wird.
Andreas
  Mit Zitat antworten Zitat
Benutzerbild von Bummi
Bummi

Registriert seit: 15. Jun 2010
Ort: Augsburg Bayern Süddeutschland
3.470 Beiträge
 
Delphi XE3 Enterprise
 
#4

AW: Stream mit UTF8-Daten dekodieren?

  Alt 20. Okt 2010, 20:54
Zitat:
strm.Seek(soFromBeginning , 2); // BOM überspringen
erklärst Du mir das kurz?

ich hätte 3 erwartet wg. BOM = EF BB BF
Thomas Wassermann H₂♂
Das Problem steckt meistens zwischen den Ohren
DRY DRY KISS
H₂ (wenn bei meinen Snipplets nichts anderes angegeben ist Lizenz: WTFPL)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.214 Beiträge
 
Delphi 12 Athens
 
#5

AW: Stream mit UTF8-Daten dekodieren?

  Alt 20. Okt 2010, 21:06
ich hätte 3 erwartet wg. BOM = EF BB BF
Sind es auch ... halt nee, es ist nur ein Unicodezeichen, welches eigentlich keines ist und als MarkerChar genutzt wird.
http://www.unicode.org/charts/PDF/UFFF0.pdf (Unicode $FFFE = UTF-8-kodiert $EF$BB$BF)

Zum Umkodieren gibt es in der System-Unit einige alte Funktionen, mit einem "UTF8" im Namen
und ansonsten nutzt man jetzt (seit D2009) die Methoden von TEncoding.

Man könnte also auch erst umwandeln und danach dann das erste Zeichen rauslöschen, wenn es #$FFFE entspricht.
$2B or not $2B

Geändert von himitsu (20. Okt 2010 um 21:15 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 13:59 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz