AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Unicode Widestrings

Ein Thema von bioser · begonnen am 21. Nov 2005 · letzter Beitrag vom 21. Nov 2005
Antwort Antwort
bioser

Registriert seit: 30. Aug 2005
140 Beiträge
 
#1

Unicode Widestrings

  Alt 21. Nov 2005, 10:27
Hallo,

ich habe bereits eine fertige Routine, die mir normale "Strings" aus
einer Textdatei holt. Jetzt liegt mir eine Unicode Textdatei vor.
Kann ich meine Routine, die auf strings basiert, trotzdem benutzen,
um diese Unicode Widestrings aus der Textdatei zu lesen und dann
mittels den TNTControls auf meinem Formular darzustellen ?
Bin dankbar für jede Antwort.

Gruss
bioser
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.033 Beiträge
 
Delphi 12 Athens
 
#2

Re: Unicode Widestrings

  Alt 21. Nov 2005, 10:33
Nein, das geht nicht, denn entweder wird bei dir falsch ausgelesen (du hast ja vergessen zu sagen wie du ausließt), oder es wird zwischendurch von Unicode nach ANSI und dann wieder zurück umcodiert.
Und da ANSI nicht alle informationen von Unicode verwalten kann (vieles wird dann in einen Ersatzwert umgewandelt - meißtens das "?"), ann kann die Rückcodiereung ANSI > Unicode nicht funktionieren.

Du mußt also die ganze Zeit über deine Textinformationen in Unicode, oder höherem gespeichert haben.


Wenn du jetzt ber genauere nformationen zu deinem Problem wissen möchtest, dann wäre es nicht schlecht, wenn du uns mal etwas über deine fertige Routine normalen "Strings" verrätst
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
Robert Marquardt
(Gast)

n/a Beiträge
 
#3

Re: Unicode Widestrings

  Alt 21. Nov 2005, 10:54
Eine Unicode-Datei hat ueblicherweise am Anfang ein BOM. Das ist ein Wort das anzeigt in welchem Format die Zeichen sind.
$FFFE oder $FEFF. Die haeufigste Unicode-Kodierung ist mit zwei Bytes und dabei tritt natuerlich ein Bytesex-Problem auf.
Anhand des BOM kann man nun erkennen welcher Bytesex verwendet wird.

Verwende doch die TWideStringList der JCL (JclUnicode.pas).
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.033 Beiträge
 
Delphi 12 Athens
 
#4

Re: Unicode Widestrings

  Alt 21. Nov 2005, 11:09
erinnert mich irgendwie an was ^^
drum hab ich in meinen Dateifunktionen auch 'ne Prüfung mit drin, welche erstmal das Format ermittelt und dann auch noch die Markerbytes überspringt.
Delphi-Quellcode:
Function TextMode(Var F: TFile): TFileMode;
  Var i: LargeInt;
    L: LongChar;
    R: LongInt;

  Begin
    F.RecSize_TextMode := fmANSI;
    i := FilePos(F);
    FilePos(F, 0);
    ReadData(F.FileHandle, @L, 4, @R, nil);
    If (R >= 4) and (L = $0000FEFF) Then F.RecSize_TextMode := fmUCS4
    Else If (R >= 4) and (L = $FFFE0000) Then F.RecSize_TextMode := fmUCS4BE
    Else If (R >= 2) and (Word(L) = $FEFF) Then F.RecSize_TextMode := fmUCS2
    Else If (R >= 2) and (Word(L) = $FFFE) Then F.RecSize_TextMode := fmUCS2BE;
    If (F.RecSize_TextMode = fmUCS2) or (F.RecSize_TextMode = fmUCS2BE) Then Begin
      If i > 2 Then Inc(i) Else i := 2;
      TLargeIntRec(i).Lo := TLargeIntRec(i).Lo and not 1;
    End Else If (F.RecSize_TextMode = fmUCS4) or (F.RecSize_TextMode = fmUCS4BE) Then Begin
      If i > 4 Then Inc(i, 3) Else i := 4;
      TLargeIntRec(i).Lo := TLargeIntRec(i).Lo and not 3;
    End;
    FilePos(F, i);
    Result := F.RecSize_TextMode;
  End;
Aber hier ist ja anscheinend schon sicher, daß es sich um eine UnicodeDatei handelt, bleibt aber noch ungeklärt, ob BigEndian, oder LowerEndian kodiert und ob überhaupt ein Markerbyte vorhanden ist...
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
bioser

Registriert seit: 30. Aug 2005
140 Beiträge
 
#5

Re: Unicode Widestrings

  Alt 21. Nov 2005, 11:56
Hallo, danke für die Antworten. Ich habe gerade die JCLUnicode.pas eingebunden.
Dabei gibt es jede Menge undefinierte Bezeichner.
Sehen wir einmal davon ab, dann lade ich die Textdatei in die StringListe,
WidestringList.LoadfromFile(...), und wie kann ich dann damit weiter
arbeiten ?
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.033 Beiträge
 
Delphi 12 Athens
 
#6

Re: Unicode Widestrings

  Alt 21. Nov 2005, 12:03
Na "genauso" wie bei 'ner normalen TStringList? (dazu findest du dann sogar noch was in der OH)
Garbage Collector ... Delphianer erzeugen keinen Müll, also brauchen sie auch keinen Müllsucher.
my Delphi wish list : BugReports/FeatureRequests
  Mit Zitat antworten Zitat
Robert Marquardt
(Gast)

n/a Beiträge
 
#7

Re: Unicode Widestrings

  Alt 21. Nov 2005, 12:51
Zitat von bioser:
Hallo, danke für die Antworten. Ich habe gerade die JCLUnicode.pas eingebunden.
Dabei gibt es jede Menge undefinierte Bezeichner.
Hast du die JCL auch installiert? Dabei werden naemlich die Suchpfade von Delphi ergaenzt.
  Mit Zitat antworten Zitat
bioser

Registriert seit: 30. Aug 2005
140 Beiträge
 
#8

Re: Unicode Widestrings

  Alt 21. Nov 2005, 16:09
Hallo, danke, ja, es klappt soweit. Hat jemand eine Sammlung von
Datenbankoperationen für Textdateien (wie z.B. AddField, GoNext etc.),
basierend auf Widestrings ? Meine sind nur für strings geeignet.
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:22 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz