AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

TFileStream und #0

Ein Thema von hoika · begonnen am 27. Jan 2014 · letzter Beitrag vom 28. Jan 2014
Antwort Antwort
hoika

Registriert seit: 5. Jul 2006
Ort: Magdeburg
8.276 Beiträge
 
Delphi 10.4 Sydney
 
#1

TFileStream und #0

  Alt 27. Jan 2014, 07:32
Hallo #,

es gibt doch Delphi-Versionen, die Probleme beim Laden binärer Dateien mit #0 haben.
Dabei wurde beim ersten #0-Zeichen abgebrochen.

Es gab sogar mal ein direktes Bsp. zum Testen, ich finde es aber leider nicht mehr.

Kann mir jemand helfen ?

Danke

Heiko
Heiko
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#2

AW: TFileStream und #0

  Alt 27. Jan 2014, 07:42
Das kenne ich nur in dem Zusammenhag, wenn man die Datei direkt in einen String laden will
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
hoika

Registriert seit: 5. Jul 2006
Ort: Magdeburg
8.276 Beiträge
 
Delphi 10.4 Sydney
 
#3

AW: TFileStream und #0

  Alt 27. Jan 2014, 07:44
Hallo,

das kommt als nächstes
Ich will eigentlich eine Binärdatei durchsuchen,
allerdings nicht per Pos, sondern zu Fuss.

Vielleicht verwechsle ich das jetzt auch mit StringReplace ...


Heiko
Heiko
  Mit Zitat antworten Zitat
Benutzerbild von Sir Rufo
Sir Rufo

Registriert seit: 5. Jan 2005
Ort: Stadthagen
9.454 Beiträge
 
Delphi 10 Seattle Enterprise
 
#4

AW: TFileStream und #0

  Alt 27. Jan 2014, 08:49
Und du willst die Binärdatei nach einem String durchsuchen?

Wie zuverlässig wirst du den den finden wollen?
In der Binärdatei kann der ja in jeder möglichen Codierung enthalten sein (eben auch MultiByte).

Wenn die Codierung des Strings innerhalb der Binärdatei bekannt ist, dann hole dir die Bytefolge des Strings und suche nach dieser Bytefolge in der Binärdatei. Dadurch weißt du allerdins nur, dass diese Bytefolge in der Binärdatei ist und nicht, ob damit auch wirklich der gesuchte String dort repräsentiert wird.

Gesichert weiß man das nur, wenn man den strukturellen Aufbau der binären Datei kennt. Ansonsten können die Bytefolgen dort alles und nichts bedeuten.
Kaum macht man's richtig - schon funktioniert's
Zertifikat: Sir Rufo (Fingerprint: ‎ea 0a 4c 14 0d b6 3a a4 c1 c5 b9 dc 90 9d f0 e9 de 13 da 60)
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.184 Beiträge
 
Delphi 12 Athens
 
#5

AW: TFileStream und #0

  Alt 27. Jan 2014, 11:08
In Strings kann man #0 und Co. immernoch problemlos laden.

Aber TStringList und Co. behandeln die 0#
und viele vergessen, daß ein UnicodeString "neuerdings" 2 Byte hat.
Schon interessant, daß das nach fast 5 Jahren kaum einer weiß.


allerdings nicht per Pos, sondern zu Fuss.
Seitdem Pos auf FastCode umgestellt wurde, kann man es nicht mehr verwenden, wenn eine #0 im String vorkommt.

Vorher ging man direkt auf Length, aber seitdem wird das auf PChar gecastet und die schrottige #0 verwendet,
was übrigens wunderbar knallt, wenn die implizieten zwei #0-en am String-Ende zerschossen wurden.
$2B or not $2B
  Mit Zitat antworten Zitat
hoika

Registriert seit: 5. Jul 2006
Ort: Magdeburg
8.276 Beiträge
 
Delphi 10.4 Sydney
 
#6

AW: TFileStream und #0

  Alt 28. Jan 2014, 03:44
Hallo,

Ich durchsuche Doc-Dateien nach bestimmten Kennern,
z.B. <NachName>.
Word hat aber die Eigenheit, dann auch sowas nach einer wilden Formataktion zu erzeugen:
<Nac#0hName#0> .
Das soll auch gefunden werden.
Der aktuelle Code läuft über direktes Byte-Lesen
und ist gerade bei großen Dateien etwas langsam.
Ich dachte jetzt, dass mit TFileStream zu machen.
Ich müsste dann jedes Byte einzeln ansprechen.
Die interne Suchroutine soll ja so bleiben.

Es geht hier übrigens nur um DOC, bei DOCX und ODT
habe ich dank dem XML-Format weniger Probleme ...

Heiko
Heiko
  Mit Zitat antworten Zitat
Benutzerbild von jaenicke
jaenicke

Registriert seit: 10. Jun 2003
Ort: Berlin
9.669 Beiträge
 
Delphi 11 Alexandria
 
#7

AW: TFileStream und #0

  Alt 28. Jan 2014, 06:25
Der aktuelle Code läuft über direktes Byte-Lesen
und ist gerade bei großen Dateien etwas langsam.
Ich dachte jetzt, dass mit TFileStream zu machen.
Ich müsste dann jedes Byte einzeln ansprechen.
Dafür empfehle ich die Verwendung von MMFs:
http://www.delphipraxis.net/151898-s...ei-reader.html
Damit lese ich in meinen Registryeditor .reg Dateien ein. Damit schaffe ich auf einer normalen Desktopfestplatte 70-100 MiB/s beim byteweisen (!) Auslesen, je nach Modell. Sprich es geht Richtung Maximalgeschwindigkeit der Platte. Bei SSDs ist es noch einmal schneller, damit habe ich aber nicht viel getestet.
Sebastian Jänicke
AppCentral
  Mit Zitat antworten Zitat
hoika

Registriert seit: 5. Jul 2006
Ort: Magdeburg
8.276 Beiträge
 
Delphi 10.4 Sydney
 
#8

AW: TFileStream und #0

  Alt 28. Jan 2014, 08:38
Hallo,

ich lese dort immer Textdateien (bei dem Link von jaenicke),
ich brauche das ganze aber binär.


Heiko
Heiko
  Mit Zitat antworten Zitat
Benutzerbild von jaenicke
jaenicke

Registriert seit: 10. Jun 2003
Ort: Berlin
9.669 Beiträge
 
Delphi 11 Alexandria
 
#9

AW: TFileStream und #0

  Alt 28. Jan 2014, 09:10
Dort benutze ich PAnsiChar, aber du kannst daraus auch problemlos PByte machen und stattdessen die Bytewerte nehmen (die Unicode-Teile kannst du einfach entfernen). Du sollst den Quelltext ja nicht unbedingt 1:1 benutzen, aber du kannst ihn als Vorlage benutzen um mit einer MMF die Dateien sehr schnell und dennoch rein byteweise auszulesen.
Ob das nun Zeichen oder Bytewerte sind, ändert an der Vorgehensweise nichts.

Ich suche dort die Zeilenenden. Analog kannst du auch nach deinen Werten suchen.
Sebastian Jänicke
AppCentral
  Mit Zitat antworten Zitat
hoika

Registriert seit: 5. Jul 2006
Ort: Magdeburg
8.276 Beiträge
 
Delphi 10.4 Sydney
 
#10

AW: TFileStream und #0

  Alt 28. Jan 2014, 17:11
Danke


Heiko
Heiko
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 07:45 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz