![]() |
Tutorial Arbeiten mit Dateien auf binärer Ebene
Hallo,
wo findet man ein Tutorial wie ich mit Dateien auf binärer Ebene arbeite. Also z.B. welche Möglichkeiten es gibt Dateien binär auszulesen etc. Gruß |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Hallo,
eine Datei ist immer binär abgelegt. Wenn Du die Datei einliesst legst Du fest wie diese Daten interpretiert werden sollen. Die kleinst Einheit die Du einlesen kannst ist ein Byte. Das kannst Du mit read(file,b) wenn Deine Datei vom Type file of Byte ist. Du kannst auch ein TFileStream benutzen und diesen dann byte-weise auslesen. Grüße Klaus |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Ich würde gerne alle möglichen Dateien binär auslesen und mich ein bisschen mehr mit dem Thema beschäftigen.
Kann man den File Stream auch in einen String schreiben, oder macht das keinen Sinn? Was würde im String stehen? Eine Zahlenreihe mit den Ziffern 0 bis 9? Gibt es auch ausführliche Tutorials dazu? Gruß |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Was hast Du denn konkret vor? Gruß K-H |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Du kannst einen Filestream in Delphi problemlos in einen Ansistring einlesen. Und es steht dann der Dateiinhalt darin. das ist vergleichbar mit dem öffnen der Datei per Notepad.
Wenn du also eine XML-Datei in den String einließt kommt wohl ungefähr sowas dabei raus: Zitat:
Bei einer exe Datei ganz viele nicht darstellbare Zeichen ;-) |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Nein, ich will an die einsen und nullen einer Datei kommen und diese möglichst in einem String oder so haben.
Gruß |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Die Darstellung eines Bytes (zB) als binär "00110001" oder Hex "31" oder dezimal 49 ist doch nur für uns doofe Menschen so gebräuchlich, weil wir sonst garnichts kapieren würden. Wenn Du in einem String die Darstellung der Werte der bits als "0" und "1" haben möchtest, dann mußt du die Werte der einzelnen Bits in chars "0" bzw. "1" umwandeln und in den String schreiben. Gut dir eine/deine Datei in einen HexEditor an, dann siehst Du, was gemeint ist. Wenn Du in dem String aber die Werte der Bytes haben möchtest, brauchst du doch nur das Eingelesene in den String schieben oder gleich in einen String einlesen oder eine Typumwandlung in String machen (unter Beachtung des Längensetzens des Strings). |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Delphi-Quellcode:
Das mit den Nullen und Einsen ist ein anderer Part. Da kannst du je nachdem die Bits eines Bytes auslesen, z. B. mit AND.
function LoadStringFromFile(AFilePath: String; var AFileString: AnsiString): Boolean;
var FileStream: TFileStream; begin Result := False; if not FileExists(AFilePath) then Exit; FileStream := TFileStream.Create(AFilePath, fmOpenRead); try if FileStream.Size <> 0 then begin SetLength(AFileString, FileStream.Size); FileStream.Read(AFileString[1], FileStream.Size); Result := True; end; finally FileStream.Free end; end; function SaveStringToFile(AFilePath: String; AFileString: AnsiString): Boolean; var FileStream: TFileStream; begin Result := False; FileStream := TFileStream.Create(AFilePath, fmCreate); try if Length(AFileString) <> 0 then begin FileStream.Write(AFileString[1], Length(AFileString)); Result := True; end; finally FileStream.Free end; end; procedure TForm1.Button1Click(Sender: TObject); var Path: String; TestString: AnsiString; begin Path := ExtractFilePath(ParamStr(0)); LoadStringFromFile(Path + 'Datei-A.exe', TestString); SaveStringToFile(Path + 'Datei-B.exe', TestString); end; |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Wie sollte man denn bei einem Komprimierungsalgorithmus vorgehen:
In welcher Form sollte man eine Datei eingelsesen um später möglichst effektiv zu komprimieren? Hexadezimal, binär o.ä.? Gruß |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Man kann NICHTS Hexadezimal oder Oktal oder .. einlesen, NUR binär, weil ALLES in der EDV binär IST. Ein Byte ist ein Byte ist ein Byte, ein Bit ist ein Bit ist ein Bit! Nochmal: Es gibt weder Nullen und Einsen noch Hexadezimal noch Oktal ... in Dateien und im RAM - NUR Bits und Bytes! Bits zu Bytes gruppiert, Bytes nach Bittiefe des OS zu Bytegruppen gruppiert. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Eine (jede) Datei besteht aus einer Ansammlung von Bytes. Jedes Byte kann 256 Zustände haben. Diese Zustände kann man dezimal mit 0..255 darstellen oder hexadezimal 00..FF oder binär 00000000..11111111 Der Inhalt ändert sich nicht durch die Darstellung. Diese Darstellung ist nur für unseren analogen Aufnahmemodus gedacht (Augen) und damit wir die Theorie dahinter verstehen. Wenn du an Komprimierung denkst, dann hat das nichts, aber auch gar nichts mit dezimal, hexadezimal oder binär zu schaffen. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Vielleicht noch mein Senf dazu. Das Beispiel weiter vorne wo eine beliebige Datei in einen AnsiString geladen wird, kann man sich letztendlich sparen, bzw. den Teil mit dem String. Einfach mit TFileStream eine Datei öffnen und schon hat man die Datei im Stream. Sie besteht auf Bytes (also Werten zwischen 0 und 256) und hat die Länge der Datei. Ein Byte hat also immer maximal den Wert von 255. Man kann ihn Dezimal schreiben als 255 oder hexadezimal als $FF oder Binär als 11111111. Letztendlich stehen alle für den gleichen Wert, wobei es Delphi Schnuppe ist ob du die Zahl 255 als 255 schreibst oder als $FF. Delphi kommt mit beiden Schreibweisen gleich klar. Komplizierter wird es mit der Binärdarstellung.
Also, du kannst eine Datei in einen AnsiString laden, da er zufällig auch eine Zeichenmenge in sich aufnehmen kann und jedes Zeichen eines von 256 Werten darstellen kann. Musst du aber nicht. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
oder Oktal 000 .. 377
oder als Nibble 0 + 0 .. F + F |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Beim Einlesen von den Bytes habe ich doch die 8 Bits und die sind ja nichts anderes als 1 und 0. Habe ich demnach nicht nach dem Einlesen eine Reihe aus einsen und nullen? Wie sollten die Bytes sonst anders dargestellt werden? |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Oder Yan Tan Tethera, aber das ist eher zum zählen von Schafen.
Vielleicht etwas für den Einstieg: ![]() //Edit Zitat:
Wenn du also ein Byte geladen hast, kannst du es in Bist weiter aufteilen. Dann kannst du durch eine Berechnung aus 255 eben Binär 11111111 machen. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Um mal zum (wohl eigentlichen) Thema Komprimierung zurückzukommen ein simples Beispiel:
Angenommen man hat eine Datei in der folgendes enthalten ist (ACHTUNG: Darstellung in Hexadezimal-Schreibweise damit ich das hier veranschaulichen kann)
Code:
und möchte diese komprimieren, so kann ich hier einen ganz simplen Komprimier-Algorithmus verwenden und dampfe die Datei auf folgende Bytefolge ein:
05 05 05 05 1F 1F 1F 1F 1F 1F 1F 1F 7B 7B 7B 7B 7B
Code:
Die Struktur dieser Datei ist wie folgt:
04 05 08 1F 05 7B
Code:
und bedeutet somit
Länge: 1 Byte
Wert : 1 Byte
Code:
Das dieser Algorithmus nicht wirklich optimal ist sollte man auf den ersten Blick erkennen, denn hier werden nur dann gute Kompressionsraten erzielt, wenn es möglichst viele gleiche Bytefolgen gibt. Schlimmstenfalls wird die komprimierte Datei doppelt so groß wie die Ursprungsdatei :)
4 Bytes mit 05
8 Bytes mit 1F 5 Bytes mit 7B Aber das allgemeine Prinzip sollte etwas klarer werden. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Der Zustand eines Bits ist gesetzt/ungesetzt oder Spannung/keine Spannung oder Strom/kein Strom oder pos. Spannung/neg. Spannung oder Loch/kein Loch ........ Die Darstellung dieser Zustände benennen wir blöden Menschen mit Zahlen, sonst könnten wir der EDV nicht folgen. Die Kiste kennt in allen Speichern nur Zustände. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Was würde ich dann sehen, wenn ich einen FileStream in einen String schreibe und mir im Edit zeigen lasse?
Wie kann ich vernünftig mit einem FileStream arbeiten, wenn ich nicht weiß, was er enthält? |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Wenn du etwas in einen string schreibst (string als Typen Declaration)dann geht das Programm davon aus, daß es die bytes als Darstellbare Zeichen interpretieren soll. Dann ist allein durch die type-Zuordnung schon eine Interpretation vorgenommen worden.
Trotzdem stehen im string nur bytes, und keine "A" "B" ... Wenn du diesen String in Edit einfügst, kommt es darauf an, wie die Codierung in Edit gesetzt ist (die nächste Interpretation), ob ASCII oder Indian oder UTF-8 ... Warum guckst du dir nicht endlich mal eine Datei in einem HexEditor an, zB eine BMP. Dann zeigt der HexEditor rechts Punkte oder Buchstaben an - bloß es gibt in der gesamtem BMP keinen einzigen Buchstaben! Es ist eine Frage der Interpretation eines Bytes, was dargestellt wird. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Was Sir Rufo beschrieben hat ist die Grundlage der Komprimierung. Man kann das übrigens auch auf Binärebene machen.
5050F1F1 ist Binär 1010000010100001111000111110001, die Komprimierung könnte auch so aussehen 1,1,1,5,1,1,1,4,4,3,5,3,1, also 1 mal 1, 1 mal 0, 1 mal 1, 5 mal 0, usw. Wobei bei diesem Beispiel die Komprimierung wohl größer wäre als die alte Datei, wenn aber paar hundert Nullen hintereinander sind, dann klappt das wieder. Was man auch machen kann ist sich eine Bibliothek aus Mustern anlegen. In einer Datei wiederholen sich Bereiche. Man würde dann nicht speichern wie oft eine Null oder Eins vorkommt, sondern eine Adresse auf ein Muster. //Edit Ich hab dir doch weiter vorne zwei fertige Funktionen gepostet. Warum eigentlich? Wie wäre es wenn du sie ausprobierst, dann weißt du was da steht. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Eine Textdatei kann auf unterschiedliche Arten kodiert sein (ANSI, UTF-8, UTF-16 Little Endian, UTF-16 Big Endian, etc.) und dass muss man wissen um den enthaltenen Text aus der Bytefolge auch richtig zu interpretieren. Bei der (verlustfreien) Komprimierung ist das aber völlig wumpe, da interessieren einen eh nur die Bytes und nicht was die tatsächlich bedeuten sollen. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Demenstprechend werden Zeichen in einem Stream nicht interpretiert.
Wenn ich also eine Datei (für einen Komprimieralgorithmus) öffne, müsste ich die Bytes sinnvollerweise als Folge von einsen und nullen interpretieren lassen. Wie mache ich dies denn? |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Ich würde dir aber empfehlen erst mal bei den Bytes als Einheit zu bleiben ;) |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Code:
Hier wissen wir, dass in dem oberen Byte an der ersten Stelle ein Bit gesetzt ist.
00101011
00000001 AND -------- 00000001 1 AND 1 ergibt 1. Der erste Bit steht für den Wert 1. Wenn du also einen beliebigen Byte mit 1 AND rechnest und das eine 1 ergibt, weißt du, dass der Byte an der Stelle eine 1 hat. Das klappt auch mit dem nächsten Byte:
Code:
Hier wissen wir, dass in dem oberen Byte an der zweiten Stelle ein Bit gesetzt ist.
00101011
00000010 AND -------- 00000010
Code:
Hier wissen wir, dass in dem oberen Byte an der dritten Stelle kein Bit gesetzt ist.
00101011
00000100 AND -------- 00000000
Code:
Hier wissen wir, dass in dem oberen Byte an der vierten Stelle ein Bit gesetzt ist.
00101011
00001000 AND -------- 00001000 |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Das scheint sehr simpel zu sein,
aber warum beginnt die erste Stelle ganz rechts? Was bringt das? |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Konvention. Genau so, wie wir im Zehnersystem hinten die Einerstellen schreiben, es ginge auch vorne. Macht nur keiner.
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Ich bin sehr erfreut darüber, dass die meisten hier nun wissen, dass es nicht verschiedene Lese/Schreibverfahren (binär/ascii) gibt sondern alles eigentlich intern nur aus Nullen und Einsen (zusammengereiht) besteht.
So herrlich.. Habe mich mal vor Ewigkeiten darüber ![]() |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Es ist alles eine Frage der Interpretation.
Unangenehm wird es da, wo jemand annimmt seine Interpretation wäre die einzig richtige. Gruß K-H |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Was loht sich denn bei der Lauflängenkodierung mehr?
Ein Wort aus einer Textdatei direkt zu komprimieren, oder es erst binär umzuschreiben und dann zu komprimieren? |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Ich meine die chars direkt zu komprimieren oder die chars erst in 0 und 1 umschreiben und dann von 0 und 1 die Lauflängencodierung zu machen.
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Bei der letzten Variante fängst du glatt mal mit der 8 fachen Datenmenge an. Der erste Schritt wäre, die redundanz zu reduzieren indem man 8 Symbole in ein Byte zusammen fasst und damit schon eine Kompression um 87,5% erreicht ;-)
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Beispiel:
Inhalt der Textdatei "ABCD" Inhalt nach einer "Übersetzung in binär" "01000001010000100100001101000100" Die Länge ist von 4 auf 4 * 8 gestiegn, also um 800%. |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Zitat:
Wenn ich jetzt mal ein Alphabet ausschließlich aus A-Z Großbuchstaben annehme, dann hat die Nachricht "ABCD" einen Informationsgehalt von 4,7 Shannon pro Zeichen. man benötigt also 5 Bits um ein Zeichen zu übertragen, bzw. 5*4=20 bits für die ganze Nachricht. Für die Alternative Nachricht wären das 1 bit pro Zeichen = 32bits für die ganze Nachricht. Ich würde sagen, Ziel verfehlt :stupid: Wenn man das jetzt noch RLE codiert kommt da sowas raus: 10 11 40 10 11 10 11 40 11 20 11 40 21 10 11 30 11 20 Das könnte man schön speichern, man kommt pro Wiederholungseinheit mit 4 bits aus. (Die erst Zahl minus 1 speichern braucht 3 bits und das Datenbit) das macht bei 36 Wiederholungseinheiten glatt 144 bits. Hört sich nach einer Klasse Idee an :mrgreen: Für die Originalnachricht wurden übrigens 4 Bytes = 32 bits verwendet. Die RLE hat die Nachricht also auf das 4,5 fache aufgebläht! |
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Sollte man bei dem Algorithmus lieber mit 0 und 1 arbeiten, oder doch lieber normale chars des Alphabets?
|
AW: Tutorial Arbeiten mit Dateien auf binärer Ebene
Tja, das ist jetzt die Frage was du machen möchtest. Ein allgemein anwendbarer Algorithmus zur Datenkompression sollte mit Bytes arbeiten.
Falls du deine Eingabedaten kennst und weißt dass es sich nur um Zeichen des Alphabets handelt kannst du noch mehr machen: Kodiere die Buchstaben in 6 bits (also 64 verschiedene Zeichen) und danach kannst du einen allgemeinen Standardalgorithmus drüberlaufen lassen. Verlustbehaftete Kompression ist nochmal ein anderes Thema, das braucht man dann hauptsächlich bei Audio und Video, eher nicht bei Text. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:16 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz