AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Binäre (Hex) Suche

Ein Thema von Alter Mann · begonnen am 15. Mär 2013 · letzter Beitrag vom 16. Mär 2013
Antwort Antwort
Benutzerbild von Aphton
Aphton

Registriert seit: 31. Mai 2009
1.198 Beiträge
 
Turbo Delphi für Win32
 
#1

AW: Binäre (Hex) Suche

  Alt 15. Mär 2013, 20:18
Ich habe die BM-Suche implementiert und bei dieser Datei (genauer hier, vorgestellt von SemperVideo) eine Suche gestartet.
Weiters habe ich das ganze per FileMapping gelöst - damit das System per Paging & Optimierungen (und was halt sonst noch so dazu gehört) da mitmischen kann.

Die Datei ist 15.696.118.781 bytes groß (14.6 GB).
Ich habe nach den letzten 7 Stellen gesucht. Das ganze hat im Schnitt um die 169 Sekunden gedauert. Dh 14.6 GB in 169 Sekunden (169136 ms) mit 7 Zeichen durchsucht.

Das wären dann 92801761 Bytes/Sek.

Im Vergleich zu deinen 512mb in 1.13 sec:
Ich habe mir 20 Bytes genau bei 512 rausgesucht und danach suchen lassen (gleiche Situation/Verhältnisse).
Die Suche hat im Schnitt 900 ms gedauert.

Falls Interesse besteht, kann ich die kleine Demo ja hochladen!
das Erkennen beginnt, wenn der Erkennende vom zu Erkennenden Abstand nimmt
MfG

Geändert von Aphton (15. Mär 2013 um 20:27 Uhr)
  Mit Zitat antworten Zitat
Furtbichler
(Gast)

n/a Beiträge
 
#2

AW: Binäre (Hex) Suche

  Alt 16. Mär 2013, 09:02
Vorsicht, werden hier vielleicht Äpfel mit Birnen verglichen? Also vielmehr: IO vs. Cache?

Bei Dateien dieser Größe kommt es imho in erster Linie auf die Art des Einlesens an. Hier hat Sebastian Jänicke eine Textreader-Klasse mit Memory mapped files implementiert, die nach seinen Aussagen das schnellste ist, was es diesbezüglich gibt.

Ich kann mir vorstellen, das man seine Klasse auf Bytestreams anpassen kann.

...habe sie an Byte angepasst, läuft auch, aber kommt unter Umständen in einen Loop und es dauert.
Mit Strings ist sie Super schnell(512MB in 3sec.).
Zeig mal den Code, denn ein String ist ja nichts anderes als ein Bytestream (wenn man unicode mal außen vor lässt).
  Mit Zitat antworten Zitat
MeierZwoo

Registriert seit: 3. Dez 2012
106 Beiträge
 
#3

AW: Binäre (Hex) Suche

  Alt 16. Mär 2013, 12:28
Ich benutze bei solchen Aufgaben einfach einlesen in einen String und dann die String-Function pos.

Wenn das Einzulesende (die Datei) > 4GB ist, dann über einen Schiebepuffer.

Über die Zeit habe ich mir noch keine Gedanken gemacht, weil, wenn es bei (realisierte Anwendung) 1600 Dateien unter 1 sec ist, mache ich mir keinerlei Gedanken mehr in Punkto Optimierung.
  Mit Zitat antworten Zitat
Alter Mann

Registriert seit: 15. Nov 2003
Ort: Berlin
948 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#4

AW: Binäre (Hex) Suche

  Alt 16. Mär 2013, 12:40
Moin, Moin,

da es mit Boyer Moore nicht geht, hier der Code:
Delphi-Quellcode:
unit uHexSearch;

interface

uses
  SysUtils, Classes;

type
  THexSearchFoundEvent = procedure(Sender : TObject;
                                    Position : Integer;
                                    var Cancel : Boolean) of object;

  THexSearchSkipTable = Array[0..255] of Byte;

  PHexByteArray = ^THexByteArray;
  THexByteArray = Array of Byte;

  THexSearch = class(TComponent)
  private
    FBytes : THexByteArray;
    FCanCancel : Boolean;
    FSkipTable : THexSearchSkipTable;
    FStream : TStream;
    FOnFound : THexSearchFoundEvent;
    procedure InitSkipTable(var SkipTable : THexSearchSkipTable;
                            const aBytes : THexByteArray);
    procedure Search(aStream : TStream;
                     SkipTable : THexSearchSkipTable;
                     const aBytes : THexByteArray);
    function GetArrayOfByte(Source : Array of Byte;
                             Index, Count : Integer) : THexByteArray;
    function EqualBytes(Source, Dest : Array of Byte) : Boolean;
  protected
    procedure DoFound(Position : Integer; var Cancel : Boolean); virtual;
  public
    procedure Execute;

    property Cancel : Boolean read FCanCancel write FCanCancel;
    property Stream : TStream read FStream write FStream;
    property SearchBytes : THexByteArray read FBytes write FBytes;
  published
    property OnFound : THexSearchFoundEvent read FOnFound write FOnFound;
  end;

implementation


const
  iBufferSize = 4096;

procedure THexSearch.DoFound(Position : Integer; var Cancel : Boolean);
begin
  If Assigned(FOnFound) then FOnFound(Self,Position, Cancel);
end;

procedure THexSearch.Execute;
begin
  InitSkipTable(FSkipTable, FBytes);
  Search(FStream, FSkipTable, FBytes);
end;

procedure THexSearch.InitSkipTable(var SkipTable : THexSearchSkipTable;
                                   const aBytes : THexByteArray);
var
  I : Integer;
  L : Integer;
begin
  L := Length(aBytes);
  FillChar(SkipTable,SizeOf(THexSearchSkipTable), L);
  for I := 0 to L do
    SkipTable[aBytes[I]]:= L - I;
end;

procedure THexSearch.Search(aStream : TStream;
                            SkipTable : THexSearchSkipTable;
                            const aBytes : THexByteArray);
var
  ReadLen : Integer;
  TextLen : Integer;
  SourcePos : Integer;
  SubStrPos : Integer;
  aBuffer : Array[1..iBufferSize] of Byte;
  ReadBufferCount : Integer;
  A : Integer;
begin
  FCanCancel := false;
  ReadBufferCount := 0;
  TextLen := Length(aBytes);
  ReadLen := 0;
  aStream.Seek(0, soFromBeginning);
  While aStream.Position<aStream.Size do
    begin
    A := 0;
    SourcePos := TextLen;
    ReadLen := aStream.Read(aBuffer, SizeOf(aBuffer));
    Repeat
      SubStrPos := TextLen;
      Repeat
        If aBuffer[SourcePos]= aBytes[SubStrPos] then
          begin
          Dec(SourcePos);
          Dec(SubStrPos);
          end
          else
          begin
            If SkipTable[aBytes[SubStrPos]]>SkipTable[aBuffer[SourcePos]] then
              SourcePos := SourcePos + TextLen
            else
              SourcePos := SourcePos +SkipTable[aBuffer[SourcePos]];
            If SourcePos>ReadLen then
            begin
              SourcePos := ReadLen;
              Inc(A);
            end;
            SubStrPos := TextLen;
          end;
      Until (SubStrPos=0) or (SourcePos>ReadLen) or (A=2);
      If SubStrPos = 0 then // Text gefunden
      begin
        DoFound(ReadBufferCount*SizeOf(aBuffer)+SourcePos-ReadBufferCount*TextLen, FCanCancel);
        SourcePos := SourcePos + 2 * TextLen;
      end;
      If FCanCancel then Exit;
    Until (SourcePos>ReadLen) or (A=2); // Block ist abgearbeitet
    Inc(ReadBufferCount);

    If (EqualBytes(GetArrayOfByte(aBuffer, ReadLen-TextLen+1, TextLen), aBytes)) and
       (Stream.Position < Stream.Size) then
      aStream.Seek(-(TextLen),soFromCurrent);
    end;
end;

function THexSearch.GetArrayOfByte(Source : Array of Byte;
                                    Index, Count : Integer) : THexByteArray;
var
  I : Integer;
begin
  SetLength(Result, Count);
  for I := 0 to Count do
    Result[I] := Source[Index + I];
end;


function THexSearch.EqualBytes(Source, Dest : Array of Byte) : Boolean;
var
  SA, DA : String;
  I : Integer;
begin
  SA := '';
  DA := '';
  for I := 0 to Length(Source) do SA := SA + IntToHex(Source[I], 2);
  for I := 0 to Length(Dest) do DA := DA + IntToHex(Dest[I], 2);
  Result := CompareText(SA, DA) = 0;
end;

end.
Das Problem wird jedem Klar wenn nach folgender bytefolge gesucht wird:
Code:
DA010000DE010000E2010000E6010000
Den daraus wird
Code:
(218, 1, 0, 0, 222, 1, 0, 0, 226, 1, 0, 0, 230, 1, 0, 0)
und da in der Skiptable für jeden Wert die Schiebeposition vermerkt wird, werden
die Positionen für den Wert 0 immer überschrieben.


Schönes Wochenende
  Mit Zitat antworten Zitat
Benutzerbild von lbccaleb
lbccaleb

Registriert seit: 25. Mai 2006
Ort: Rostock / Bremen
2.037 Beiträge
 
Delphi 7 Enterprise
 
#5

AW: Binäre (Hex) Suche

  Alt 16. Mär 2013, 13:23
... Falls Interesse besteht, kann ich die kleine Demo ja hochladen!
Also ich würd mal Intresse anmelden
Martin
MFG Caleb
TheSmallOne (MediaPlayer)
Die Dinge werden berechenbar, wenn man die Natur einer Sache durchschaut hat (Blade)
  Mit Zitat antworten Zitat
Alter Mann

Registriert seit: 15. Nov 2003
Ort: Berlin
948 Beiträge
 
Delphi 10.2 Tokyo Professional
 
#6

AW: Binäre (Hex) Suche

  Alt 16. Mär 2013, 14:08
Hi,

ich habe ein halbwegs brauchbares Ergebnis. Die Frage ist nun: geht das auch schneller?
Delphi-Quellcode:
unit uHexSearch;

interface

uses
  SysUtils, Classes;

type
  THexSearchFoundEvent = procedure(Sender : TObject;
                                    Position : Integer;
                                    var Cancel : Boolean) of object;
  THexSearchProgressEvent = procedure(Sender : TObject;
                                      Position : WORD;
                                      Max : Int64) of Object;

  THexByteArray = Array of Byte;

  TFiFoByteBuffer = class(TObject)
  private
    FBuffer : THexByteArray;
    FCount : Int64;
    function GetHasData : Boolean;
    function GetByteStr : String;
  public
    constructor Create(aSize : Integer);
    procedure Add(Value : Byte);
    property HasData : Boolean read GetHasData;
    property ByteStr : String read GetByteStr;
  end;

  THexSearch = class(TComponent)
  private
    FBytes : String;
    FBuffer : TFiFoByteBuffer;
    FCanCancel : Boolean;
    FStream : TStream;
    FSearchTime : TDateTime;
    FOnFound : THexSearchFoundEvent;
    FOnProgress : THexSearchProgressEvent;
    procedure Search(aStream : TStream;
                     const aBytes : String);
    function EqualBytes(aSource, aSearchStr : String) : Boolean;
  protected
    procedure DoFound(Position : Integer; var Cancel : Boolean); virtual;
    procedure DoProgress(Position : WORD; Max : Int64); virtual;
  public
    procedure Execute;

    property Cancel : Boolean read FCanCancel write FCanCancel;
    property Stream : TStream read FStream write FStream;
    property SearchBytes : string read FBytes write FBytes;
    property SearchTime : TDateTime read FSearchTime;
  published
    property OnFound : THexSearchFoundEvent read FOnFound write FOnFound;
    property OnProgress : THexSearchProgressEvent read FOnProgress write FOnProgress;
  end;

implementation

constructor TFiFoByteBuffer.Create(aSize : Integer);
begin
  SetLength(FBuffer, aSize);
  FCount := 0;
end;

procedure TFiFoByteBuffer.Add(Value : Byte);
var
  I : WORD;
begin
  for I := Low(FBuffer) to High(FBuffer) -1 do
   FBuffer[I] := FBuffer[I+1];
  FBuffer[High(FBuffer)] := Value;
  Inc(FCount);
end;

function TFiFoByteBuffer.GetHasData : Boolean;
begin
  Result := FCount >= Length(FBuffer);
end;

function TFiFoByteBuffer.GetByteStr : String;
var
  I : Integer;
begin
  Result := '';
  for I := 0 to Length(FBuffer)-1 do Result := Result + IntToHex(FBuffer[I], 2);
end;

procedure THexSearch.DoFound(Position : Integer; var Cancel : Boolean);
begin
  If Assigned(FOnFound) then FOnFound(Self,Position, Cancel);
end;

procedure THexSearch.DoProgress(Position : WORD; Max : Int64);
begin
  If Assigned(FOnProgress) then FOnProgress(Self,Position, Max);
end;

procedure THexSearch.Execute;
begin
  FSearchTime := Now;
  Search(FStream, FBytes);
  FSearchTime := Now - FSearchTime;
end;

procedure THexSearch.Search(aStream : TStream;
                            const aBytes : String);
var
  Buffer : Byte;
  FileSize : Int64;
begin
  FCanCancel := false;
  FileSize := aStream.Size;
  FBuffer := TFiFoByteBuffer.Create(Length(aBytes) div 2);
  try
  aStream.Seek(0, soFromBeginning);
    While (aStream.Position < aStream.Size) do
    begin
      aStream.Read(Buffer, SizeOf(Buffer));
      FBuffer.Add(Buffer);
      DoProgress(aStream.Position, FileSize);
      if FBuffer.HasData then
        if EqualBytes(FBuffer.ByteStr, aBytes) then
          DoFound(aStream.Position, FCanCancel);
      if FCanCancel then Break;
    end;
  finally
    FBuffer.Free;
  end;
end;

function THexSearch.EqualBytes(aSource, aSearchStr : String) : Boolean;
begin
  Result := CompareText(aSource, aSearchStr) = 0;
end;

end.
Das durchsuchen einer 5GB dauert 0.328 sec, bzw. nach dieser Zeit ist die
Bytefolge gefunden worden.

VG
  Mit Zitat antworten Zitat
Benutzerbild von Aphton
Aphton

Registriert seit: 31. Mai 2009
1.198 Beiträge
 
Turbo Delphi für Win32
 
#7

AW: Binäre (Hex) Suche

  Alt 16. Mär 2013, 14:33
Das durchsuchen einer 5GB dauert 0.328 sec, bzw. nach dieser Zeit ist die
Bytefolge gefunden worden.

VG
Das sagt nicht viel aus. Wichtig ist, an welcher Stelle sie gefunden wird. Dann kann man nämlich sagen, wie viele Bytes pro Zeiteinheit du damit durchkämmen kannst!

Die Geschwindigkeit dürfte übringens auch von Festplatte zu Festplatte verschieden sein. Eig. kann man nur lokal bzw. angewandt auf derselben HD Vergleiche aufstellen!

Achja - ich weiß nicht, ob man da noch was rausholen kann oder ob das eig. Unfug ist - so wie ich mit CreateFileMapping() umgegangen bin. Ich erfreue mich jedoch über Belehrung!

Edit: Ich wende mal deinen Algorithmus an, mal sehen, wenn er schneller ist, brauchste die Demo erst gar nicht runterzuladen!

Edit2: Dein Algorithmus läuft bei mir mit einer sehr geringen Geschwindigkeit. Für 1 mb habe ich 5 Sek. gebraucht
Ich wende sie übrigens auf ein FileStream an (genauso wie ich es auch bei meinem getan habe).
Wie hast du die angegebene Zeit Zustande gebracht?
Angehängte Dateien
Dateityp: rar HugeScan.rar (2,0 KB, 15x aufgerufen)
das Erkennen beginnt, wenn der Erkennende vom zu Erkennenden Abstand nimmt
MfG

Geändert von Aphton (16. Mär 2013 um 21:57 Uhr)
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 09:19 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz