Thema: Delphi Fuzzy Hash?

Einzelnen Beitrag anzeigen

Benutzerbild von quirks
quirks

Registriert seit: 5. Sep 2004
Ort: Fischbachtal
46 Beiträge
 
Delphi 8 Professional
 
#1

Fuzzy Hash?

  Alt 5. Okt 2004, 20:22
Hm, folgendes Problem: Ich möchte die Ähnlichkeit von Dateien herausfinden, um sie als Dubletten zu kennzeichnen. Hab bis jetzt mit SHA-1 gearbeitet, aber der erwischt nur wirklich gleiche Dateien . Ich möchte so was ähnliches wie DoublePics machen, nur ohne Beschränkung auf Filetype.
Beispiel, damits deutlicher wird:
Wenn in einem MP3 die Tags nicht drin sind, aber die Audio-Information genau die gleiche ist, soll 99% Übereinstimmung als Ergebnis rauskommen.
Mein Ansatz: Die am häufigsten vorkommenden n-byte-Gruppen suchen, speichern, und dann mit denen anderer Dateien vergleichen. Wäre aber vermutlich extreeem langsam...
Irgendwelche Ideen da draußen?
  Mit Zitat antworten Zitat