AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Sonstige Fragen zu Delphi Delphi Eindeutiger Vergleich für große Dateien gesucht
Thema durchsuchen
Ansicht
Themen-Optionen

Eindeutiger Vergleich für große Dateien gesucht

Ein Thema von dahead · begonnen am 2. Aug 2005 · letzter Beitrag vom 10. Mai 2014
Antwort Antwort
Seite 2 von 12     12 34     Letzte »    
bigg
(Gast)

n/a Beiträge
 
#11

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:03
@dahead:
natürlich nicht, war nur ne blöde anspielung auf die neue rechtschreibung, die nun in fast allen bundesländern anerkannt ist

@nico:
Zitat:
...dies lässt aber keinen Umkehrschluss zu
Inwiefern? Könntest du deine Aussage näher erläutern?
  Mit Zitat antworten Zitat
Benutzerbild von nailor
nailor

Registriert seit: 12. Dez 2002
Ort: Karlsruhe
1.989 Beiträge
 
#12

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:08
wenn der hashwert gleich ist, sind die dateien nicht sicher gleich. mit der chance von 1 zu "'The Matrix' hat in allen Belangen Recht" könnten die dateien auch grundverschieden sein. oder sich in dem einen wichtigen byte der datei unterscheiden... oder oder oder...
Michael N.
http://nailor.devzero.de/code/sharpmath/testing/ --- Tests, Feedback, Anregungen, ... aller Art sehr willkommen!
::: don't try so hard - it'll happen for a reason :::
  Mit Zitat antworten Zitat
NicoDE
(Gast)

n/a Beiträge
 
#13

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:08
Zitat von bigg:
Könntest du deine Aussage näher erläutern?
Wenn die Prüfsummen gleich sind, müssen die Daten nicht identisch sein.
  Mit Zitat antworten Zitat
Benutzerbild von mschaefer
mschaefer

Registriert seit: 4. Feb 2003
Ort: Hannover
2.032 Beiträge
 
Delphi 12 Athens
 
#14

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:25
Moin moin,

also eins ist sicher, der binäre Vergleich ist relativ fehlerfrei zu programmieren. Mach für jede Datei einem Stream auf und lasse diese Byteweise durchlaufen. Jede Datei hat am Anfang eine gleiche Kennungs-Id (sagen wir zunächst 1). Unterscheidet sich eine Datei bekommt diese dann die nächste freie ID (hier:2) als zweite Variante. Eine weitere gleiche Datei in Variante 2 bekommt dann ebenfalls die 2. Da ein Stream bei grossen Dateien nicht die ganze Datei auf einmal einliset, ist das einfach und prinzipbedingt sicher.

Grüße // Martin
Martin Schaefer
  Mit Zitat antworten Zitat
bigg
(Gast)

n/a Beiträge
 
#15

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:29
Das sehe ich auch so, aber habt ihr schonmal eine Kollision in einem der oben genannten Hash-Algos gefunden oder kennt ihr Seiten, die sich näher mit dieser Problematik auseinandersetzen?
  Mit Zitat antworten Zitat
Benutzerbild von dahead
dahead

Registriert seit: 16. Mai 2005
620 Beiträge
 
#16

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:36
Zitat:
oder kennt ihr Seiten, die sich näher mit dieser Problematik auseinandersetzen?
die hab ich vorhin z. b. entdeckt:

http://www.schneier.com/blog/archive...a1_broken.html

bzw. auf wikipedia gibt es auch infos zu den algorythmen:

http://de.wikipedia.org/wiki/Sicherer_Hash-Algorithmus

@mschaefer: ja, so wollte ich das auch angehen. bin noch am überlegen, wie ich das am besten in mein programm einbaue.

@all: danke für die zahlreichen antworten!
  Mit Zitat antworten Zitat
Benutzerbild von mschaefer
mschaefer

Registriert seit: 4. Feb 2003
Ort: Hannover
2.032 Beiträge
 
Delphi 12 Athens
 
#17

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:47
Moin, moin,

also würde mir da einen Treeview nehmen und in der Wurzel das Vergleichsdatum einsetzten. In der nächsten Hierachie die gefundenen Varianten und in der hierachie darunter die Dateinamen. Damit hat man dann einen AdHoc-Überblick.

Grüße // Martin
Martin Schaefer
  Mit Zitat antworten Zitat
Benutzerbild von dahead
dahead

Registriert seit: 16. Mai 2005
620 Beiträge
 
#18

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 17:55
@mschaefer:

ja, das war jetzt nicht so gemeint, dass ich nicht weiß wie. die frage ist eher, wie ich das am besten in mein bestehendes programm einbaue. da muss ich noch eine geeignete möglichkeit finden.

am übersichtlichsten fände ich übrigens folgende struktur:

.........[ausgewählter ordner a]
.........|
.........`-> Datum (oder Hash) x
............ |
............ '-> Datei 1
............ '-> Datei 2
.........`-> Datum (oder Hash) y

.........[ausgewählter ordner B]
.........|
.........`-> Datum (oder Hash) x
............ |
............ '-> Datei 1
............ '-> Datei 2
.........`-> Datum (oder Hash) y

in der anlage ein screenshot, wie es bisher (md5) aussah. da sieht man auch das problem, was ich im aller ersten post ansprach.

wenn ich soweit bin und probleme haben sollte, mache ich besser einen neuen thread dazu auf. dennoch danke für den hinweis.
Miniaturansicht angehängter Grafiken
md5_small_305.jpg  
  Mit Zitat antworten Zitat
Benutzerbild von mschaefer
mschaefer

Registriert seit: 4. Feb 2003
Ort: Hannover
2.032 Beiträge
 
Delphi 12 Athens
 
#19

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 18:11
Moin, moin,

Mögen die Fachleute sich gerne melden, aber ich habe mal gelernt, das Hash-Algorithmen etwas für die Ablagevon Daten in Dateien mit wenigen aber gestreut liegenden Werten verwendet werden. Deine Dateien sind aber 100% gefüllt und damit ist der Hashwert kein geeignetes Instument für einen vollständigen Dateivergleich. Wenn es anders wäre hätten wir deutlich bessere Packprogramme zur Verfügung. Dein Beispiel belegt die Theorie - Gut so!
Hm wohl Zeit den Titel zu ändern.

Grüße // Martin



PS: Eigentlich kannst Du Deine Aufteilung beibehalten, Du mußt nur ein Feld "Varainte x" einbauen. Dafür kannst Du den Hashwert herausnehmen.
Martin Schaefer
  Mit Zitat antworten Zitat
Benutzerbild von dahead
dahead

Registriert seit: 16. Mai 2005
620 Beiträge
 
#20

Re: Hash für große Dateien (MD5/Tiger)

  Alt 2. Aug 2005, 18:24
@mschaefer:

falls du mir damit sagen willst, dass man um dateien eindeutig identifizieren zu können, um einen binären vergleich des inhalts nicht umhinkommt, so ist das klar. das hat mir bereits WoGe sowie NiceDe gesagt.

allerdings benötige ich die hash-summe um einen schnelleren vergleich der einzelnen dateien durchführen zu können.

Zitat:
Dein Beispiel belegt die Theorie - Gut so! Hm wohl Zeit den Titel zu ändern.
was soll das heißen?

edit:

Zitat:
Varainte x
meinst du damit den algorythmus der checksumme?
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 2 von 12     12 34     Letzte »    


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 16:15 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz