Für die Lösung eines Problems benötige ich demnächst vermutlich etwas wie eine eindeutige ID, welche ich aus einem gegebenem String berechnen kann, der ohnehin schon eindeutig ist und nur einmal vorkommen kann. Die ID benötige ich aus diversen Gründen zusätzlich.
Die ID sollte wenn möglich nicht so lang sein wie MD5. Welche Möglichkeiten bleiben mir da noch? Mir stehen dafür unter anderem die Wolfgang Ehrhardt Komponenten zur Verfügung.
Ich habe gerade CRC32 getestet. Aber ist das eindeutig genug?
Nein, definitiv nicht. Egal wie Du die ID berechnest, wenn sie kürzer ist als der Ursprungsstring kannst Du nie garantieren, das die erhaltene ID nicht auch aus einem anderen Input resultieren könnte. Das ist auch der Grund, wieso man bei Datenstrukturen, die einen aus einem String oder anderen Daten berechneten Hash-Wert als Schlüssel benutzen, den Orginalwert immer mit ablegen muss, damit man später solche Kollisionen erkennen kann.
Man kann zwar (theoretisch) für jeden gegebenen Satz von Strings ein Hash-Funktion finden, die innerhalb dieses Satzes für jeden der Strings einen eindeutigen Wert liefert, aber halt garantiert nur für Strings in dem vorgegebenen Satz, nicht für andere.
Wozu brauchst Du denn die ID, und muss sie unbedingt aus dem String berechnet sein? Wenn beides eigentlich voneinander unabhängig ist und Du nur eine
eindeutige ID brauchst ist eine
GUID keine schlechte Wahl.