Hallo,
ich habe jetzt keine Version von csDictionary gesehen, die mit Int64 umgeht, sondern nur cardinal.
Deshalb habe ich dort einen TDictIntType eingeführt und dann auf Int64 zugewiesen.
Die procedure Add habe ich in eine Function:boolean umgewandelt, damit ich weiß, ob der Wert eingefügt wurde, also schon vorhanden war, sonst hätte ich .contains nutzen müssen, was in .Add ja auch gemacht wird.
Das sollte ich vielleicht alzaimar ( wo ist der überhaupt ? ) vorschlagen.
Ich habe statt eines Pointers auf den Schlüssel A64[j] den Index j im Feld A64 im Hashfeld abgespeichert.
10 Mio Werte sind in 7,6 Sekunden eingefügt.( 420 MB belegt )
Delphi-Quellcode:
A64 : array of TDictIntType;//Int64
j := low(A64);
For i := low(A64) to High(A64) do
begin
Wert := random(RANDOMRANGE);
// Nur wenn der Wert nicht doppelt war
// wird er eingefuegt
IF TestHash.Add(Wert,Pointer(j)) then
begin
A64[j] := Wert;
inc(j);
end;
end;
setlength(A64,j);
Anhand des Schlüssels erhält man also die Position im Feld.
Die Ausgabe auf dem Notebook ist dann:
Code:
Erzeugen von 10000000 Zufallszahlen [0..9223372036854775806] 00:00:00,678
Einfügen von 10000000 verschiedenen Daten in 00:00:07,546
0 702565670347126292 TRUE 0
1 8731026331172931038 TRUE 1
2 7315597276161830344 TRUE 2
3 6054991081758643474 TRUE 3
4 974630338373080205 TRUE 4
5 2802662720263935392 TRUE 5
6 992661471859547074 TRUE 6
7 7770774513438344891 TRUE 7
8 2847780276242346111 TRUE 8
9 8442204931085970693 TRUE 9
10 2662600269196791808 TRUE 10
Auflösen der Hashmap in 00:00:04,574
25e6 Werte brauchen über 1 Gbyte
Ich hoffe den Index abzuspeichern macht Sinn für Dich
Gruß Horst
P.S
In einer Hash-Tabelle kann es keine doppelten Einträge geben.
Edit: ich habe create geändert, sodass man man die zu erwartende Anzahl der Elemente vorgeben kann, das beschleunigt auf dem Desktop Rechner die Einfüge Zeit von 15,5 auf 7,6 Sekunden, der Abbau dauert 8,4 Sekunden.