OK, es läuft. Jetzt bleibt die Frage, wieso ist es als Multithreaded-Version *signifikant* langsamer?
Um die tparallel.&for() loop nutzen zu können, muss ich ja einen min, und einen max wert angeben, um terminieren zu können. Soweit so klar. Also hol ich mir einen array[min..max], fülle den auf (das muss im moment noch linear erfolgen, schien mir ein bottleneck zu sein, daher hab ich den teil jetzt auf pointers umgestellt (anstatt
for i:=low to high do ar[i]:=//...
jetzt
Delphi-Quellcode:
filler:=@ar[low];
stop:=@ar[high];
while filler<>stop do
begin
filler^:=//..
inc(filler)
end;
//last item
filler^:=//..
und lasse per parallel loop auf teilbarkeit (relativ einfach)/ primality (sehr rechenintensiv. hieran hängts's wohl, dass es trotzdem nicht schneller ist.) testen. Hier hatte ich aufgrund der parallelen Bearbeitung (vorallokation eines Threadpools, getestet mit unterschielicher Größe von 2,8,16 Threads) der intensiven schritte auf einen Vorsprung gegenüber linearem testen gehofft. Das gegenteil scheint, ceteris paribus, der fall.
Am Befüllen scheint es nach entsprechender Testung nicht zu liegen. Hier habe ich abseits mal einen vergleich laufen lassen, und kaum unterschiede feststellen können
(WO)Mache ich einen Denkfehler?