Registriert seit: 1. Dez 2012
Ort: CH BE Eriswil
760 Beiträge
Delphi 11 Alexandria
|
OpenCL / CUDA
19. Sep 2023, 17:09
Alle paar Jahre (zuletzt im 2004) nehme ich eine alte Delphi Software aus dem letzten Jahrtausend hervor (Mathematik) und verbessere einige Dinge. Dabei geht es v.a. auch um Speed-Optimierung.
Ich frage mich nun, wieviel Sinn es macht, OpenCL oder CUDA Unterstützung einzubauen. Leider habe ich noch null Ahnung von OpenCL/CUDA.
Ich habe einen integer-Vektor/Array mit etwas über 200'000 Elementen.
Auf diesen Vektor wirkt wiederholt (zum Beispiel 100'000 Mal) eine von 20 Abbildungen, f1,..,f20.
Jede Abbildung fi, welche v in v' überführt ist sehr einfach:
- Es werden jeweils 2 bis 10 der Vektorelemente addiert zu einer Summe s.
- s wird mit einer Konstanten c multipliziert.
- Ein weiteres Vektorelement vk wird mit einer Konstanten d multipliziert.
- Die Summe c*s + vk*d wird in vk' geschrieben.
Jedes Vektorelement wird dabei durch fi genau einmal gelesen und jedes vk' genau einmal geschrieben.
D.h. die Berechnungen der etwa 50'000 vk' können parallel ablaufen und die Werte vk' können direkt wieder in v geschrieben werden (kein zusätzlicher Speicher für v' nötig).
Ich habe die Berechnung mit parallel.for und mit Tasks aufgeteilt (da fi sehr rasch berechnet werden kann, habe ich die Aufgabe in nur zwei Teile geteilt - bei mehr Teilen verliere ich gegenüber einer "single thread Lösung"); das bringt aber leider nur etwa 20% Zeitgewinn.
Wäre eine OpenCL/CUDA Lösung viel schneller?
Michael Gasser
|