Mhm, hast du dir schon
OpenCL angesehen?
Da gabs auch ein Delphi-Beispiel im Emba-Forum:
https://forums.embarcadero.com/threa...threadID=22455
nVidia hat z.B. eine OpenCL-Implementierung in ihren aktuellen Treibern drin, die wrappen das dann intern auf deren CUDA.
Es gibt auch ein Projekt dazu, Delphi-OpenCL:
https://code.google.com/p/delphi-opencl/downloads/list