Ich habe Anfang des Jahres mit Delphi 10.4 und auch externer Hilfe mit SIMD den Möller–Trumbore intersection Algo umgesetzt. Das hat schon Geschwindigkeit gebracht (ich denk mal ca. Faktor 2).
Derzeit bin ich auch dabei dies in OpenCL mal zu reproduzieren. CUDA wäre mir zu hardwarespeziell.
Zum Laufen bekommen habe ich OpenCL mit den OpenCL Headern von GlSzene:
Platform/Device/Context/CommandQueue/Buffer usw.
das ClProgramm ist noch total Basic: einfach get_global_id(0) und dies zurückliefern.
Aber es läuft in 32 und 64 bit.
Etwas alten Code findet man hier:
https://code.google.com/archive/p/de...encl/downloads
Und hier wird auch OpenCL mit Delphi genutzt:
https://habr.com/ru/articles/533206/
Mitov hatte ich nicht probiert, da es erst mal was kostete und GlScene erst mal Header lieferte.
Dass OpenCL direkt in Delphi 10.4 geht ist mir auch unbekannt.
Code testen hab ich auch noch keine Ahnung - soweit bin ich auch noch nicht (OpenCL hatte erst mal eher experimentier Status für mich).