Примеры к курсу по OpenCL

Для сборки требуется установить OpenCL SDK и запустить cmake.

Работоспособность примеров проверена на следующей системе:

  1. windows с установленным intel opencl sdk

Замеры времени работы примера reduce на NVidia GeForce 1080 GTX:

Версия Время работы, мс
Глобальная память 31.6
Локальная память 27.4
Локальная память, расходящиеся ветвления 11.5
Локальная память, без конфликтов банков памяти 10.8
Локальная память, pragma для развертки циклов 7.63
Локальная память, "ручная" развертка 6.21