Для сборки требуется установить OpenCL SDK и запустить cmake.
Работоспособность примеров проверена на следующей системе:
- windows с установленным intel opencl sdk
Замеры времени работы примера reduce
на NVidia GeForce 1080 GTX:
Версия | Время работы, мс |
---|---|
Глобальная память | 31.6 |
Локальная память | 27.4 |
Локальная память, расходящиеся ветвления | 11.5 |
Локальная память, без конфликтов банков памяти | 10.8 |
Локальная память, pragma для развертки циклов | 7.63 |
Локальная память, "ручная" развертка | 6.21 |