CudaNote
说明
- 以GPU为代表的大规模并行处理器的广泛应用,释放出了人工智能算法在大数据环境下的巨大能量。
- 掌握GPU平台下的编程**与技能,已经成为深入理解及运用人工智能核心理论方法的必备基础。
- 主要介绍针对GPU的编程技术,通过大量编程实践,建立对实际数据处理任务可并行性的理解。
- 掌握利用GPU平台对计算密集型科学工程问题进行加速求解基本理论与方法。
主要内容
线程模型、数据并行、显存体系结构、规约、线性代数运算加速以及基于GPU计算的应用案例等
大纲
- 介绍GPU的概念。以及GPU在计算机中的一般用途,通过和CPU对比分析其特点
- 线程和块。对CPU和GPU混合编程模型进行展开介绍,详细分析CUDA程序的执行模型,从而引出线程和块的概念。
- 错误检查和显存指针。
- 数据并行的程序执行模型结合块、网格概念,详细介绍线程的维度属性。
- 存储器层次结构。
- 存储器访问合并。
- 矩阵乘法。
- 规约.
- 流与统一存储。
- 综合应用使用cuda实现Mnist数据集上的分类