CUDATutorial 从零开始学习 CUDA 高性能编程,从入门到放弃,哦不!一起来边学习,边打笔记,日拱一卒! 学习路线 新手村系列 构建 CUDA 编程环境 手写第一个 Kernel nvprof 性能分析 尝试第一次优化 Kernel 初阶系列 初识多线程并行计算 手写实现矩阵乘 Matmul 矩阵乘 Matmul 性能优化实践 中阶系列 手写实现 Reduce Reduce 性能优化实践 循环展开和动态并行 共享内存和同步 常量内存 ....(补充中) 高阶系列 页锁定和主机内存 CUDA 流和多流使用 使用多个 GPU 计算 ...(补充中) 大师系列 我现在还不知道写啥,毕竟我现在还是菜鸡~~