大家好,虽然这个cuda学习项目已经很久了,但是持续有同学添加微信和star本项目,目前本人工作内容偏向控制和强化学习,所以不会使用到cuda,但做事情不能虎头蛇尾,决定重新更新项目并制作相关教学视频,请关注本人b站账户:https://space.bilibili.com/81228819 , cuda,强化学习相关视频将会在近期更新,您的关注是我更新的动力
具体内容可以访问博客:
- 0.0 腾讯云CUDA环境搭建
- 1.0 并行计算与计算机架构
- 1.1 异构计算与CUDA
- 2.0 CUDA编程模型概述(一)
- 2.1 CUDA编程模型概述(二)
- 2.2 给核函数计时
- 2.3 组织并行线程
- 2.4 设备信息查询
- 3.1 CUDA执行模型概述
- 3.2 理解线程束执行的本质(Part I)
- 3.2 理解线程束执行的本质(Part II)
- 3.3 并行性表现
- 3.4 避免分支分化
- 3.5 循环展开
- 3.6 动态并行
- 4.0 全局内存
- 4.1 内存模型概述
- 4.2 内存管理
- 4.3 内存访问模式
- 4.4 核函数可达到的带宽
- 4.5 使用统一内存的向量加法
- 5.0 共享内存和常量内存
- 5.1 CUDA共享内存概述
- 5.2 共享内存的数据布局
- 5.3 减少全局内存访问
- 5.4 合并的全局内存访问
- 5.5 常量内存
- 5.6 线程束洗牌指令
- 6.0 流和并发
- 6.1 流和事件概述
- 6.2 并发内核执行
- 6.3 重叠内核执行和数据传输
- 6.4 重叠GPU和CPU的执行
- 6.5 流回调
- This project is a set of CUDA programs
- Some of them are from the book "Professional CUDA C Programming"
- The others are coded by myself
- You can get more details from the website www.face2ai.com