高性能并行编程与优化 - 课件
欢迎光临开源并行课!您将学到现代 C++ 与高性能计算相关知识! 这里用来存放上课用到的 源代码 和 课件 等。
- 每周六14点开播:https://live.bilibili.com/14248205
- 录播也会上传到:https://space.bilibili.com/263032155
下载课件
如果你不知道 Git 如何使用,可以点击这里:一键下载。
目录结构
- 01/slides.ppt - 第一课的课件
- 01/01 - 第一课第一小节的代码
- 01/02 - 第一课第二小节的代码
- 02/slides.ppt - 第二课的课件
- 以此类推……
每一小节的代码目录下都有一个 run.sh,里面是编译运行该程序所用的命令。
课程大纲
课程分为前半段和后半段,前半段主要介绍现代 C++,后半段主要介绍并行编程与优化。
- 课程安排与开发环境搭建:cmake与git入门
- 现代C++入门:常用STL容器,RAII内存管理
- 现代C++进阶:模板元编程与函数式编程
- 编译器如何自动优化:从汇编角度看C++
- C++11起的多线程编程:从mutex到无锁并行
- 并行编程常用框架:OpenMP与Intel TBB
- 被忽视的访存优化:内存带宽与cpu缓存机制
- GPU专题:wrap调度,共享内存,barrier
- 并行算法实战:reduce,scan,矩阵乘法等
- 存储大规模三维数据的关键:稀疏数据结构
- 物理仿真实战:邻居搜索表实现pbf流体求解
- C++在ZENO中的工程实践:从primitive说起
- 结业典礼:总结所学知识与优秀作业点评
前置条件
硬件要求:
- 64位(32位时代过去了)
- 至少2核4线程(并行课…)
- 英伟达家显卡(GPU 专题)
软件要求:
- Visual Studio 2019(Windows用户)
- GCC 9 及以上(Linux用户)
- CMake 3.12 及以上(跨平台作业)
- Git 2.x(作业上传到 GitHub)
- CUDA Toolkit 10.0 以上(GPU 专题)