DefTruth/CUDA-Learn-Notes

🌤🌤 CONTRIBUTE 🎉🎉

DefTruth opened this issue a year ago · 1 comments

DefTruth commented a year ago

🌤🌤目标

首先，任何kernel实现都欢迎，本仓库学习/练习为主，性能最优非本仓库最终目标，先会用，然后再用好。性能最优推荐直接使用cuBLAS, cuDNN, FlashAttention, TensorRT等官方实现。如果有感兴趣的kernel希望在本仓库实现，可以评论本issue（虽然我不一定有能力实现🌚），比如：

☕️☕️Kernel Trace

xxx kernel
...

👨‍💻👨‍💻代码规范

提交代码需要遵循以下规范：

每个算子/kernel使用单独的目录，参考relu, gelu等
参考任一现有kernel，使用torch验证结果正确性
本仓库使用2空格作为缩进
{ }使用非上下对齐风格
pragma unroll和当前for loop代码对齐
一行代码尽量不超过100字符
不使用/未ready的代码删除
其他想到再写🌚......

🎉🎉 致谢

感谢 @bear-zd, @wangzijian1010等为本仓库提供大量kernel实现 ~

☕️☕️Kernel Trace

github-actions commented a year ago

This issue is stale because it has been open for 30 days with no activity.