WAVE SUMMIT+2024上半年飞桨开源之星评选-信息征集
Harryoung opened this issue · 13 comments
大家好~飞桨开源社区2024上半年开源之星评选正式启动啦!🤩
🌟飞桨开源之星🌟 是飞桨开源社区开发者的最高荣誉,用于表彰一段时间内为飞桨开源项目(含 PaddlePaddle 下的所有开源项目)做出突出开源代码贡献的社区开发者,每年评选两期,每期 10 人,在百度 WAVE SUMMIT 开发者大会上进行颁奖,并在开源社区公示。往期开源之星情况可以戳这里 ➡️ 飞桨开源之星。感兴趣的话快来提交评选信息吧~~
本期开源之星将继续由 飞桨社区开源发展工作组 完成评定,全过程公开透明,欢迎监督!
Updated at 2024-6-11: 本期开源之星将由 飞桨社区开源发展工作组 的两位代表,和百度飞桨的三位资深工程师组成评选小组,进行评定。
按照往届惯例,PaddlePaddle Hackathon 6th 活动进行中,根据活动规则设计,在第六期飞桨黑客松活动中获取 🌟 数排名前 3 的开发者当选飞桨开源之星,该结果会在6月17日黑客松结果公示中同步更新~
报名方式
参选范围:非百度任职的飞桨开源项目贡献者
贡献时间:2024年1月1日-6月11日报名截止前(可在报名截止前编辑更新评论)
本期开源之星候选人依旧采取自荐的方式,有意向参与评选的开发者请参考如下格式回复本 issue,如果有你支持的开发者,欢迎通过回复表情点赞 👍 的方式提高 ta 的人气呀~
### Github ID:[xxx](https://github.com/xxx)
(个人介绍)
### PR 贡献(必填)
- PR 合并次数:xx / [查询链接](https://github.com/search?q=author%3ALigoml+org%3APaddlePaddle+type%3Apr+merged%3A2024-01-01..2024-06-11&type=pullrequests) (注意替换 author 值)
- 代表性 PR 展示:
### ISSUE 贡献(必填)
- ISSUE 提交次数:xx / [查询链接](https://github.com/search?q=author%3ALigoml+org%3APaddlePaddle+type%3Aissue+created%3A2024-01-01..2024-06-11&type=issues) (注意替换 author 值)
- 代表性 ISSUE 展示:
### 评论贡献(必填)
- 评论 ISSUE 次数:xx / [查询链接](https://github.com/search?q=commenter%3ALigoml+org%3APaddlePaddle+type%3Aissue+created%3A2024-01-01..2024-06-11&type=issues) (注意替换 author 值)
- 评论 PR 次数:xx / [查询链接](https://github.com/search?q=commenter%3ALigoml+org%3APaddlePaddle+type%3Apr+created%3A2024-01-01..2024-06-11&type=pullrequests) (注意替换 author 值)
### 代码审查贡献(必填)
- 评审次数:xx / [查询链接](https://github.com/search?q=type%3Apr++reviewed-by%3ALigoml++org%3APaddlePaddle+created%3A2024-01-01..2024-06-11&type=pullrequests)(注意替换 author 值)
- 代码审查贡献简述:(如主要参与哪些方面的代码审查,review 多少人的 pr 等)
### 生态贡献(加分项)
- 开源布道:如发布关于开源的专著、文章、公众号等,或是受邀参加技术峰会、开发者大会等,或是在相关会议、活动上推广开源文化等(对活动形式和参与次数进行描述)
- 社区活动:组织或参与社区SIG会议、技术交流、成员单位meetup、开源校源行等(对活动形式和参与次数进行描述)
### 自荐理由 (必填)
评审结果不仅是比较每项指标数量上的差异,将结合每位开发者贡献产生的影响力予以客观公正的评价。申请人可对每项提供数据的指标,进行影响力、活跃度、代码质量、项目效果等方面进行补充描述,字数不限。
报名截止时间
2024年6月11日,截止报名后此 issue 会关闭,启动飞桨社区开源发展工作组评审。
彩蛋 🍻 🍻 🍻
如果你想围观看看,飞桨框架的代码贡献情况,可以考虑使用这个命令: git shortlog -n --since="2024-1-1"
,如果你还想继续深挖看看的话,可以考虑用这个代码仓库: https://github.com/PFCCLab/release-notes-drafter
Github ID:megemini
(个人介绍)
凑个数 ~
PR 贡献(必填)
- PR 合并次数:18 / 查询链接 (注意替换 author 值)
- 代表性 PR 展示:
ISSUE 贡献(必填)
- ISSUE 提交次数:2 / 查询链接 (注意替换 author 值)
- 代表性 ISSUE 展示:
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:14 / 查询链接(注意替换 author 值)
- 代码审查贡献简述:(如主要参与哪些方面的代码审查,review 多少人的 pr 等)
typing hint 方面的 review ~
生态贡献(加分项)
木有 ~
自荐理由 (必填)
统计一下这段时间做了些啥,发现退步明显,该给自己加鸡腿了 🫠
Github ID:cocoshe
生性昼伏夜出ovo,爱好觅食探索学习~
PR 贡献
- PR 合并次数:19 / 查询链接
- 代表性 PR 展示:
PaddlePaddle/PaddleMIX/pull/511 增加PaddleMIX套件对InternLM-XComposer2的推理和SFT支持
PaddlePaddle/PaddleMIX/pull/456 增加PaddleMIX套件对CogVLM的推理支持
PaddlePaddle/PaddleMIX/pull/445 增加PaddleMIX套件对CogAgent的推理支持
/pull/794 编写PHI算子库kernel注册全流程源码阅读文档
PaddlePaddle/docs/pull/6469 更新利用docker进行源码编译安装的文档
PaddlePaddle/Paddle/pull/60968 重构 copysign 算子,减小编译后目标代码文件大小
ISSUE 贡献
- ISSUE 提交次数:2 / 查询链接
- 代表性 ISSUE 展示:
PaddlePaddle/Paddle/issues/62301
PaddlePaddle/Paddle/issues/63725
评论贡献
代码审查贡献
- 评审次数:3 / 查询链接
- 代码审查贡献简述:主要是自己的pr,一些对代码细节的讨论
生态贡献
- 社区活动:杭州开发者线下meetup
自荐理由
自去年年底第五届 Hackathon 开始接触 Paddle 开源社区😊满怀着好奇😯从只会 Python 调包 nn.Layer
😥知其然不知其所以然的「调包侠」😭深谙基础设施的重要性😨再初窥 AI framework🧐虽然读源码比较痛苦😣但是把知识串在一起后又有一种恍然大悟×小悟的欣喜😋而后借着护航计划的机会🤓接触了比较新的 PaddleMIX 套件库😚在阅读代码过程中多多思考和总结🤔同样梳理了源码😤总结了博客🥳对其与 PaddleNLP 的复用设计感到非常妙😲过程中也逐渐熟悉了各种多模态大模型和 huggingface 相关库的设计🤗忽然有种打通任督1脉之感😋不再像以前无头苍蝇一样不知道去哪里找代码😎另外在社群中也有处于各种人生阶段的人🤯线上群友幽默风趣🫨线下交流也能在学业、事业、人生上受到大家的启发🥰作为一个又死宅又i的社恐人士😶除了打游戏之外😥很少能和身边人有共同语言😶🌫️希望未来和大家一起进步😍自己也要像向楼上楼下以及社群里又努力又聪明的大佬们学习🤤~
看到楼上顺师傅写的,切身体会到什么叫 人狠字不多()
Github ID:zeroRains
生人I,熟人E,喜欢宅家,对并行计算和推理优化很喜欢(但我不一定会)
PR 贡献(必填)
- PR 合并次数:22 / 查询链接
- 代表性 PR 展示:
- PaddlePaddle/Paddle#64253
- PaddlePaddle/Paddle#63064
- PaddlePaddle/Paddle#65002
- PaddlePaddle/Paddle#62793
- PaddlePaddle/Paddle#61613
ISSUE 贡献(必填)
- ISSUE 提交次数:1 / 查询链接
- 代表性 ISSUE 展示:
- PaddlePaddle/Paddle#64226
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:10 / 查询链接
- 代码审查贡献简述:主要是对自己PR的修改,包括对写法的补充说明,寻求修改意见以及实现讨论等
生态贡献(加分项)
暂无
自荐理由 (必填)
我大概是第四届Hackathon开始进入Paddle开源社区,最初是只会调Python包进行炼丹,后来在@AndSonder 的安利下😆,发现AI Framework的开发好像更对我胃口😋,就选择参加了第四届Hackathon,最初啥也不知道,第一个PR就是简单地实现异常抛出。后面在不断地学习中掌握了算子开发的一些技巧,第二个PR是在@Asthestarsfalll @AndPuQing 的帮助下🤞,完成了对Tile op的GPU性能优化(成就感拉满😁)。后续也参加了开源创新大赛为Paddle贡献了一个分布式op的迁移,同时也探索Mask RCNN的性能优化(太菜了,没能产生有用的PR🤣👉)。接着也继续参加了第五届Hackathon为Paddle贡献了不少fused算子的迁移,第六届Hackathon参与了护航计划为Paddle的组合机制做贡献,其中新增的reduce_as op在组合机制的反向拆解处理Broadcast类的计算时起了很大作用,同时对于sigmoid_cross_entropy_with_logits_grad op的修复,也扫除了Paddle的一颗暗雷🥰。经过一年半的练习,逐渐掌握了一些AI Framework的开发和优化技巧,收益匪浅❤。今后也会继续为Paddle做贡献,与大家一起学习,共同进步🙌。
Github ID:AndSonder
『咖啡』狂爱爱好者,『键圈』入门小白,对分布式和CUDA编程很感兴趣,努力学习 ing
PR 贡献
-
PR 合并次数:21 / 查询链接
-
代表性 PR 展示:
ISSUE 贡献
-
ISSUE 提交次数:1 / 查询链接
-
代表性 ISSUE 展示:
评论贡献
代码审查贡献
-
评审次数:6 / 查询链接
-
代码审查贡献简述:主要是对自己的 PR,对代码实现的一些讨论
生态贡献
- 开源布道:
- 在 openvino 的公众号上发布 『代码贡献 | 为 OpenVINO™ 支持 Paddle 2.5』
- hackton 6th Paddle稀疏计算使用指南
- hackton 6th Paddle傅里叶变换基础及领域应用
- hackton 6th Paddle Inplace 使用指南
- 社区活动:无
自荐理由
最近半年的相关工作都是与大模型场景下静态图自动并行相关的工作📊🤖,很多工作也很具有挑战性💪,比如『为Paddle支持Zero-Bubble并行编排』🧩🚀。在参与这些工作的过程中学习到了很多📚🧠,非常开心能为Paddle和Paddle社区做出贡献🎉🤗,每次解决一个难题都感到特别成就感🏆。期待未来能够与大家一起多多给Paddle提PR🔧📈💡,共同推动Paddle的发展🚀🌟。
Github ID:Yang-Changhui
(个人介绍)
萌新程序员一枚,paddle社区新手贡献者😁😁
PR 贡献(必填)
PR 合并次数:5 / 查询链接
代表性 PR 展示:
PaddlePaddle/PaddleScience#870
PaddlePaddle/PaddleScience#867
ISSUE 贡献(必填)
ISSUE 提交次数:8 / 查询链接
代表性 ISSUE 展示:
PaddlePaddle/PaddleScience#896
评论贡献(必填)
评论 ISSUE 次数:6 / 查询链接
评论 PR 次数:3 / 查询链接
代码审查贡献(必填)
评审次数:3 / 查询链接
代码审查贡献简述:主要是自己的pr,一些对代码细节的讨论
生态贡献(加分项)
暂无
自荐理由 (必填)
我是一次偶然的机会参加了飞桨的论文复现营活动,让我从一个只会调超参数的深度学习的萌新,了解了数据集、网络的构建以以及整个的训练流程,从此就入坑飞桨了😊。从论文复现营开始,我参加了飞桨举行的各种活动,在第四期黑客松中认领了yolov6的复现任务,可惜的是,最终没有完成任务😭😭。然后我积极学习,又参加了第五期黑客松,终于一举完成了两个任务😁。并在今年有幸参与飞桨护航计划,在@zhiminzhang0830 导师的帮助下,完成了任务😄。在参与这些活动中,我学到了很多,希望未来能够继续为paddle做出更多的贡献,提交更多的PR。
Github ID:lshpku
我是北京大学计算机系统结构专业的硕士,研究方向包括软硬件协同设计、微处理器设计、编译器和深度学习。
PR 贡献(必填)
- PR 合并次数:3 / 查询链接
- 代表性 PR 展示:
PaddlePaddle/Paddle#62612 移除了Convert0DTo1DPass,提供了一个测例测试0D Tensor的支持
PaddlePaddle/Paddle#64694 从GroupOp中获取Reduce算子的原始维度信息
PaddlePaddle/Paddle#64240 提出了一种新的Tiling流程,对于多种内存排列顺序的Reduce算子都能保证凝聚访存
ISSUE 贡献(必填)
- ISSUE 提交次数:0
评论贡献(必填)
- 评论 ISSUE 次数:1 / 查询链接
- 评论 PR 次数:0
代码审查贡献(必填)
- 评审次数:0
生态贡献(加分项)
无
自荐理由 (必填)
我在第六期护航计划中主要做了Reduce访存顺序优化的工作。由于Reduce算子有丰富的维度顺序和形状大小,当前Paddle在生成Reduce Kernel时需要人工介入且只对于特定情况性能较好。我首先手写了大量CUDA代码,归纳高性能Reduce Kernel所需的原则,由此提出了一种统一的Reduce维度划分方式,和与之配套的Tiling流程。我在阅读了Paddle的动转静全流程代码后,在CINN后端的调度阶段实现了新的Tiling流程,并修复了代码生成阶段的一些错误。当前我已经将归约维在最后一维的Reduce接入新的Tiling流程,在多个子图上取得了10%~150%的性能提升。我的工作的意义在于为Reduce Kernel生成提供了一个新的框架,后续只要对不同类型的Reduce算子写模板即可支持更多情况。
Github ID:NKNaN
刚刚接触深度学习框架开发的小白,喜欢撸猫和看动画片的宅宅
PR 贡献(必填)
- PR 合并次数:68 / 查询链接
- 代表性 PR 展示:
- PaddlePaddle/PaddleMIX#366
- PaddlePaddle/Paddle#63521
- PaddlePaddle/Paddle#63513
- PaddlePaddle/Paddle#64001
ISSUE 贡献(必填)
- ISSUE 提交次数:2 / 查询链接
- 代表性 ISSUE 展示:
- PaddlePaddle/Paddle#62009
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:37 / 查询链接
- 代码审查贡献简述:主要是对自己的pr做修改,回复修改意见,探讨修改方法。
生态贡献(加分项)
暂无
自荐理由 (必填)
去年在网上冲浪时第一次接触了飞桨社区,当时想要在 github 上找找深度学习相关的项目来试着做一下,丰富一下 github 经历,于是就找到了飞桨社区的快乐开源活动,在 issue 列表里发现了一个自己稍微熟悉一点的一个为 PaddleScience 增添 HMC API 的任务,在学习了 tfp 对这个 API 的写法之后自己用 Paddle 框架写了一遍,但是一开始根本不知道自己写的对不对也不敢提交自己写的代码,直到后来另一位朋友提交了代码然后合入了,我才敢在别人写的基础上结合自己的写法稍微做了一些修改。后来通过第五次黑客松以及启航计划的学习,初步了解了 Paddle 框架,了解了怎么样写文档、怎么样写单测、怎么样提 pr 、怎么样 review,也学习了如何利用 git 进行协同开发。在2024上半年参与了护航计划的框架 API 易用性提升项目,对 Paddle 框架 API 中存在功能短板或 bug 的地方进行增强和修改,在导师@zhwesky2010的指导下,提交并合入了一系列代码,在这个过程中收获到很多。个人觉得飞桨社区的活动经历,不仅提供给我了一个为国内深度学习框架做贡献的机会,也让我迅速成长,弥补了许多没有接触过的开发知识。
Github ID:YibinLiu666
浙大研一,苦逼打工人
PR 贡献(必填)
- PR 合并次数:15 / 查询链接
- 代表性 PR 展示:
- PaddlePaddle/Paddle#60618
- PaddlePaddle/Paddle#62533
- PaddlePaddle/Paddle#63137
- PaddlePaddle/Paddle#64432
- PaddlePaddle/Paddle#64127
ISSUE 贡献(必填)
- ISSUE 提交次数:0 / 查询链接 (注意替换 author 值)
- 代表性 ISSUE 展示:
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:9 / 查询链接(注意替换 author 值)
- 代码审查贡献简述:主要是自己的pr被研发大哥review后的回复
生态贡献(加分项)
无
自荐理由 (必填)
我是从去年9月份的黑客松开始加入到paddle社区的,期间主要是做一些api开发与算子优化的工作。在今年上半年参加到护航计划中,主要参与高阶微分的性能优化。期间优化了部分算子的一阶、高阶微分的计算速度与显存占用,同时也新增了一些算子的高阶微分实现,修复了一些算子反向计算的bug,在导师 @HydrogenSulfate 的帮助下顺利完成了这期护航计划,也在paddle中学到了很多,交到了很多朋友。未来我也会继续活跃在paddle社区,继续参与paddle的开发,为社区贡献更多的力量。
Github ID:invictuszhao
北交大计算机学院大四,正调研和学习OCR方向
PR 贡献(必填)
-
PR 合并次数:1 / 查询链接
-
代表性 PR 展示:
PaddlePaddle/PaddleOCR#11999
ISSUE 贡献(必填)
- 无
评论贡献(必填)
- 无
代码审查贡献(必填)
- 无
生态贡献(加分项)
-
参与PaddleOCR算法模型挑战赛-赛题二:通用表格识别任务排行榜,排行榜第一名。
-
将表格识别算法推理速度提升3倍,并将核心代码upstream至PaddleOCR:SLANet
自荐理由 (必填)
通过参与PaddleOCR组织的高水平竞赛,让我快速学习了深度学习相关知识,并上手训练模型。在竞赛过程中锻炼了我发现问题,并利用深度学习知识解决问题的能力。也让我了解到PaddlePaddle这一优秀的国产深度学习框架,希望后续能够多多参与Paddle社区建设,向各位前辈学习。
Github ID:gouzil
凑数+1
PR 贡献(必填)
-
PR 合并次数:56 / 查询链接
-
代表性 PR 展示:
PaddlePaddle/docs#6458
PaddlePaddle/Paddle#61272
PaddlePaddle/Paddle#63093
PaddlePaddle/Paddle#63741
ISSUE 贡献(必填)
-
ISSUE 提交次数:6 / 查询链接
-
代表性 ISSUE 展示:
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:148 / 查询链接
- 代码审查贡献简述:主要是 CodeStyle、Dy2St、Cleanup 部分
生态贡献(加分项)
- 开源布道:无
- 社区活动:【护航计划源码分享会】SOT Python3.12 源码分享,【启航计划 PIR 团课程】PIR API 流程梳理源码分享
自荐理由 (必填)
统计了一下,有点退步了,下半年加油
Github ID:Corle-hyz
中科院计算所直博二年级,主要研究方向是高性能计算、分布式训练、作业调度等。
PR 贡献(必填)
- PR 合并次数:2 / 查询链接
- 代表性 PR 展示:
PaddlePaddle/Paddle#60248
PaddlePaddle/Paddle#60757
注:主要贡献为代码中的显存建模部分,PR由mentor代提
ISSUE 贡献(必填)
- ISSUE 提交次数:0
评论贡献(必填)
- 评论 ISSUE 次数:0
- 评论 PR 次数:0
代码审查贡献(必填)
- 评审次数:0
生态贡献(加分项)
无
自荐理由 (必填)
我参加了第五期和第六期的飞桨护航计划,在两期活动中都专注于全自动并行架构的升级工作。具体内容是为LLM分布式训练过程中的显存消耗建立一个高效、准确、层次化、可扩展、完善的模型。该模型考虑了目前PaddlePaddle框架以及其他SOTA工作进行LLM训练会用到的各种并行策略,包括TP、PP、VPP、SP、Sharding、Recompute,针对不同策略的组合配置,计算得到其理论的峰值显存消耗,从而在Auto Tuning的过程中将OOM的配置剪枝,大大减小了搜索空间,该显存模型的精确性和完备性超过竞品。同时,每一个可训练的配置仅仅使用大规模集群的一个子集去搜索,之后再将子集搜索到的配置扩展到全量资源上,从而达到并行Tuning的目的。经过这两步优化,最终将PaddlePaddle框架的Auto Tuning时间大大缩短,搜索速度提升至多有80x(原本用128卡搜7B模型的配置需要4.5h,现在可以只需3min)。该工作不仅弥补了原本PaddlePaddle框架在Memory Cost Model上的不足,拓展了Auto Tuning的功能,同时还具有一定的创新性,相关成果已撰写成论文投稿至某分布式领域的国际旗舰会议。
Github ID:zbt78
无敌i人,外表平和,内心躁动~
PR 贡献(必填)
- PR 合并次数:19 / 查询链接
- 代表性 PR 展示:
- PaddlePaddle/Paddle#63229
- PaddlePaddle/Paddle#62448
- PaddlePaddle/Paddle#61155
- PaddlePaddle/Paddle#60821
- PaddlePaddle/Paddle#60070
ISSUE 贡献(必填)
- ISSUE 提交次数:1 / 查询链接
- 代表性 ISSUE 展示:
- PaddlePaddle/Paddle#61975
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:9 / 查询链接
- 代码审查贡献简述:主要是自己的pr被研发大哥review后的讨论修改,有一次是对其他贡献者的pr的初步review。
生态贡献(加分项)
- 社区活动:北京线下meetup;启航计划线上代码串讲会-主题:注册复数&复数求导。
自荐理由 (必填)
我大概是去年第四期黑客松比赛末期接触到的Paddle,到后来参加第五期黑客松,启航计划,护航计划,期间做的主要工作是为Paddle支持复数相关工作,对一些算子增加复数类型,修复复数计算中的一个小bug,在导师@zhiminzhang0830 @GGBond8488的帮助下顺利完成护航计划。参与这些活动的过程中学习到了非常多的知识,认识了很好很好的人。能够为Paddle及其社区贡献力量,我感到无比的喜悦和自豪。希望未来能够持续为Paddle贡献代码,携手推动Paddle技术的进步和成长。
Github ID:zrr1999
西电研二,喜欢钻研新技术
PR 贡献(必填)
- PR 合并次数:18 / 查询链接 (注意替换 author 值)
- 代表性 PR 展示:
PaddlePaddle/Paddle#64323
PaddlePaddle/Paddle#64435
ISSUE 贡献(必填)
- ISSUE 提交次数:1 / 查询链接 (注意替换 author 值)
- 代表性 ISSUE 展示:PaddlePaddle/Paddle#60696
评论贡献(必填)
代码审查贡献(必填)
- 评审次数:23 / 查询链接(注意替换 author 值)
- 代码审查贡献简述:对自己的PR的一些讨论,和
【快乐开源】PIR test_errors 相关单测适配
里的一些PR。
生态贡献(加分项)
- 开源布道:无
- 社区活动:无
自荐理由 (必填)
下半年加油,争取达到喵喵的一半。