/tpucontest

Primary LanguageCApache License 2.0Apache-2.0

参加算能TPU编程大赛赢取大奖

Best result:

  • svn update at: "Wed Feb 16 09:09:55 CST 2022"
  • conv2d :
    (case0:none) ,(case1:none) ,(case2:none) ,(case3:none) ,(case4:none) ,(case5:none) ,(case6:none) ,(case7:none) ,(case8:none) ,(case9:none) ,(case10:none) ,(case11:none) ,(case12:none) ,(case13:none) ,(case14:none)
  • depthwise :
    (case0:1126) ,(case1:1385) ,(case2:8153) ,(case3:2062) ,(case4:1387) ,(case5:452) ,(case6:488) ,(case7:309) ,(case8:1190) ,(case9:3345)
  • matmul :
    (case0:2280952) ,(case1:602) ,(case2:1162042) ,(case3:6529) ,(case4:653) ,(case5:421277) ,(case6:757) ,(case7:2964) ,(case8:2772) ,(case9:4365) ,(case10:1823) ,(case11:6859) ,(case12:926) ,(case13:4299) ,(case14:203516)
  • softmax :
    (case0:7626) ,(case1:6686) ,(case2:137015) ,(case3:2099117) ,(case4:969543)

竞赛说明

  • 参赛者报名后,使用算能AI芯片指令集对Conv2d、Depthwise2d、Matmul、Softmax算子进行编程,在保证正确性的前提下,我们对参赛者提交代码的性能进行排名,奖励排名靠前的团队或个人。
  • 参赛者只需完成okkernel/device下的ok_device_conv2d_contest.c ok_device_depthwise_contest.c ok_device_matmul_contest.c ok_device_softmax_contest.c 中TODO部分的代码,将此4个文件提交至svn(svn地址和密码在参赛者报名成功后会发送至邮箱),我们对参赛者提交代码的性能进行排名,奖励排名靠前的团队或个人。

报名入口

竞赛规则

  • Conv2d、Depthwise2d、Matmul、Softmax4个算子的实现和性能优化
  • 每个算子有多组参数,每个算子的每组参数称为一个case,每个case独立计分。
  • 参赛者只需使用OKKernel实现Device端的代码,提交时也只提交Device端的代码。
  • 参赛者提交的代码编译不通过视为失败提交,总分计0分。
  • 参赛者提交的代码运行时不能导致芯片Hang死等异常情况发生,否则视为失败提交,总分计0分。
  • 每个case只要实现正确至少可获得1分,并进入该case的性能排名环节。
  • 每个case的性能名次与得分:第一名6分,第二名5分,第三名4分,第四名3分,第五名2分,其他1分。
  • 计算所有case的得分总和,作为总分。
  • 一共有45个case,理论满分为6 × 45 = 270分。

互动

  • 主办方每天会检验参赛者的现有提交,并将每个case的性能数据以文件形式保存至参赛者的svn。
  • 主办方每天会在github更新每个case的最优性能,以及各奖项当前对应的总分。

奖励办法

  • 以总分由高到低的顺序为参赛者排名。
  • 总分为135分及以上的参赛者有资格获得前三等奖励:
    一等奖(1人):奖金50000元
    二等奖(2人):奖金30000元
    三等奖(5人):奖金10000元
  • 总分为27分及以上的参赛者有资格获得优秀奖(50人):奖金1000元。
  • 奖励不重叠,获得一、二、三等奖的参赛者不获得优秀奖。
  • 如果出现总分相同的情况,以提交时间为标准再次排名,提交越早,排名越靠前。

开发环境配置

如何编写程序

  • 阅读文档
    bm1684contest clone后,用浏览器打开doc/index.html。
    仔细阅读Introduction至Storage Modes,了解sophgo芯片结构和内存布局。
    About Function Names至Fixed Point Unary Functions,介绍了编程中所需的所有结构和函数声明,参赛者可在这段文档中查找okkernel/device/*demo.c中用到的各个结构和函数的声明含义。
  • 参赛者可以参考okkernel/device/*demo.c中的代码,或直接照搬到对应okkernel/device/*contest.c,然后逐步优化代码,进而提升性能,由于softmax的逻辑比较简单,因此没有提供demo,ok_device_softmax_contest.c需要参赛者自己完成。
  • okkernel/device/*demo.c中的代码只使用了1块local memory,想把tensor切分到不同的tpu可以参考okkernel/device/ok_device_max_pool.c或okkernel/device/ok_device_avg_pool.c

联系我们

图片说明