/competition-baseline

数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

数据竞赛Baseline & Topline分享

假如你是数据竞赛的初学者、爱好者,比赛的baseline不仅是比赛思路分享,同时也是一类数据问题的方法总结。本Repo想做的就是将收集并整理并分享各种比赛的baseline方案。

你可能会问为什么是baseline,而不是获胜者的代码分享?相比于获胜者的代码baseline代码都比较简单,容易整理和学习;其次baseline代码更加实用和简洁,适合入门学习。

数据竞赛

竞赛日历:http://coggle.club/

最新的竞赛信息和baseline推送,请关注:

竞赛分享

每个比赛的详细分享请见competition文件夹

如果本仓库访问速度慢,可以访问国内备份:https://gitee.com/coggle/competition-baseline


在全球人工智能发展和治理广受关注的大趋势下,由**图象图形学学会、蚂蚁集团、云安全联盟CSA大中华区主办,广泛联合学界、机构共同组织发起全球AI攻防挑战赛。本次比赛包含攻防两大赛道,分别聚焦大模型自身安全和大模型生成内容的防伪检测,涉及信用成长、凭证审核、商家入驻、智能助理等多个业务场景,覆盖机器学习、图像处理与计算机视觉、数据处理等多个算法领域,旨在聚合行业及学界力量共同守护AI及大模型的安全,共同推动AI安全可信技术的发展。


外滩大会·全球Deepfake攻防挑战赛

本赛事由蚂蚁集团主办,在全球知名的数据科学竞赛平台Kaggle进行。赛事针对“AI换脸”的欺诈风险进行攻防实战演练,设立了100万元人民币的奖金池,鼓励推动AI向善的技术人才。

近年来,“AI换脸”诈骗事件频发,面对全球范围的技术挑战,大赛设立了百万奖金池,分设图片赛道和音视频赛道,在此诚邀全球的学者、工程师、教育者、学生及独立开发者积极参与。

  • 赛道一:图像赛道,确定给定的人脸图像是否是深度伪造图像,并输出其为深度伪造图像的概率。
  • 赛道二:音视频赛道,确定包含人脸的视频(带音频)是否是Deepfake视频,并输出其深度伪造音视频的概率。

赛事地址:https://www.atecup.cn/deepfake


2024科大讯飞AI开发者大赛

2024科大讯飞AI开发者大赛算法赛延续与高校及企业合作出题的模式,吸引产、学、研多方参与,以真实场景数据集为基础,提出业务实际生产难点,鼓励开发者们构建算法模型或数据创新方案,低成本、个性化、高效率地解决问题。

赛题报名链接:https://challenge.xfyun.cn/?ch=dw24_AtTCK9


2024数字**创新大赛DCIC-海上风电出力预测

本赛题要求选手基于风力海况气象数据、风机性能数据等,针对复杂多变气象和海况条件的深度耦合影响,提出海上风电出力预测模型,提升模型精度以及在工程应用中的可信度,为大规模风电接入下的能源安全可靠运行提供保障。

赛题报名链接:https://www.dcic-china.com/competitions/10098


2023科大讯飞AI开发者大赛

2023科大讯飞AI开发者大赛正式启动,现开始报名。本次大赛在“36道应用赛+72道算法赛”的基础上,还开设了高校认知大模型场景创新赛和机器人设计赛,覆盖大模型、智能语音、计算机视觉、自然语言、先进智造、VR等人工智能热门技术,涵盖多行业领域,总奖金池累计超400万。

赛题报名链接:https://challenge.xfyun.cn/?ch=vWxQGFU


2022年人民网算法挑战赛

为推进人工智能领域的学术交流、人才培养、技术发展,鼓励广大学生积极学习和研发符合我国主流价值观的优秀算法, 2022年11-12月举办“2022人民网人工智能算法大赛”,赛事由人民网股份有限公司主办,传播内容认知全国重点实验室承办。

http://data.sklccc.com/2022


2022年度 iFLYTEK A.I. 开发者大赛

2022年度 iFLYTEK A.I. 开发者大赛来了。本届大赛的总奖金池已升级到了超420万元,除此外还将进一步开放海量数据与核心技术,汇聚更多人工智能开发者,提供创孵平台,培育优质团队,给予扶持政策等。

本届大赛按照算法、应用、编程赛、虚拟形象选拔、辩论赛、创意集市创意赛等等方向设置众多赛道;覆盖了智能语音、视觉、自然语言、图文识别等AI热门技术;涵盖了元宇宙、遗址文化、生物与环保、医疗健康、智能家居、电商销售等众多领域。大赛地址:https://challenge.xfyun.cn/?ch=ds22-dw-sq04


AIWIN 秋季竞赛

  • 赛题1- 手写体 OCR 识别竞赛

手写体 OCR 识别竞赛由交通银行命题,设立两个任务,其中任务一由第四范式提供开放数据集,特别针对金额和日期做识别,任务二要求在指定训练环境完成不可下载训练集的训练,增加了银行机构的文本内容。任务一适合新手,并配套学习营和特别的学习奖励。

比赛地址:http://ailab.aiwin.org.cn/competitions/65

baseline地址:https://aistudio.baidu.com/aistudio/projectdetail/2612313

  • 赛题2- 心电图智能诊断竞赛

心电图智能诊断竞赛由数创医疗和复旦大学附属中山医院共同命题,设立两个任务,其中任务一诊断心电图的正常异常与否,任务二对10+种不同症状予以判断综合分类。任务一同步设有学习营和配套的学习奖励,欢迎新手参与。

比赛地址:http://ailab.aiwin.org.cn/competitions/64

baseline地址:https://aistudio.baidu.com/aistudio/projectdetail/2653802


2021阿里云供应链大赛——需求预测及单级库存优化

报名链接:https://tianchi.aliyun.com/competition/entrance/531934/introduction

比赛baseline:https://github.com/datawhalechina/competition-baseline/tree/master/competition/2021阿里云供应链大赛——需求预测及单级库存优化


CCF BDCI 2021

baseline汇总:https://github.com/datawhalechina/competition-baseline/tree/master/competition/DataFountain-CCFBDI-2021

  • 基于飞桨实现花样滑冰选手骨骼点动作识别,计算机视觉、姿态估计
  • 千言-问题匹配鲁棒性评测,自然语言处理、文本匹配
  • 基于MindSpore AI框架实现零售商品识别,计算机视觉、图像分类
  • 产品评论观点提取,自然语言处理、实体抽取
  • 个贷违约预测,结构化数据挖掘、金融风控
  • 剧本角色情感识别,自然语言处理、实体抽取
  • 基于UEBA的用户上网异常行为分析,结构化数据挖掘、异常检测
  • POI名称生成,计算机视觉、OCR
  • 客服通话文本摘要提取,自然语言处理、文本摘要
  • 系统认证风险预测,结构化数据挖掘、风险检测
  • 泛在感知数据关联融合计算,结构化数据挖掘、相似度计算
  • openLooKeng跨域数据分析性能提升,数据仓储SQL优化
  • 大规模金融仿真图数据中金融交易环路查询的设计与性能优化,金融交易图谱挖掘
  • 基于BERT的大模型容量挑战赛,深度学习模型优化

华为DIGIX2021:全球校园AI算法精英大赛

报名链接:https://developer.huawei.com/consumer/cn/activity/digixActivity/digixdetail/201621215957378831?ha_source=gb_sf&ha_sourceId=89000073

  • 赛题1:基于多目标多视图的用户留存周期预测
  • 赛题2:基于多模型迁移预训练文章质量判别
  • 赛题3:基于多目标优化的视频推荐
  • 赛题4:基于多模态多语言的搜索排序
  • 赛题5:小样本菜单识别

比赛baseline和学习资料:https://github.com/datawhalechina/competition-baseline/tree/master/competition/DIGIX2021


科大讯飞AI开发者大赛2021


2021年度腾讯赛

本届从广告应用场景痛点出发,开设“视频广告秒级语义解析”和“多模态视频广告标签”两大赛道,兼具算法挑战性和商业应用价值。

2020年度腾讯赛

本届以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。







结构化比赛


CV类型比赛


NLP类型比赛


其他类型

其他链接:

贡献者(按照贡献ID排序)

协作规范

欢迎大家fork并贡献代码,但请大家遵守以下规范和建议:

  1. 代码请按照比赛的形式进行整理,写明比赛的网址、数据类型和解题赛题;

  2. 代码请注明运行的环境,以及机器最低配置,如:

    • 操作系统:Linux,内存16G,硬盘无要求;
    • Python环境:Python2/3
    • Pytorch版本:0.4.0
  3. baseline代码只能提供可运行的代码和思路,请不要提供直接可以提交的结果文件;

  4. 代码提供者应对代码版权和共享权负责;

  5. 如果发现Repo存在版权等相关问题,请邮件联系finlayliu@qq.com

关注我们

Datawhale是一个专注AI领域的开源组织,以“for the learner,和学习者一起成长”为愿景,构建对学习者最有价值的开源学习社区。关注我们,一起学习成长。

LICENSE

GNU General Public License v3.0

Star History

Star History Chart