NLP人军火库,主要收录NLP竞赛策略实现、各任务教程、经验贴、学习资料以及会议时间等,如果对你有帮助,请给我们一个star。
本项目主要包含以下内容:
- NLPer-Arsenal-Code (2021.12)
- NLPer-Arsenal-Post(2021.03)
- 其它
项目正在不断完善,如果您有什么建议,欢迎到issue 留言,或通过问卷 ,邮箱(receive@nlper-arsenal.cn)联系我们,同时我们也欢迎大家加入我们的项目。
所有内容均由我们从网络公开资料中收集整理得到,版权归原作者所有,如有侵权请立即与我们联系,我们将及时处理。
整理不易,转载时请务必备注本项目github链接,感谢您为维护良好的开源环境出一份力。
- 2021.3:开始更新本项目
- 2021.6:开放notion界面,NLPer-Arsenal-Notion (已暂停更新该页面)
- 2021.12:NLPer-Arsenal-Code 发布
记录当前正在进行的竞赛,奖金丰厚,适合有一定基础的NLPer;结束时间为官网标准时间或会议召开时间。
领域/会议 | 竞赛 | 报名时间 | 结束时间 |
---|---|---|---|
**健康信息处理大会(CHIP2022) | 1. 面向“基因-疾病”的关联语义挖掘任务 2. 医疗因果实体关系抽取任务 3. 从医疗文本中抽取诊疗决策树 4. 医疗纸质文档电子档(ePaper)OCR识别 5. 临床诊断编码任务 |
2022.6-10(具体时间参考对应评测任务) | 2022.10.23 |
2022全国大数据与计算智能挑战赛 | 1. 高鲁棒性要求下的领域事件检测任务 2. 新闻文本数据的语义检索与智能问答 |
2022.6.2-7.17 2022.6.9-7.4 |
2022.8.12 |
阅读理解 | AI智能问答应用 | 2022.5.30-8.10 | 2022.8 |
问答 | 遗址文化领域知识抽取与问答挑战赛 | 2022.6.9-7.8 | 2022.10.24 |
CCAC2022 AI-Debater | 1. 论点抽取及立场分类 2. 论据发现 3. 互动论点对识别 4. 论点生成 |
2022.6.7-7.30 | 2022.8.20 |
CCL2022 | 任务1:第二届中文抽象语义表示解析评测(CAMRP 2022) 任务2:第二届中文空间语义理解评测(SpaCE 2022) 任务3:汉语学习者文本纠错评测(CLTC 2022) 任务4:中文高效自然语言理解模型评测(CELUE) 任务5:跨语言知识迁移——汉语到少数民族语言(CMXT 2022) 任务6:以事件为中心的观点挖掘(ECOM 2022) 任务7:新闻脉络关系检测 任务8:“达观杯”汽车工业故障模式关系抽取评测 任务9:高考语文阅读理解可解释评测 任务10:第五届“讯飞杯”中文机器阅读理解评测(CMRC 2022) 任务11:航旅纵横杯-面向领域问答的知识抽取评测 任务12:第四届“小牛杯”幽默计算——聊天机器人幽默感挑战赛 任务13:基于前提的跨模态推理评测(PMR 2022) 任务14:视频看点抽取 |
2022.6.1-9.25(各任务的具体截止时间请参考对应的链接) | 2022.9.31 |
文本分类 | Feedback Prize - Predicting Effective Arguments 非标准化疾病诉求的简单分诊挑战赛2.0 机器翻译质量评估挑战赛 基于论文摘要的文本分类与查询性问答 疫情微博情绪识别挑战赛 |
2022.5.24-8.16 2022.6.9-7.9 2022.6.24-7.24 2022.7.1-8.1 2022.6.24-7.23 |
2022.8.23 2022.10.24 2022.10.24 2022.10.24 2022.10.24 |
其它 | Google AI4Code – Understand Code in Python Notebooks 面向黑灰产治理的恶意短信变体字还原 |
2022.5.11-8.4 2022.6.6-7.17 |
2022.8.11 2022.7.17 |
语义匹配 | U.S. Patent Phrase to Phrase Matching | 2022.3.21~6.13 | 2022.6.20 |
小样本 | 中文保险小样本多任务竞赛 | 2022.4.18~5.16 | 2022.7.31 |
CCKS2022 | 官网:http://sigkg.cn/ccks2022/?page_id=22 一、信息抽取: 1. 千言通用信息抽取竞赛评测 2. 多语言命名实体识别 3. 基于知识图谱的优质文章识别 二、知识图谱构建与问答 4. 带条件的分层级多答案问答 5. 开放知识图谱问答 6. 跨语言知识图谱问答评测任务 7. 教科书示意图问答 8. 化学元素知识图谱构建及应用 三、商务金融知识图谱 9. 面向金融领域的Zero-Shot事件抽取 10. 面向数字商务的知识图谱评测(1 、2 、3 ) 11. 面向金融领域的因果事件要素抽取及事件相似度计算 12. 金融NL2SQL评测任务 四、军事知识图谱 13. 开源多模态军事装备数据的事件要素抽取 14. 外军无人系统知识图谱构建评测任务 五、知识存储 15. 基于图数据库的自定义图分析算法评测 |
2022.7.25之前 | 2022.8.25~8.28 |
语言与智能技术竞赛 | 段落检索 知识对话 情感可解释评测 视频语义理解 |
2022.3.30~5.30 | 2022.8 |
NLPCC2022 | 官网:http://tcci.ccf.org.cn/conference/2022/cfpt.php 任务1:基于知识模型的智能问答 任务2:语音实体链接 任务3:多模态产品摘要 任务4:基于视频的对话生成 任务5:科技文献分类与信息抽取 任务6:对话文本分析 任务7:对话偏见测量 |
2022.3.15~5.5 | 2022.9.22~9.23 |
机器翻译 | 2022 NAACL同传Workshop:千言 - 机器同传 CCMT2022机器翻译评测 低资源多语种文本翻译挑战赛 领域迁移机器翻译挑战赛2.0 |
2022.3.7-5.1 2022.3.15-4.30 2022.6.17-7.17 2022.6.9-7.9 |
2022.7.15 2022.8 2022.10.24 2022.10.24 |
中文医疗信息处理挑战榜CBLUE | 目前任务包括医学文本信息抽取(实体识别、关系抽取)、医学术语归一化、医学文本分类、医学句子关系判定和医学QA共5大类任务8个子任务,-> 官网 | 现在 | 暂无 |
记录长期进行的训练赛,有排行榜,方便刚入门的NLPer练手
这里记录整理好的竞赛,包含数据下载以及竞赛方案
学界、业界、理论、实践以及时事动态,NLPer都应该有所了解
平台 | 主要领域 | 自媒体 |
---|---|---|
微信公众号 | 技术 | Coggle数据科学、DataFunTalk |
行业信息 | 机器之心、机器之能、AI报道、AI前线、AI科技评论、机器学习研究组订阅 | |
理论 | 科学空间、PaperWeekly、智源社区、人工智能前沿讲习、专知、AINLP、AI TIME 论道 | |
BiliBili | 前沿论坛 | 智源社区、AITIME论道 |
网站 | 竞赛 | Coggle数据科学 |
学术 | Paper With Code 、AMiner学术头条 |
结合个人情况使用不同GPU平台
平台 | 算力 | 价格 | 说明 |
---|---|---|---|
BitaHub | 1080Ti、titan xp、3090、V100 | 1080Ti(¥0.7/h)、titan xp(¥1/h)、3090(¥2.5/h)、V100(¥4.5/h) | 中科大先研院的平台,价格实惠,但一块GPU只搭配2核CPU,通过提交任务,按运行时间收取费用 |
featurize | 2080Ti、3090 | 2080Ti(¥2/h)、3090(¥3.6/h) | 镜像环境,使用灵活,可以通过jupyter_lab、vscode、pycharm远程连接 |
智星云 | 1080Ti、3080、3090、V/A100等 | ¥2.1/h~¥11/h | 整机,可远程连接(pycharm/vs code) |
沣云平台 | ML270 | ¥2.8/h | 一站式AI计算平台,CPU可以增量配置,按运行时间收取费用 |
恒源云 | 2080Ti、3060、3090、V100等 | ¥1.25/h~¥5.5/h | 可以搭配完整的CPU和硬盘,相比bithub有更高的自由度,目前处于推广期,有很多优惠 |
并行云 | V100、2080Ti、P100等 | 不明 | 计算节点来自超算,可个性化定制CPU核数、GPU、存储空间,有非常简便的操作界面,并且提供远程linux桌面,灵活度优于以上三个平台。目前处于推广期,有很多优惠 |
AI Studio | V100 | 基本免费 | 由百度开发, 偶尔申请不到V100,最高可免费8卡。主要使用飞桨PaddlePaddle框架,其它框架需自行折腾,也可用X2Paddle一键转为飞桨的代码和模型,大部分比赛参与即送算力卡。 |
天池DSW | p100 | 免费,单次限时8小时,不限次数 | 阿里的一个在线平台,运行时不能关闭 |
天池实验室 | V100 | 免费,60h/年 | 相比于AI Studio不限制深度学习框架,就是时间比较短 |
Kaggle | k80 | 免费,每周限时30小时 | 外网访问 |
Google Colab | k80、T4、P4、P100 | 免费,单次限时12小时 | 外网访问,无法指定具体GPU,未订阅Colab Pro用户多数时间下估计会被分配k80 |
- 阿里天池 :阿里,奖金丰厚
- AI Studio :百度AI Studio深度学习社区,成绩优异可获得飞桨开发者技术专家(PPDE) 认证申请绿色通道。
- 讯飞开发平台 :科大讯飞
- DataFountain : CCF指定专业大数据及人工智能竞赛平台,有很多训练赛
- 图灵联邦 :NLP竞赛不多
- biendata : 国内领先的人工智能竞赛平台,包含大量NLP学术评测
- FlyAI-AI竞赛服务平台 :难度分为新手、简单、中等、精英、困难,有大量GPU算力可供获取,奖金不多,但适合练手
- 和鲸社区 :一个综合的学习平台
- ACL、EMNLP、NLPCC、CCL、CCKS、SMP等会议每年都会举办相关学术评测
- Codalab :一个可重复计算平台,很多国外的竞赛都会在上面提交代码用于检验
- DCLab :和天池比较像
- AI研习社 :很多很多NLP竞赛
**计算机学会推荐国际学术会议和期刊目录-2019
**计算机学会推荐中文科技期刊目录
dblp:计算机科学文献库
AI会议deadline :会议倒计时
会议时间记录表 :Updated by Jackie Tseng, Tsinghua Computer Vision and Intelligent Learning Lab
note:以下时间为官网默认时间,暂未换算成北京时间
会议 | 级别 | 摘要截稿 | 原文截稿 | 审稿通知 | 开会时间 | 说明 |
---|---|---|---|---|---|---|
ICLR(官网、dblp) | * | 2022.1.24 (final) |
online | |||
ACL(官网、dblp) | CCF-A | Dublin, Ireland | ||||
NeurIPS(官网、dblp) | CCF-A | 2022.9.14 | 2022.11.28~12.9 | New Orleans(first week), online(second week) | ||
ICML(官网、dblp) | CCF-A | 2022.7.17~7.23 | Baltimore, Maryland USA | |||
SIGIR(官网、dblp) | CCF-A | 2022.1.21(long paper) |
2022.1.28(long paper) |
2022.3.31(long paper) |
2022.7.11~7.15 | Madrid, Spain |
WWW(官网、dblp) | CCF-A | ? | ? | ? | 2023.5.1-5.5 | AUSTIN, TEXAS, USA |
AAAI(官网、dblp) | CCF-A | 2022.8.8 | 2022.8.15 | 2022.9.27-11.18 | 2023.2.7~2.14 | Washington |
IJCAI(官网、dblp) | CCF-A | 2022.3.16~3.29(rebuttal) 2022.4.20(final) |
2022.7.23~7.29 | Vienna, Austria | ||
EMNLP(官网、dblp) | CCF-B | 2022.6.24、7.24(ARR paper) | 2022.8.23~8.29(rebuttal)、2022.10.6 | 2022.12.7~12.11 | Abu Dhabi | |
NAACL(官网、dblp) | CCF-C | 2022.7.10~7.15 | Seattle, Washington | |||
COLING(官网、dblp) | CCF-B | * | 2022.8.15 | 2022.10.12~10.17 | Gyeongju, Korea | |
CoNLL(官网、dblp) | CCF-C | * | 2022.6.30、8.1(EMNLP ARR) | 2022.9.15左右 | 2022.12.7~12.8 | same as emnlp、online |
NLPCC(官网、dblp) | CCF-C | * | 2022.9.22~9.25 | 桂林 | ||
ICONIP(官网) | CCF-C | * | 2022.8.15 | 2022.11.22~11.26 | New Delhi, India | |
ACML(官网) | CCF-C | * | 2022.5.26(期刊) |
2022.8.11-8.18(rebuttal)、9.8 (final); 2022.7.7(初审)、9.8(final) |
2022.12.14~12.16 | Hyderabad, India (with online) |
AACL(官网) | * | * | 2022.7.15 | 2022.8.15~21(rebuttal) 2022.9.20 (final) |
2022.11.21~11.24 | 台北 |
EACL(官网、dblp) | * | * | * | * | * | 合并至ACL2022 |
CCL(官网、dblp) | * | * | 2022.6.15 2022.7.1(ARR投稿) |
2022.8.1 | 2022.10.14~10.16 | 南昌 |
CCKS(官网、dblp) | * | * | 2022.7.3 | 2022.8.25~8.28 | 秦皇岛 | |
SMP(官网、dblp) | * | * | 2022.8.19-8.21 | 北京 | ||
CCIR(官网) | * | * | 2022.6.30 | 2022.7.30 | 2022.9.16~9.18 | 重庆 |
CCMT(官网) | * | * | 2021.7.10 | 2022.8.6~8.10 | 西藏拉萨 |