/nlp_resource

个人所需整理的自然语言处理资源集合

自然语言处理相关资源合集

本仓库用于存放我个人所需要的和收集的自然语言处理以及部分其他领域的资源合集。

书籍、课程与笔记

代码、工具与项目

入门教程

通用深度学习自然语言处理框架与工具

预训练语言模型与Transformer

相关内容已另行整理至ATPapers

机器翻译

相关内容已另行整理至MTPapers

命名实体识别与关系抽取

相关内容已另行整理至NERPapers

机器阅读理解与问答系统

相关内容已另行整理至MRCPapers

方面级情感分析

相关内容已另行整理至ABSAPapers

文本匹配

相关内容已另行整理至MatchPapers

文本分类

相关内容已另行整理至TCPapers

文本纠错

知识图谱

  • lightKG - 他人基于PyTorch和TorchText实现的知识图谱技术框架

关键词抽取

依存句法分析

正则表达式

  • RegExr - 正则表达式在线学习、测试与分析网站
  • Regex Golf - 非常好用的经典正则表达式练习网站

统计自然语言处理工具包

  • Apache OpenNLP - Apache开源的Java统计自然语言处理工具包
  • FudanNLP - 复旦大学开源的统计自然语言处理工具包
  • HTK - 基于马尔可夫模型开发的语音识别工具包
  • Jieba - 结巴分词是Python最常用中文分词
  • KenLM - 统计语言模型工具
  • LTP - 哈工大社会计算与信息检索研究中心开源的统计自然语言处理工具包ji
  • MALLET - 马萨诸塞大学开源的Java统计自然语言处理工具包
  • NLTK - 针对英文的工具包
  • Pan Gu Segment - 盘古开源中文分词
  • Stanford CoreNLP - 斯坦福大学开源的统计自然语言处理工具包

其他常用工具

网站与博客

此处仅提供NLP相关站点,优秀博客请链接blog.md

相关团队与实验室

资源集

竞赛集

数据集、语料与常用处理工具资源建设

相关内容已另行整理至nlp_corpus.md