NLP_tools

1.NLP理论基础-面试必会
(1)算法理论基础知识应知应会
(2) NLP 算法工程师相关的面试题
(3)NLP面试知识点和代码实现

2.命名实体识别
(1)BERT-NER-Pytorch
模型包含BERT+Softmax/CRF/Span
(2)BERT-NER-Tensorflow1.x
模型包含BERT+Softmax/CRF,能够将训练好的ckpt转换为saved model(pb)形式,提供加载pb模型并预测接口
(3)BERT/BiLSTM-CRF-Tensorflow2.x
基于Tensorflow2.x进行NER,简单配置一下即可使用
(4)ALBERT+BI-LSTM-NER
3.实体关系抽取
(1)TensorFlow1.x和BERT的管道式实体及关系抽取
该项目的数据集来自2019百度语言与智能实体关系抽取比赛,模型BERT+sigmoid(多标签关系分类)、BERT+Softmax(NER)
(2) 中文实体识别与关系提取
Chinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT

4.知识图谱构建
(1)医疗知识图谱构建-问答应用
(2)农业领域知识图谱的构建
从数据爬取到图谱构建完整流程
(3)金融领域知识图谱构建-基于kg的自动问答

5.情感分析
(1)BERT-sentiment--classification
基于Tensorflow1.x微调BERT

6.事件抽取
(1)2020百度语言与智能事件抽取-多标签事件分类-ALBERT-based
基于keras,ALBERT+GRU
(2)金融篇章端到端事件抽取
pytorch,数据集:金融公告

7.文本分类
(1)利用BERT微调进行文本分类
数据集THUCNews数据集、Sougou-Mini数据集,模型BERT+Softmax
(2)文本二分类任务BERT
keras、模型BERT+sigmoid
(3)中文文本分类-开箱即用
模型TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer, 基于pytorch。
(4)文本分类baseline汇总(tensorflow)
text classfication

8.数据集
(1)公司名语料库
(2)CLUENER 细粒度命名实体识别
(3)非常全的古诗词数据,收录了从先秦到现代的共计85万余首古诗词
9.对话系统
(1)医疗垂直领域的对话系统-基于知识图谱
其他
(1)自动纠正word中的英语单词拼写错误
(2)Python - 100天从新手到大师