使用fasttext进行文本分类
数据使用的是百度ai studio的常规赛,新闻文本分类的数据集。下载链接
data_calssical:存放数据的文件夹
dev.txt:原始验证集;
devs_data.txt:转换之后符合fasttext的验证集;
train_data.txt:原始训练集;
L_data.txt:转换之后符合fasttext的训练集;
text.txt:测试集(无标签)
text_classical.ipynb:使用fasttext进行文本分类
测试集的准确率在82%左右。