Datasets-Text-Mining
该资源为文本挖掘(中文和英文)相关的数据集,希望对您有所帮助~
该数据集能实现以下任务:
- 文本分类
- 情感分析
- 命名实体识别
- 百科推荐
新浪微博4类情感 simplifyweibo_4_moods
数据描述:
类型 | 描述 |
---|---|
数据概览 | 36 万多条,带情感标注 新浪微博,包含 4 种情感,其中喜悦约 20 万条,愤怒、厌恶、低落各约 5 万条 |
推荐实验 | 情感/观点/评论 倾向性分析 |
数据来源 | 新浪微博 |
原数据集 | 微博情感分析数据集,网上搜集,具体作者、来源不详 |
数据描述 | 微博总体数目为361744: 喜悦-199496、愤怒-51714、厌恶-55267、低落-55267 |
对应类标 | 0: 喜悦, 1: 愤怒, 2: 厌恶, 3: 低落 |
数据示例:
下载地址:
参考链接:
后续整理中......
参考链接如下:
- https://github.com/SophonPlus/ChineseNlpCorpus
- 关于文本分类(情感分析)的中文数据集汇总 - alip39
- https://blog.csdn.net/alip39/article/details/95891321
(BY:Eastmount CSDN 2021-09-18)