这是一个开源项目,用于收集并整理互联网上的数据集。数据集采用JSON格式存储。 This is an open source repository for collecting free data from internet. Dataset will be store in JSON format.
- 知乎
- Bilibili评论区
- 微博
- CSDN/博客园等
本项目将通过python爬虫进行数据获取与数据清洗,同时也将收集整理互联网其他零散的相关数据集。
如果想为此项目贡献代码与数据集,请提issue和pr,审核后会进行合并与管理。