Bangumi 动画数据集。
数据下载于北京时间 2021-8-25 约 1:00-6:00。
所有动画的评分:
对任意动画的所有单次评分:
以单个动画的 10 分评分数为横坐标,1 分评分数为纵坐标:
将上一张图放大:(结论:10 分评分数到一定程度后 1 分评分数就会按比例增长)
下载并预处理好的数据集可从 Release 页面 下载。
需要 python>=3.6
。
安装依赖:
pip install -U aiohttp
运行程序:
$ python ./download_preprocess.py
数据存储在 bgm_anime_dataset.json
里。
需要 python>=3.6
。
安装依赖:
pip install -U numpy matplotlib
运行程序:
$ python ./plot.py # 动画评分分布
$ python ./plot_scores.py # 动画单次评分分布
$ python ./plot_1_10.py # 动画 1分—10分 评分分布
bgm_anime_dataset.json
内的数据格式为 JSON,可解析为一个包含了 Bangumi API 的 SubjectSmall 数据格式 的所有存在评分及排名的动画列表。