/BangumiAnimeDataset

Bangumi 动画数据集「Bangumi 所有动画平均分是多少?」

Primary LanguagePythonMIT LicenseMIT

BangumiAnimeDataset

Bangumi 动画数据集。

效果图

数据下载于北京时间 2021-8-25 约 1:00-6:00。

所有动画的评分:

效果图 动画评分分布

对任意动画的所有单次评分:

效果图 动画单次评分分布

以单个动画的 10 分评分数为横坐标,1 分评分数为纵坐标:

效果图 动画 1分—10分 评分分布

将上一张图放大:(结论:10 分评分数到一定程度后 1 分评分数就会按比例增长)

效果图 动画 1分—10分 评分分布 放大

下载并预处理数据集

下载并预处理好的数据集可从 Release 页面 下载。

需要 python>=3.6

安装依赖:

pip install -U aiohttp

运行程序:

$ python ./download_preprocess.py

数据存储在 bgm_anime_dataset.json 里。

绘制图表

需要 python>=3.6

安装依赖:

pip install -U numpy matplotlib

运行程序:

$ python ./plot.py  # 动画评分分布
$ python ./plot_scores.py  # 动画单次评分分布
$ python ./plot_1_10.py  # 动画 1分—10分 评分分布

数据结构

bgm_anime_dataset.json 内的数据格式为 JSON,可解析为一个包含了 Bangumi API 的 SubjectSmall 数据格式 的所有存在评分及排名的动画列表。