Bangumi数据分析

English | 简体中文

这是一份2021届的温州大学《Python应用与开发》课程的大作业。本项目是一个基于Bangumi网站的数据分析工具，可以帮助您分析ACG相关数据的发展趋势和流行程度。

安装

克隆本仓库到本地：

git clone https://github.com/murlors/Bangumi-Analysis-Coursework.git

安装依赖：

pip install -r requirements.txt

如果你使用的是conda，可以使用以下命令安装依赖：

conda env create -f environment.yml

使用

运行爬虫：

python crawler.py -cfg config.yml

运行分析器：

python analysis.py -cfg config.yml

配置文件

您可以使用config.yml文件来配置爬虫和数据分析的参数。以下是一个示例配置文件：

# config.yml
type: music # anime, book, music, game, real

crawler:
  start: 1 # start page
  end: 50 # end page
  user-agent: your_name/bangumi-analysis (https://github.com/your_name/bangumi-analysis)
  access-token: # access token

data:
  path: 'data' # data path

figure:
  path: 'figures' # figure path
  rcParams: # matplotlib rcParams
    font.family: 'Microsoft YaHei' # font family
    savefig.dpi: 300 # dpi
    figure.figsize: [12, 8] # figure size
    figure.autolayout: True # auto layout

type参数指定了爬虫的类型，可以是anime、book、music、game或者real。在crawler部分，您可以配置爬虫的参数。start和end参数指定了爬虫爬取的页面范围。user-agent参数指定了爬虫的User-Agent。在data部分，您可以配置数据的保存路径。在figure部分，您可以配置图像的保存路径和matplotlib的rcParams。

需要注意的是，analysis.py数据分析的部分需要使用crawler.py爬取的数据，因此请确保您已经运行了crawler.py再运行analysis.py。

由于本项目原本只用于分析音乐相关数据，若您需要分析其他类型的数据，您需要自行修改crawler.py和analysis.py中的代码。

贡献

如果您发现了任何问题或者有任何改进意见，请随时提交issue或者pull request。

许可证

本项目使用MIT许可证。详情请参阅LICENSE文件。

Murlors/Bangumi-Analysis-Coursework

Bangumi数据分析

安装

使用

配置文件

贡献

许可证