/spider163

抓取网易云音乐热门评论

Primary LanguagePythonMIT LicenseMIT

spider163 logo

spider163

MIT License pyversions pyversions Build Status

GitHub上最易用的网易云音乐爬虫系统

安装模块

  • 第一步:指定SPIDER163_PATH环境变量,缺省情况下为$HOME/spider163
  • 第二步:把默认配置文件spider163.conf拷贝到SPIDER163_PATH下,并配置数据库
  • 第三步:pip install spider163
  • spider163 --help

历史文档

使用指南

$ spider163 initdb
$ # 根据配置文件的数据库信息自动创建数据库表,删除全部数据通过resetdb实现
$ spider163 resetdb
$ # 重建相关数据库
$ spider163 updatedb
$ # 根据时间重置过期数据重新抓取
$ spider163 classify
$ # 获取已知曲风列表
$ spider163 playlist
$ # 默认下载全部推荐歌单(1000+),也可以通过指定页码去下载(-p=1),以及歌曲风格(--classify=小语种,默认为全部)
$ spider163 mp3 --playlist=2033391777
$ # 默认下载指定歌单列表内的全部包含版权的歌曲
$ spider163 music
$ # 默认下载10个歌单的歌曲数据,也可以通过指定循环大小(-c=2)来下载10 * c 个歌单内歌曲
$ spider163 comment
$ # 默认根据数据库存储的未下载歌曲随机下载一首单曲的评论,也可以通过-c指定需要下载的单曲数量和-s强制指定歌曲id
$ # spider163 comment -c 10 | spider163 comment -s 209115
$ spider163 lyric --count=10
$ # 抓取10首音乐的歌词,可以通过制定歌曲ID抓取特定一首音乐(--song)
$ spider163 search -q="林依晨"
$ # 搜索功能(待完善,暂支持歌曲搜索)
$ spider163 get -s 209115
$ # 阅读歌曲基本信息、歌词、热评
$ spider163 get --playlist 922064582
$ # 获取歌单的基本信息、歌曲等
$ spider163 doc --playlist 922064582
$ # 歌单/歌曲信息汇总成word文档
$ spider163 top50 --playlist 922064582 --username=xxx --password=xxx
$ # 创建TOP 50 歌单

TODO

欢迎关注微信公众账号:程天写代码

guojingcoooool