/scrapy_l

爬虫学习-天天美剧(cn163.net)/爬虫名-mediaget

Primary LanguagePython

这是学习scrapy的练习,在github上做个备份

更新日志

changelog:

20170409:

  • 修改下载的字幕文件名与视频文件名一致
  • 新增crontab执行文件(mediaget.sh)

20170311:

  • 增加从射手网自动下载字幕功能,下载依据(最大下载量字幕中的第一个字幕,一般为简体&英文.ass)

使用方法

打开scrapy_l/settings.py,填写MOVIES字段及RPC参数。

MOVIES共有3个参数

  • name:剧集的名字,该名字为cn163.net中剧集页的标题。
  • link:剧集页地址
  • storge:该剧集存储的位置,请使用绝对路径

例:

MOVIES = [
    {
      'name': '生活大爆炸第十季/全集Season 10迅雷下载', 
      'link': 'http://cn163.net/archives/23809/', 
      'storge': '/media/tv/生活大爆炸 (2007)/Season 10/'
     }
]

RPC共有4个参数

  • address:transmissionrpc的IP
  • port:rpc的端口,默认是9091
  • user:如果设置了认证,填入用户名
  • password:对应用户的密码