/AV_Data_Capture

日本电影元数据抓取工具,配合kodi,emby等本地媒体管理工具使用

Primary LanguagePythonMozilla Public License 2.0MPL-2.0

AV Data Capture 日本电影元数据抓取工具(刮削器)



目录

前言

  目前,我下的日本艾薇电影越来越多,也意味着日本电影要集中地管理,形成本地媒体库。现在有两款主流的日本电影元数据获取器,"EverAver"和"Javhelper"。前者的优点是元数据获取比较全,缺点是不能批量处理;后者优点是可以批量处理,但是元数据不够全。
  为此,综合上述软件特点,我写出了本软件,为了方便的管理本地日本电影,和更好的手冲体验。
  希望大家可以认真耐心地看完本文档,你的耐心换来的是完美的管理方式。
  本软件更新可能比较频繁,麻烦诸位用户积极更新新版本以获得最佳体验


tg官方电报群: 点击进群 某些地区需要代理
推荐用法: 使用该软件后,对于不能正常获取元数据的电影可以用 Everaver 来补救
暂不支持多P电影
回到目录

声明

1.本软件仅供技术交流,学术交流使用
2.本软件禁止用于任何非法用途
3.使用者使用该软件产生的一切法律后果由使用者承担
4.本软件禁止任何商用行为
回到目录

效果图

图片来自网络,由于相关法律法规,具体效果请自行联想
回到目录

如何使用

下载

  • release的程序可脱离python环境运行,可跳过 模块安装
    下载地址(仅限Windows):点击前往

  • Linux,MacOS请下载源码包运行

  • Windows Python环境:点击前往 选中executable installer下载

  • MacOS Python环境:点击前往

  • Linux Python环境:Linux用户懂的吧,不解释下载地址

简要教程:

1.把软件拉到和电影的同一目录
2.设置ini文件的代理(路由器拥有自动代理功能的可以把proxy=后面内容去掉)
3.运行软件等待完成
4.把JAV_output导入至KODI,EMBY中。
详细请看以下教程

回到目录

1.请安装模块,在CMD/终端逐条输入以下命令安装

pip install requests

pip install pyquery

pip install lxml

pip install Beautifulsoup4

pip install pillow

回到目录

2.配置config.ini

config.ini

[proxy]
proxy=127.0.0.1:1080
timeout=10
retry=3

[Name_Rule]
location_rule='JAV_output/'+actor+'/['+number+']-'+title
naming_rule=number+'-'+title

[update]
update_check=1

1.网络设置

* 针对“某些地区”的代理设置

打开config.ini,在[proxy]下的proxy行设置本地代理地址和端口,支持Shadowsocks/R,V2RAY本地代理端口:
例子:proxy=127.0.0.1:1080
素人系列抓取建议使用日本代理
(路由器拥有自动代理功能的可以把proxy=后面内容去掉)
如果遇到tineout错误,可以把文件的proxy=后面的地址和端口删除,并开启vpn全局模式,或者重启电脑,vpn,网卡

连接超时重试设置

[proxy]
timeout=10

10为超时重试时间 单位:秒

连接重试次数设置

[proxy]
retry=3

3即为重试次数

(可选)设置自定义目录和影片重命名规则

已有默认配置

命名参数

title = 片名
actor = 演员
studio = 公司
director = 导演
release = 发售日
year = 发行年份
number = 番号
cover = 封面链接
tag = 类型
outline = 简介
runtime = 时长

例子:

目录结构规则:location_rule='JAV_output/'+actor+'/'+number 不推荐修改目录结构规则,抓取数据时新建文件夹容易出错
影片命名规则:naming_rule='['+number+']-'+title
在EMBY,KODI等本地媒体库显示的标题

3.更新开关

[update]
update_check=1
1为开,0为关 回到目录

3.把软件拷贝和AV的统一目录下

4.运行 AV_Data_capture.py/.exe

当文件名包含:
中文,字幕,-c., -C., 处理元数据时会加上中文字幕标签

5.异常处理(重要)

关于连接拒绝的错误

请设置好代理

关于Nonetype,xpath报错

同上
回到目录

关于番号提取失败或者异常

目前可以提取元素的影片:JAVBUS上有元数据的电影,素人系列:300Maan,259luxu,siro等,FC2系列

下一张图片来自Pockies的blog:https://pockies.github.io/2019/03/25/everaver-emby-kodi/ 原作者已授权

目前作者已经完善了番号提取机制,功能较为强大,可提取上述文件名的的番号,如果出现提取失败或者异常的情况,请用以下规则命名
妈蛋不要喂软件那么多野鸡片子,不让软件好好活了,操

COSQ-004.mp4

针对野鸡番号,你需要把文件名命名为与抓取网站提供的番号一致(文件拓展名除外),然后把文件拖拽至core.exe/.py
野鸡番号:比如 DCL-001-1这种野鸡三段式番号,在javbus等资料库存在的作品。
(除了SSNI-XXX-C,后面这种-C的是指电影有中文字幕!)
条件:文件名中间要有下划线或者减号"_","-",没有多余的内容只有番号为最佳,可以让软件更好获取元数据 对于多影片重命名,可以用ReNamer来批量重命名
回到目录

关于PIL/image.py

暂时无解,可能是网络问题或者pillow模块打包问题,你可以用源码运行(要安装好第一步的模块)

6.软件会自动把元数据获取成功的电影移动到JAV_output文件夹中,根据女优分类,失败的电影移动到failed文件夹中。

7.把JAV_output文件夹导入到EMBY,KODI中,根据封面选片子,享受手冲乐趣

cookies大神的EMBY教程:链接

8.写在后面

怎么样,看着自己的日本电影被这样完美地管理,是不是感觉成就感爆棚呢?
回到目录