仅为了学习python爬虫和Flask框架知识,JAV元数据爬虫,用avmoo的前端,在此基础上做了影片收藏夹,预告片功能,女优的人脸识别 功能
FANZA(https://www.dmm.co.jp/)(弃用 因为只有日本IP才能访问 而且用DMM API 同样可获取到)- DMM API (DMM旗下的FANZA是Javbus,JAVLibrary等网站内容的主要来源)
- MGStage (制造商prestige的电商网站)
- AVE
- FC2-PPV(部分)
- 1pondo(一本道)
- 10musume
- caribbeancom(カリビアンコム)
- heyzo
- pacopacomama(パコパコママ)
- Tokyo-Hot
人脸数据、训练模型:百度云盘 密码: vo9k
data_X6800、data_y6800:爬取的全部人脸数据
predict3094:前3094名女优训练出来的识别模型
main.py:启动web(flask)
crawler/daila_craler.py:日常爬取 加入每日定时任务来保持获取最新