/spider_for_jable.tv

一个从jable.tv爬取数据的小虫,使用Access数据库存储数据

Primary LanguagePythonDo What The F*ck You Want To Public LicenseWTFPL

爬虫,主要爬取jable.tv上的番号和url和标题

用于数据库的建立

方便检索和进一步操作(下载)

比较重要的文件是getList.py

这个文件包含爬取的主要逻辑

其他文件主要是数据清洗和数据库根据已经有的文件更新