/t66y

Primary LanguagePython

t66y爬虫

简介

一个简单的t66y的爬虫,将每天增量去爬取的数据保存到数据库中,然后使用结巴分词统计词频,然后统计每天爬取到的数据

环境变量的设置

  1. T66Y_SCHEMA:t66y网址
  2. T66Y_URL:t66y主页的地址
  3. T66Y_NAME:数据库用户名
  4. T66Y_PASSWD:数据库密码

未完成

  • django的restful服务端
  • 一个简单的数据展示前端