/DataX

Crawling, Cleaning, Analysing, Visualization and Inferencing

Primary LanguageJupyter Notebook

Data X

Data Sets

  1. 什么值得买
Info Content
抓取日期 2017-10-07
数据总量 18 Categories, 129,552 Records
数据处理 visualize.ipynb
下载数据 smzdm-2017-10-07.pkl (33M)
数据结构 smzdm.json
  1. 新浪微博用户相册
Info Content
抓取日期 2017-10-12
数据总量 22,619 Users, 78,122 Photos
数据处理 N/A yet
下载数据 N/A yet
数据结构 N/A yet
  1. ZOL & PConline 用户评分
Info Content
抓取日期 2017-10-22
数据总量 1,449 Records
数据处理 NPS
下载数据 ZOL_Scores.csv/PConline_Scores.csv
数据结构 Data Struture.json

  1. 豆瓣电影
Info Content
抓取日期 2017-11-25
数据总量 4,999 Records
数据处理 N/A
下载数据 N/A
数据结构 Data Struture.json

Tools

  1. Jupyter Notebook
  2. Requests
  3. Pandas
  4. MongoDB
  5. Plot.ly
  6. Colorlover
  7. The Data Visualisation Catalogue
  8. Face Detection with OpenCV
  9. Scipy Lecture Notes