/nanjing_analysis

通过网络爬虫爬取南京地区二手房信息,借助统计学方法进行数据分析

Primary LanguageJavaScript

nanjing_analysis

通过网络爬虫爬取南京地区二手房信息,借助统计学方法进行数据分析

任务(5.31-6.10)

    • 爬虫程序编写与测试
    • 爬取数据
    • 清洗数据
    • 数据分析
    • 形成报告

使用到的库

  1. requests
  2. beautifulsoup4
  3. numpy
  4. matplotlib
  5. pandas

爬取数据集

地区 页数 地区 页数 地区 页数 地区 页数
鼓楼 100 建邺 100 浦口 100 秦淮 100
玄武 100 六合 100 雨花台 100 栖霞 100
溧水 100 百家湖 91 江宁其他 19 高淳 2
岔路口 71 东山镇 98 江宁 100 江宁大学城 74
九龙湖 49 麒麟镇 100 将军大道 51 科学园 28
汤山镇 19 凤凰西街 40 仙林 72 尧化门 32
栖霞其他 19 迈皋桥 50 马群 44 仙鹤门 19
晓庄 18 燕子矶 8 月苑 18 万寿 15
红山 15 草场门大街 10 定淮门大街 17 福建路 12
汉中门大街 10 湖西街 11 江东 3 江心洲 6
南湖 21 南苑 17 水西门 7 万达广场 28
小行 10 雨花新村 16 江宁滨江 16 禄口 70
顶山街道 22 高新区 44 江浦街道 100 浦口其他 36
桥北 100 泰山街道 32 大厂 69 六合其他 14
龙池 26 六合主城 21 南门新城 26 五塘广场 17

数据可视化

词云