/Baike-KnowledgeGraph

爬虫-百度百科-知识图谱探索

Primary LanguagePython

Python 2.x 爬虫 + D3 数据可视化

抓取百度百科985高校信息

所属城市 中文名 英文名 创办时间 简称 知名校友 主要院系
city name enName date short friend dept

数据来源:

image

数据处理:补全信息、分词、统一格式

image

最后效果图:

image

Demo访问地址:http://47.95.209.24:3000/

内容(按处理顺序):

  • list-school 高校列表
  • loadingData 获取高校信息
  • stopwords 分词
  • entity 分离实体
  • node-links 生成json数据(节点和关联关系)
  • html D3.js的数据可视化

原文作者博客

原文作者代码

我的博客,记录学习、记录生活:

https://s-top.github.io