/cancer-KnowledgeGraph

a knowledge graph demo for cancer

Primary LanguagePython

Cancer-KnowledgeGraph Demo

数据获取

用Python的Selenium包编写简易爬虫,获取**公众健康网上的如下信息:

  1. 疾病信息:来自**公众健康网的常见疾病信息。
  2. 医生信息:来自**公众健康网的医生信息。

数据存储

将爬取的数据分为如下表格,以csv文件的形式进行存储:

  1. 疾病索引表:常见肿瘤科疾病索引列表。
  2. 疾病信息表:根据疾病索引检索出的疾病信息列表。
  3. 医院索引表:单独的医院名称索引列表。
  4. 医生信息表:根据疾病索引检索出的相关医生信息列表。
  5. 疾病相关关系表:给定病历数据库中常见疾病间的共现频率统计表。

数据关系

建立数据间的关联关系如下:

  1. 疾病简称/俗称<-[检索]->疾病学名
  2. 医生名-[治疗]->疾病学名
  3. 医生名<-[从属]->医院名
  4. 疾病简称/俗称<-[共现]->疾病简称/俗称

数据可视化

用Neo4j生成可视化数据关系图如下:

  1. 疾病关系图谱:

2. 医院关系图谱:

Inference

项目实战--知识图谱初探