各个行业知识图谱分享,关系抽取,数据清洗,提供 neo4j 批量导入格式
Menu
Topic | Description | status |
---|---|---|
百科通用数据 | 百科通用数据 | 已完成,部分公开 |
医疗数据 | 疾病,症状,科室,用药等 | 已完成 |
垃圾分类 | 上海垃圾分类数据 | 已完成,完全公开 |
汽车配件-车灯 | 各种型号各种年份汽车对应的各类车灯,安装方式 | 已完成 |
新冠疫情 | 新冠疫情公开的行为轨迹,可供做知识推理【公益免费】 | V1.0完成 |
中文知识图谱,4000w实体,一亿关系,这是我精心整理、清洗、去重后的数据,数据格式已经处理,可用 neo4j-admin 直接导入,所有数据来源都是公开的百科或新闻数据。
由于 github文件大小限制,以下给出了部分数据,并附上了使用步骤,适合研究生交作业用,接受定制服务
1.首先你要自行安装 neo4j 下载地址:https://neo4j.com/download/
bin/neo4j-admin import --id-type=STRING --multiline-fields=true \
--nodes "import/entity10.csv" \
--relationships "import/relationship10.csv" \
tips:
导入成功显示如下:
IMPORT DONE in 3s 337ms.
Imported:
100000 nodes
88362 relationships
288361 properties
Peak memory usage: 1.03 GB
MATCH (ee:my_entity) WHERE ee.name = "文天祥" RETURN ee;
点击展开子节点,返回效果如下
例如:链接:https://pan.baidu.com/s/1kMynr6lu13wyqTag7xUlpQ
2.数据地址:https://github.com/chriswangweb/KGData/blob/master/%E5%9E%83%E5%9C%BE%E5%88%86%E7%B1%BB/graph.db.zip
Topic | Description |
---|---|
病人基本信息 | ok |
关联病人 | - |
发病 | - |
确诊 | ok |
离鄂 | - |
出行信息 | ok |
活动 | ok |
网络不好的可以使用网盘地址 链接:https://pan.baidu.com/s/12-fLMV4jEc7BRXj4dUKQGg 密码:b08l
公众号:作者微信:AI-decoder,作者邮箱联系方式:chris.wang.web@gmail.com
捐赠作者(捐赠将用来购买服务器,OSS,更快的处理速度,更多的数据,更快的下载速度)