/KnowledgeGraph-code

在某公司参与的知识图谱相关项目-代码与数据集

Primary LanguagePython

KnowledgeGraph—code

在某公司参与的语知识图谱相关的代码和个人整理的数据,数据全部是公开数据与原公司无关

  1. KnowledegGraph

    该文件夹是在处理有关知识图谱相关内容的代码和数据

2.1. code

该文件夹生成知识图谱相关的代码

2.2.1 add_taboo.py

        在知识图谱中添加禁忌关系代码

2.2.2 baiduAPI.py

    尝试使用百度的句法分析的代码,只做了尝试,没有进一步深入

2.2.3 create_graph.py

    构建知识图谱类

2.2.4 DingDangKGdemo_main.py

    叮当用药知识图谱运行主文件

2.2.5 get_BIESO_based_rule.py

    对数据基于字典进行BIESO标注

2.2.6 get_entity_relationship_from_xunyiwenyao.py

    从寻医问药的数据中抽取出先关的实体和关系保存在文件中

2.2.7 get_level.py

    从层级结构中抽取层级关系并直接添加在知识图谱中

2.2.8 HaoXinQingKGdemo_main.py

    好心情知识图谱运行主文件

2.2.9 neo4j.py

    在寻医问药知识图谱中有关neo4j数据库相关的代码

2.2.10 utils.py

    一些用过的,但是不知道放哪的代码,

2.2.11 XunYiWenYaoKGdemo_main.py

    寻医问药知识图谱运行主文件

2.3 data

    在知识图谱运行中使用的数据

2.3.1 dict

    在知识图谱中使用的标准字典,从原始数据中复制过来的

2.3.2 dingdangkuaiyao

    在知识图谱中使用叮当快药的相关数据

2.3.3 haoxinqing

    好心情的相关数据

2.3.4 medicine_level

    药物层级关系的相关数据

2.3.5 symptom_lead_disease

    抽取出来的症状疾病层级结构数据

2.3.6 xunyiwenyao

    寻医问药的相关数据

2.4 neo4j-community-3.5.5.zip

    neo4j数据库本体文件

2.5 生成文件

    从code代码中生成的文件,有些生成文件在后续的代码中也会被用到,看名字就可以区分开

3.原始数据

该文件夹是和知识图谱可能相关的全部原始数据

3.1 ATC

    ATC编码,药物的层级结构,更加偏向于药物在使用中的分级

3.2 ICD10

    疾病的ICD10 编码,中文的

3.3 stopwords

    停用词,中英文

3.4 中医妇科学

    中医妇科学的相关数据,从中医妇科学这本书获得

3.5 临床药物手册数据

    临床用药数据,药物的层级结构,和ATC有重合

3.6 原始词典/标准词典

    经过人工处理的原始词典/标准词典,标注词典处理了一部分错误,但是仍要需要在进一步清洗

3.7 叮当快药

    叮当快药相关的数据

3.8 国家基本药物目录2018版

    国家基本药物目录数据,也是药物的层级结构

3.9 好心情

    好心情的相关数据

3.10 寻医问药网站数据

    从寻医问药网站获得数据

3.11 情感词汇本体/知网情感词典sentiment

    有关情感的本体词汇

3.12 求医网

    求医网的相关数据,在此使用了疾病和症状的层级结构