yeeeqichen/KGQA

知识图谱数据集

Opened this issue · 15 comments

按照楼主给的链接去下载数据集,没有看到知识图谱的数据集,只看到了问答数据集

想问下,知识图谱数据集在哪里下载

在google drive 上面除了1-hop、2-hop、3-hop和entity文件夹之外,还有一个kb.txt文件,可以从这个文件构建所需要的知识图谱。

google drive url: https://drive.google.com/drive/folders/0B-36Uca2AvwhTWVFSUZqRXVtbUE?resourcekey=0-kdv6ho5KcpEXdI2aUdLn_g

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗
train2id.txt

  • entity2id.txt
  • relation2id.txt
  • test2id.txt
  • valid2id.txt

嗯是的

楼主我想问下,openke这个库是不是只能在linux系统下运行呀,

推荐在linux环境下使用,主要是编译

嗯嗯,好的,谢谢

是不是主要编译openke里面的这个呀,我是个小白有点不太懂
Compile C++ files

bash base.cpp

这是OpenKE 仓库的地址:https://github.com/thunlp/OpenKE

具体的使用步骤请参考仓库中README文件中的 Installation 部分

好的,太感谢了

Input Files Path : ./benchmarks/WN18RR/
The toolkit is importing datasets.

Process finished with exit code 139 (interrupted by signal 11: SIGS
想问下兄弟有没有出现个这个问题呀,调用openke得时候

请问可以指导一下如何划分test2id.txt,valid2id.txt,train2id.txt这三个文件吗?都是从kb.txt数据里面划分吗?有没有可以参考的方法?

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗 train2id.txt

  • entity2id.txt
  • relation2id.txt
  • test2id.txt
  • valid2id.txt

您好,能说明下这几个怎么构建的吗

好的,谢谢,还有个问题就是下面这些文件都是自己从下载的知识图谱数据集里面构建的吗 train2id.txt

  • entity2id.txt
  • relation2id.txt
  • test2id.txt
  • valid2id.txt

您好,能说明下这几个怎么构建的吗

entity2id和relation2id这两个我是将kb.txt里面的entity和relation提取,再根据里面有一个kb_entity_dict将entity编码,(relation2id我忘了有没有已给出的编码,可以试试自己编),然后将kb.txt里面的三元组按照openke的格式要求划分为编码表示的三元组,再划分训练集、验证集和对照集(这三个集合的划分我是打乱后随便找了个比例,比如8:1:1,我也不是很懂要怎么划分)。至于工具的话我是自己写python脚本去构建这几个文件