/KGPro

知识图谱轻量框架

Primary LanguageJava

#KGPro

VERSION: 0.0.1

Builde your own Knowledge Graph (not an Ontology).

1

基本概念

Concept 描述 备注
Thing Everything is a Thing
Entity 实体
Relation 关系
Triple 三元组

关于属性和关系 确实,在自然世界中,predicate可以表示两个事物之间的关系,也可以用来描述一个事务的属性(例如:张三的身高是173cm),但是KGPro将这样的区别弱化,并且全部抽象成Relation,即张三的朋友是李四,张三的身高是173cm这样的描述(知识)都抽象成关系。

###Thing 基类
类似与Java中的Object,Entity和Relation都继承Thing类

Entity

创建Entity实例:

// 1. 提供name
Entity zwq = new Entity("zwq");
// 2. 提供URI(name, base)
Entity zwq = new Entity("zwq", "http://ica.ecnu.edu");

###Relation 创建对象的构造方法和Entity类似

Relation isFriend = new Relation("isFriend", "http://ica.ecnu.edu");

###Triple 三元组,内部包含三个原子数据:

protected Entity   subject;
protected Relation relation;
protected Object   object;

在KGPro中,Object试图去表达包含了Entity、String、基本数据类型的所有实例的可能,如下的Triple都是合法的。并且看起来,是可以很好地区分和涵盖自然世界中绝大多数的情况。

// Triple
Triple t1 = new Triple(zwq, isFriend, lyj);
Triple t2 = new Triple(zwq, age, 23);
Triple t3 = new Triple(zwq, fullname, "张巍骞");
Triple t4 = new Triple(zwq, income, 555.55);

知识图谱操作

示例

上面gif是我之上学期期末半天作的一个演示Demo,对KGPro做了最简单的演示,并在下方实时显示后台查询使用的代码。以供参考。

虽然,KGPro希望几乎更多的操作围绕Node展看,但是我们依然提供了足够强大的通用操作接口

接口

目前项目采用的是代理模式:

// 代理类
BasicOperationImpl.Class

// 通用接口
BasicOperation

// 业务类
JenaRDFOperation.Class implements BasicOperation
...

// 抽象通用接口
Operation extends BasicOperation

接口内容:

/**
 * 插入Triple
 * @param triple
 * @return
 */
public boolean insert(Triple triple);
	
public boolean insert(List<Triple> triple);
	
/**
 * 删除指定的Triple
 * @param triple
 * @return
 */
public boolean delete(Triple triple);

/**
 * 删除指定的Entity的所有信息
 * @param entity
 * @return
 */
public boolean delete(Entity entity);
	
/**
 * 删除指定Entity的指定Relation的所有Triple
 * @param entity
 * @param relation
 * @return
 */
public boolean delete(Entity entity, Relation relation);

/**
 * 更新Entity subject的property为object 
 * @param subject 主语
 * @param property 属性
 * @param object 宾语
 * @return
 */
public boolean update(Triple triple);
	
/**
 * 查询全部Triple
 * @return
 */
public TripleIterator query();
	
/**
 * 利用选择器查询
 * @param selector
 * @return
 */
public TripleIterator query(Selector selector);

##基本示例:

// 创建Operation
// 选择使用Jena RDF API
BasicOperation dao = new BasicOperationImpl(new JenaRDFOperation());

// insert
dao.insert(triple);

// insert
dao.insert(List<Triple> list);    // 百万级的数据维持在秒级

// delete
dao.delete(Triple);  // 指定Triple
dao.delete(Entity);  // 指定Entity

// query
Predicate<Triple> predicate = (Triple t) -> {
    return (t.getObject() instanceof String) && t.getObject().equals("男");
};
		
TripleIterator iterator = dao.query().and(predicate);

while(iterator.hasNext()) {
    Triple t = iterator.next();
    System.out.println(t);
}

#灵活的查询接口

// query(Selector selector);
TripleIterator iterator = dao.query(new SimpleTripleSelector(zwq, null, null));

SimpleTripleSelector可以十分灵活地在数据库中过滤Triple 你可以在任意的位置指定或者不指定位置

new SimpleTripleSelector(zwq, null, null);   // 查找zwq的所有Triple
new SimpleTripleSelector(zwq, sex,  null);   // 查找zwq的sex属性
new SimpleTripleSelector(zwq, name, null);   // 查找所有Relation是name的Triple

还不够? 你可以像上面的例子一样为query的返回值添加条件,只要是Predicate即可。提供了三种逻辑:

and(Predicate<Triple>)
or(Predicate<Triple>)
not(Predicate<Triple>)

Predicate需要JDK1.8,是Java的函数式编程提供的新的API

如果我们希望查询Integer属性r1,希望查询出所有r1的值大于100,不小于200的Triple

// 编写两条简单的规则
Predicate<Triple t> p1 = (Triple t) -> {
    return (t.getObject() instanseof Integer) && (t.getObject.compareTo(100) > 0);
};
Predicate<Triple t> p2 = (Triple t2) -> {
    return (t.getObject() instanceof String) && (t.getObject.compareTo(200) < 0);
};

//query
TripleIterator iterator = dao.query(new SimpleSelector(null, r1, null)).and(p1).and(p2);

#How to Contribute? Just pull request.

#TODO and AUTHOR