/DataMining

对dbpedia和百科采集而来的语料进行清洗,得到合适的三元组

Primary LanguageWeb Ontology Language

2016/08/15

	系统及版本:win10 专业版 64位 1670
	eclipse版本:Neon release(4.6.0) 64位
	Java版本号:1.8.0_92 64位
	目前共分为四个包,分别对应着ontology,txt,excel和mongodb的处理。

---------------------------------------------------------------
2016/08/19

	对工程的修改:
	1、添加xml、string、main、test等包,分别对应关系如下:
		xml:处理xml文件,包括将概念关系写入xml文件等。
		string:对一些实用小函数的封装操作。
		main:用来设计入口函数,准备将整个包做成一个jar包
		test:存放了每个功能方法的测试。
	2、加入log4j.properties文件,屏蔽了控制台输出红色警告的消息。
	3、一些文件夹的加入:
		data:存放的是概念类层级结构的txt文件。
		finished:存放的是excel生成的txt。
		lib:用到的第三方jar包。
		test:测试文件夹,也可以看作临时文件夹。
	4、一些文件的引入:
		cilin.txt:是对词林文件进行处理后留下的同义词关系。
		
-----------------------------------------------------------------
2016/08/22

	修改:
		加入主Main函数,准备打包。

-----------------------------------------------------------------
2016/08/29
	修改:
		对ontology包下边的代码进行了许多更新和添加,主要实现如下功能:
			1、对本体文件中的同义词和昵称进行查询。
			2、考虑到了一个昵称或者同义词对应多个概念类的情况,对其进行修改。
			3、接下来准备考虑一个概念对应着多个父类的情况。
		对Main函数做如下修改:
			1、加入本体查询的模块,能够随时查阅数据。
	大致如上,其它修改不做记录。
-------------------------------------------------------------------