/wordFinder

语料数据爬虫&&语义处理未登录词校验

Primary LanguageJavaScriptBSD 3-Clause "New" or "Revised" LicenseBSD-3-Clause

若项目不能导入到eclipse,解压config.zip中的文件到项目根目录下即可

对大文件进行了处理,思路是判断是否大于1G,大于的话进行文件切分,然后在合并处理

common.dic不可缺少

如果使用聊天信息作为语料库,在QQ中消息管理器右上角-》导出全部消息记录导出为 全部消息记录.txt

数据库配置信息在DataBaseConnection.java中配置,默认数据库:test,用户名:root,密码:无