(UPDATE: 代码已经删除,如感兴趣请联系我单独看代码。 zpyzly@126.com) 如同物质都是由化学元素组成一样,我找到了构成词义的基本元素。
根据自创的语义元素理论,实现一个以自然语言理解为目的的推理系统。 我独立发现了语义元素,它可以解决NLP目前的瓶颈。语义元素就是从词义的语言学构成角度去准确地表示词义,可以解决推理、准确性、可解释性,实现真正的语言理解。
基于语义元素的模型和现有模型对比:
现有模型 | 基于语义元素 |
---|---|
函数的拟合,总有损失; | |
word2vec考虑周围词,不准确 | 词义无损失,准确 |
语言模型太粗糙,句子内两两必须有关系, | |
是连续模型,而语言是离散的 | 离散模型,模型准确 |
BERT训练成本太高 | 词义不需要训练,直接定义 |
不可解释 | 可解释 |
常见词对于不同领域语料敏感 | 不敏感,常见词的意思是固定的 |
不可控,机器人可能说不好的言论 | 可控 |
将Stanford NLP生成的分词树解析成Scala对象的形式
设计统一的对象模型去表示解析后的自然语言(解析句法形成句子成分的表示),方便推理规则的应用
无循环的词语解释:语义元素是词义的最小组成部分,是一个较小的固定的集合。将所有词义用语义元素来表示,这样就把语言映射成语义元素的组合,语言的推理是准确的、可解释的。 语法规则、语言理解规则 规则引擎