英语例句检索系统
#文件层级
extractor
为抽取文件, 抽取不同的语料, 现在暂定的是抽取multi-un的语料indexer
为建索引的文件夹, 主要负责建立索引server
为django的目录, 主要包含有django文件(这东西我没用过, 不知道怎么用),和lucene的检索函数util
为常用函数放置, 比如一些NLP函数
#问题
- 检索的时候会出现汉语部分有英语的情况
- 由于现在选用multi-un的语料, 政治上的词汇比较多, 对于普通的词汇比较少, 需要扩充语料
- 没有考虑消岐的问题