一个简易的查重工具,使用方法:python main.py [原文文件] [抄袭版论文的文件] [答案文件]

基于simhash算法和海明距离,分词使用jieba分词