/similarity

短文本相似度匹配

Primary LanguagePython

similarity

短文本相似度匹配

依赖包

pip install gensim
pip install jieba
pip install paramiko

问题

  1. 需要正则匹配数字,空格并过滤,停用词表无法穷举

测试数据

原句: 请问,截至六月30日,公司的股东人数是多少?谢谢

匹配目标:

请问,截至六月30日,公司的股东人数是多少?谢谢

请问,截至7月十五日,公司的股东人数是多少?谢谢

请问8月中期股东户数?谢谢

4月30日股东户6442户,6月15日6364户,请问减少的这部分是何原因为主?股份数量增加的账号是否全是机构投资者?谢谢解答。