/keyword

重要词发现

Primary LanguageC++MIT LicenseMIT

keyword

重要词发现

data数据链接:https://pan.baidu.com/s/1UqCpDnbsXdpC5Vj3KQGJaQ 提取码:n4mh

项目简介:在一个 300MB 的 txt 文档中,大概有一百多万个段落,然后给定 10w 个单词,需要找到这 10w 个单词在这个大文件中出现的次数,然后创建成一个图,计算出所有点到点的最短距离。 技术亮点:使用 AC 自动机以及三维 hash 快速建表并转为二维数组表进行查询计算点到点的最短距离