itorr/nbnhhsh

是否考虑提供词库下载

apurance opened this issue · 2 comments

在网站 https://lab.magiconch.com/nbnhhsh/ 中提供当前的缩写词库下载,以供研究备份
同时这也可以避免一些爬虫

Duplicate of #10
这个我也考虑很久了,如果用爬虫强行爬的话,哪怕只爬前5个字母的
也是36^5 = 60466176
如果为了防止变成ddos攻击,1秒钟爬1次,那么需要16796.16小时,699.84天,23.328个月,
不过原作者也说过:

这个项目从名字到简介我觉得都能透露出并不支持拼音首字母缩写代替一般文字的立场,如果再支持本地数据集管理我觉得有违这个项目的初衷。

哎,这就很难办了。

lsvih commented

同求词库,仅用于科研用途(现代汉语流行语发展趋势及网络字母词研究)

@itorr