zhezhaoa/ngram2vec

中文语料失效

buaasky opened this issue · 4 comments

您好,请问中文语料的格式是什么样的?百度网盘的连接现在不能下载了。
我用自己的语料训练会报错?不知道能够提供一下中文语料的格式,谢谢!

Hi, 好像是可以下载的 。你是否对你的语料分词了呢?以及推荐utf-8编码

您好,中文语料的下载地址失效了。

@zhezhaoa
好的,谢谢!我试一下自己的语料。

@DouTong
百度网盘的用客户端好像可以下载,不过速度很慢。

感谢分享代码,借楼问中文语料的格式是什么样的,只想构造小数据跑起来试一下