中文维基百科语料

原始语料下载地址, 经过简繁体转换,使用Stanford分词工具分词,且去除非汉字词汇,并将语聊的每句话作为一行输入。