kuakua_corpus 夸夸语料,来自豆瓣互相表扬组数据,数据未经清洗 topic.txt 里面以话题回复形式存储了超过18000条数据,以<######>分隔话题与回复,以<$$$$$$>分隔各回复 qa.txt 里面以问答对形式存储了超过190000个问答对