/kuakua_corpus

夸夸语料,来自豆瓣互相表扬组数据

kuakua_corpus

夸夸语料,来自豆瓣互相表扬组数据,数据未经清洗

topic.txt

里面以话题回复形式存储了超过18000条数据,以<######>分隔话题与回复,以<$$$$$$>分隔各回复

qa.txt

里面以问答对形式存储了超过190000个问答对