/Recognition_of_Alzheimer_Disease

2019科大讯飞AI开发者大赛——阿尔茨海默综合症预测挑战赛

Primary LanguagePython

Recognition-of-Alzheimer-Disease

2019科大讯飞AI开发者大赛——阿尔茨海默综合症预测挑战赛

提取特征时用到的方法: 对于两类的被询问者(AD和CTRL),先分别汇总这两类人群的对话内容,找出各自的关键词,而对于待分类的样本来说,也可以找出自己的关键词,分别计算与两类人群的关键词的相似度,定义为一个叫做相似度的特征。第一遍提取对话内容中出现的关键词,使用了原来的停词表,但是找出的高频词中仍然有大部分没有意义的词汇,于是将这些词汇加到了停词表中,构成一份新的停词表,重新寻找对话内容的关键词。