AimeeLee77/senti_analysis

为啥不random_shuffle呢?训练集验证集测试集也没有分

bright1993ff66 opened this issue · 4 comments

生成完毕PCA_X以后应该shuffle一下吧,直接用SVM跑不太好吧
而且训练集验证集测试集也没有分,hyperparameter也需要tune一下吧

问一下,第四个文件4_getwordvecs.py,加载模型怎么回事,Wiki.zh.text.vector 是什么文件

Wiki.zh.text.vector是之前基于wiki中文训练出来的pre-trained word embedding啊
getwordvecs.py就是拿到那个获得词向量啊

我也有疑问,它训练和后面测试的不是相同的数据吗?这样准确率肯定很高啊

Wiki.zh.text.vector是之前基于wiki中文训练出来的pre-trained word embedding啊 getwordvecs.py就是拿到那个获得词向量啊

分享一下宝
Wiki.zh.text.vector