为啥不random_shuffle呢?训练集验证集测试集也没有分
bright1993ff66 opened this issue · 4 comments
bright1993ff66 commented
生成完毕PCA_X以后应该shuffle一下吧,直接用SVM跑不太好吧
而且训练集验证集测试集也没有分,hyperparameter也需要tune一下吧
CxwDelete commented
问一下,第四个文件4_getwordvecs.py,加载模型怎么回事,Wiki.zh.text.vector 是什么文件
bright1993ff66 commented
Wiki.zh.text.vector是之前基于wiki中文训练出来的pre-trained word embedding啊
getwordvecs.py就是拿到那个获得词向量啊
wanghuahua2019 commented
我也有疑问,它训练和后面测试的不是相同的数据吗?这样准确率肯定很高啊
yang1637653089 commented
Wiki.zh.text.vector是之前基于wiki中文训练出来的pre-trained word embedding啊 getwordvecs.py就是拿到那个获得词向量啊
分享一下宝
Wiki.zh.text.vector