备注:这是自己在归纳和学习传统机器学习方法中的实践代码。
传统机器学习的原始形式都是面向二分类任务,因此我们使用minist数据集构造了一个奇偶数识别的二分类任务。尽管该任务直接使用模型输出的效果不一定最好,毕竟mnist用CNN网络识别的正确率超过99%,显然可以识别数字后再判断奇偶性。不过,假定我们的任务具有一定的合理,毕竟我们面向的是学习模型本身,不对任务和数据做过多讨论。
-
下载原始mnist数据集。
-
通过执行如下命令,生成我们的二分类数据集。数据集用csv保存。
python transMinist2TwoCategories.py
正例数量 负例数量 合计 训练集 30508 29492 60000 测试集 5074 4926 10000
LR模型知识点总结:详见我的博文。
LR模型的实现:LR4classification.py。