ml

naiveBayesJ.py

朴素贝叶斯分类器。

sklearn的分类器貌似不能同时支持连续特征、离散类别两种特征呢，没想清楚为什么。

关于如何改进，或许可对连续特征、尝试使用不同于高斯的其他分布。（啊，关于空值，离散特征作为单独的一类；连续特征，则先计算空值占比和非空占比，然后连续非空数值的占比、需要在原基础上乘以非空占比，空值直接就使用空值占比。即，通过这种方式处理朴素贝叶斯分类中的特征空值问题）

学习总结：

Cart决策树分类器。

sklearn源码为cython。这是python实现，与网上已有的相比，功能多了些。

可以完善的点有：

学习总结:

Cart决策树回归器。

在无剪枝的分类器版本上、稍加改动实现的（这一版无剪枝）。