数据的图像化输出入下:
K从1~15变化时错误率的变化如下
预测鸢尾花的种类的错误率随着K取1-15的变化如下。
可以发现的是,对于不同的数据集,相同的K的效果是大不一样的,这和数据集本身的结构特征有关系。但是大体上来看k并不是说越大越好,一般来说k在3~5附近就能有一个不错的效果。
KNN算法作为一个非常朴素的算法,是非常基础的。但是通过本次实验来看,KNN算法虽然非常基础,但是并不是说基础就不好,KNN算法作为一个基础的算法也能达到一个非常高的准确率。此外,利用Python的面向对象的特点对KNN模型进行打包之后,KNN的实现是一个非常容易的操作。KNN算法中,K的选择更偏向去实验性,启发性,没有特定的规律而言。