-
Допишіть в файлі
kfold.py
функціїkfold_cross_validation
таevaluate_accuracy
для того щоб порахувати точність роботи KNN алгоритму. -
Порахуйте для різних
k
вKNN
точність на тестовому датасеті і запишіть вREADME.md
,k
беріть з таблички нижче
k | Accuracy |
---|---|
3 | 0.82 |
4 | 0.8325 |
5 | 0.8275 |
6 | 0.83 |
7 | 0.8075 |
9 | 0.8025 |
10 | 0.81 |
15 | 0.7925 |
20 | 0.7775 |
21 | 0.7775 |
40 | 0.7325 |
41 | 0.7325 |
Які можна зробити висновки про вибір k
?
Optimal value k
= 4
- Знайшовши найкращий
k
змінітьnum_folds
(вmain()
) та подивіться чи в середньому точність на валідаційних датасетах схожа з точністю на тестовому датасеті.
Overall, the model performs reasonably well, however, the drop in accuracy from the cross-validation to the test data suggests that the model may be slightly overfitting to the training data, as it doesn't generalize quite as well to unseen data.