Jupyter Notebook http://jupyter.org/ memudahkan kita untuk membuat dan berbagi dokumen yang merupakan gabungan dari live code, equation, visualisasi dan catatan. Jupyter dapat digunakan untuk visualisasi, pembersihan dan data transformasi, statistical model dan machine learning. Scikit-learn merupakan library machine learning pada bahasa python.
a. Membaca dataset standar iris dan dataset play-tennis (dataset eksternal dalam format csv). Dataset play-tennis dapat diakses pada lampiran.
Menggunakan sklearn.datasets untuk membaca dataset standar. Untuk membaca dataset csv, gunakanlah Python Data Analysis Library http://pandas.pydata.org/
- NaiveBayes (http://scikit-learn.org/stable/modules/naive_bayes.html ),
- DecisionTree ID3 (http://scikit-learn.org/stable/modules/tree.html ),
- kNN (http://scikit-learn.org/stable/modules/neighbors.html ), dan
- Neural Network MLP (http://scikit-learn.org/stable/modules/neural_networks_supervised.html ) untuk dataset iris dengan skema full-training, dan menampilkan modelnya.