Cette première session est consacrée à des méthodes de classification standards en machine learning. Elle comprend un cours d’introduction au machine learning, une démonstration d’un algorithme d’apprentissage et puis des TP avec Python.
Cette séance est ouverte à tous. Les deux premières parties (cours + démo) ne nécessitent pas de connaissances particulières en programmation. Les TP sont accessibles aux débutants en Python.
Pour suivre les TP en Python, merci d'installer sur votre machine avant le début de la séance :
- Python 3 (de préférence, version 3.8 et plus)
- Les librairies suivantes : pandas, numpy, scikit-learn, seaborn, matplotlib, notebook (ou jupyterlab)
Si vous utilisez déjà Anaconda ou Miniconda, l'installation se fait avec la commande conda
:
conda install pandas numpy scikit-learn seaborn matplotlib
conda install -c conda-forge notebook
Sinon, utiliser la commande pip
intégrée dans Python :
pip install pandas numpy scikit-learn seaborn matplotlib notebook
Cette vidéo peut vous aider pour l'installation de Python et de ses librairies :
Présentation en visio
Pour ouvrir un notebook jupyter, taper la commande suivante dans un terminal (Linux/MacOS) ou dans le command prompt (Windows) :
jupyter notebook nom_de_fichier.ipynb
Exercice 1. Arbres à décision et Random Forest
Exercice 2. Régression logistique et SVM