Le but du projet est de créer un modèle qui permette de déterminer si un billet est un vrai ou faux.
A partir du jeu de données billets.csv (dans le fichier downloaded_csv), le script va:
-Préparer les données.
-Faire une analyse univariée.
-Faire une analyse bivariée.
-Réaliser une ACP.
-Réaliser un clustering par classification hiérarchique.
-Réaliser un clustering avec KMeans.
-Créer un modèle de regression linéaire et le tester.
-Tester le modèle sur un nouveau jeu de données exemple.csv (dans le fichier donnees_test)
Il s'agit d'un fichiers jupyter notebook.
---------------------------------------- Projet en cours d'évaluation ----------------------------------------
Jupyter 4.4.0 - Python 3.7.0.final.0 - Conda 4.5.11
Pandas 0.24.0 - Numpy 1.15.4 - Seaborn 0.9.0 - Sklearn 0.20.2 - Matplotlib 3.0.2 - Scipy 1.2.0
- Alain Béguin
En cours de formation à la Data Analyse depuis le 01 septembre 2018
- Benjamin Marlé, mentors OC
- Ricco Rakotomalala de l'université de Lyon, pour ses cours disponible librement en version pdf
*A tous ceux qui mettent en lignes des ressources de grandes qualités *
06 février 2019 - Tourcoing