Projet 6 - "Détectez des faux billets" - Parcours Data Analyst - OpenClassrooms

Le but du projet est de créer un modèle qui permette de déterminer si un billet est un vrai ou faux.

A partir du jeu de données billets.csv (dans le fichier downloaded_csv), le script va:
-Préparer les données.
-Faire une analyse univariée.
-Faire une analyse bivariée.
-Réaliser une ACP.
-Réaliser un clustering par classification hiérarchique.
-Réaliser un clustering avec KMeans.
-Créer un modèle de regression linéaire et le tester.
-Tester le modèle sur un nouveau jeu de données exemple.csv (dans le fichier donnees_test)

Il s'agit d'un fichiers jupyter notebook.

---------------------------------------- Projet en cours d'évaluation ----------------------------------------

Environnement

Jupyter 4.4.0 - Python 3.7.0.final.0 - Conda 4.5.11
Pandas 0.24.0 - Numpy 1.15.4 - Seaborn 0.9.0 - Sklearn 0.20.2 - Matplotlib 3.0.2 - Scipy 1.2.0

Auteur

  • Alain Béguin

En cours de formation à la Data Analyse depuis le 01 septembre 2018

Remerciements

  • Benjamin Marlé, mentors OC
  • Ricco Rakotomalala de l'université de Lyon, pour ses cours disponible librement en version pdf

*A tous ceux qui mettent en lignes des ressources de grandes qualités *

Date

06 février 2019 - Tourcoing