/house-prices

Primary LanguageJupyter Notebook

HOUSE PRICES

Python 3.7

Dans le cadre de la formation Data / IA à l'Ecole IA Microsoft (Powered by Simplon), il a été demandé de travailler sur un projet d'analyse prédictive. D'abord effectué directement sur la plateforme en ligne BigML, l'ensemble de processus d'apprentissage automatique supervisé a du être réalisé sur Python grâce à Jupyter Notebook.

But : pouvoir établir une prédiction et transmettre le résultat sur Kaggle, une plateforme web organisant des compétitions en science des données.

Pour retrouver la compétition en question, vous retrouverez tous les renseignements et datasets ainsi que le classement directement sur cette page : HousePrices.

Pré-requis

Le script en question ne sera fonctionnel qu'après un certain nombre d'outils :

  • Anaconda ;
  • Un compte sur Kaggle ;
  • Un compte sur GitHub si vous souhaitez push votre projet en ligne et de façon publique ;
  • Importation de modules :
    • Numpy : manipulation de matrices et de tableaux multidimensionnels ;
    • Kaggle : API pour transmettre le résultat de notre algorithme et participer à la compétition ;
    • Pandas : bibliotèque Python permettant la manipulation et l'analyse des données ;
    • Keras / Tensorflow : deep-learning ;
    • Matplotlib : pour créer une visualisation graphique des données.

Composition du projet

  • Exploratory Data Analysis (EDA) en R ;
  • Une EDA avec Python ;
  • Une prédiction avec SkLearn ;
  • Une prédiction avec Keras / Tensorflow.

Auteur