/OCR1

OpenClassRooms project 1

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

OCR1

OpenClassRooms project 1: Analysez des données de systèmes éducatifs

Données

Les données de la Banque mondiale sont disponibles à l’adresse suivante : https://datacatalog.worldbank.org/dataset/education-statistics.

Mission

  1. Valider la qualité de ce jeu de données (comporte-t-il beaucoup de données manquantes, dupliquées ?)

  2. Décrire les informations contenues dans le jeu de données (nombre de colonnes ? nombre de lignes ?)

  3. Sélectionner les informations qui semblent pertinentes pour répondre à la problématique (quelles sont les colonnes contenant des informations qui peuvent être utiles pour répondre à la problématique de l’entreprise ?)

  4. Déterminer des ordres de grandeurs des indicateurs statistiques classiques pour les différentes zones géographiques et pays du monde (moyenne/médiane/écart-type par pays et par continent ou bloc géographique)

Compétences évaluées

  1. Mettre en place un environnement Python

  2. Effectuer une représentation graphique à l'aide d'une librairie Python adaptée (matrice de corrélation, séries temporelles)

  3. Manipuler des données avec des librairies Python spécialisées (Pandas)

  4. Maîtriser les opérations fondamentales du langage Python pour la Data Science

  5. Utiliser un notebook Jupyter pour faciliter la rédaction du code et la collaboration

Livrables

  1. Un notebook comportant les analyses pré-exploratoires réalisées (non cleané, pour comprendre votre démarche).

  2. Un support de présentation pour la soutenance.