Soyouzzz1986/Projet8-Openclassrooms

Déployez un modèle dans le cloud

Jupyter Notebook

Projet8-Openclassrooms

Parcours Data Science

Projet n°8 : "Déployez un modèle dans le cloud"

Description du projet

Mise en place d'une infrastructure de prétraitement de données dans le cloud, en vue d'une augmentation du volume des données
Configuration d'une instance AWS EC2 (OS Ubuntu Server 18.04)
Réalisation de scripts pyspark et exécution dans le cloud
Lecture et enregistrement de données sur Amazon S3
Appel à la librairie MLLib pour approche Transfer Learning du prétraitement

Source des données : https://www.kaggle.com/moltean/fruits

Compétences évaluées

Utiliser les outils du cloud pour manipuler des données dans un environnement Big Data
Paralléliser des opérations de calcul avec Pyspark
Identifier les outils du cloud permettant de mettre en place un environnement Big Data