Portfolio projets formation Data Scientist

OpenClassrooms - Centrale Supélec

Analysez des données de systèmes éducatifs
- Analyse exploratoire, nettoyage de données, data visualisation
Concevez une application au service de la santé publique
- Validation de la faisabilité d’une application
- Analyses univariées et multivariées
- Eentrainement de modèles pour prédire le Nutriscore
Anticipez les besoins en consommation électrique de bâtiments
- Analyse de la problématique, préparation des données et feature engineering
- Modélisation supervisée et optimisation des hyperparamètres
- Choix de métriques pertinentes pour l’évaluation des performances
Segmentez des clients d'un site de e-commerce
- Clustering
- Détection de profils clients, visualisations et évaluation de la qualité des clusters
- Métriques clustering, évaluation et comparaison de clusters
- Représentation graphique des segments( radar, Snake plot, squarify plot)
- Evaluation du cycle de maintenance du modèle
Classifiez automatiquement des biens de consommation
- NLP : TFidf, BOW
- Computer Vision : OpenCV, ORB, SIFT, BOvW
- Réduction de dimensions linéaires et non linéaires
- Transfer learning ResNet50, Bert
- Visualisation des clusters
Implémentez un modèle de scoring
- Création d’un score répondant à la problématique métier
- Unbalanced Classification
- UnderSampling, OverSampling, Weigths
- Voting Classifier
- Explicabilité du modèle
- Dashboard interactif
Déployez un modèle dans le cloud
- Framework SparkSQL
- Extraction de features via RESNET50
- ACP
- Régression Logistique SparkMLib
- Stockage S3
- Test sur EC2
- Passage à l'échelle sur cluster EMR

mikaleroy/mikaleroy

Portfolio projets formation Data Scientist

OpenClassrooms - Centrale Supélec

Analysez des données de systèmes éducatifs

Concevez une application au service de la santé publique

Anticipez les besoins en consommation électrique de bâtiments

Segmentez des clients d'un site de e-commerce

Classifiez automatiquement des biens de consommation

Implémentez un modèle de scoring

Déployez un modèle dans le cloud