-
- Analyse exploratoire, nettoyage de données, data visualisation
-
- Validation de la faisabilité d’une application
- Analyses univariées et multivariées
- Eentrainement de modèles pour prédire le Nutriscore
-
- Analyse de la problématique, préparation des données et feature engineering
- Modélisation supervisée et optimisation des hyperparamètres
- Choix de métriques pertinentes pour l’évaluation des performances
-
- Clustering
- Détection de profils clients, visualisations et évaluation de la qualité des clusters
- Métriques clustering, évaluation et comparaison de clusters
- Représentation graphique des segments( radar, Snake plot, squarify plot)
- Evaluation du cycle de maintenance du modèle
-
- NLP : TFidf, BOW
- Computer Vision : OpenCV, ORB, SIFT, BOvW
- Réduction de dimensions linéaires et non linéaires
- Transfer learning ResNet50, Bert
- Visualisation des clusters
-
- Création d’un score répondant à la problématique métier
- Unbalanced Classification
- UnderSampling, OverSampling, Weigths
- Voting Classifier
- Explicabilité du modèle
- Dashboard interactif
-
- Framework SparkSQL
- Extraction de features via RESNET50
- ACP
- Régression Logistique SparkMLib
- Stockage S3
- Test sur EC2
- Passage à l'échelle sur cluster EMR