OCR5

OpenClassRooms projet 5: Classifiez automatiquement des biens de consommation

Réaliser, dans une première itération, une étude de faisabilité d'un moteur de classification d'articles, basé sur une image et une description, pour l'automatisation de l'attribution de la catégorie de l'article.
Une réduction en 2 dimensions
Analyse du graphique afin d’en déduire faisabilité de regrouper automatiquement des produits de même catégorie.
Réalisation d’une mesure pour confirmer ton analyse visuelle.
Prétraitement et analyse textuelles et images (SIFT / ORB / SURF, CNN Transfer Learning) des produits.
- Prétraitement textuelles
- Analyses textuelles: Bag-of-words, Tf-idf, Word2Vec, BERT, Universal Sentence Encoder
- Prétraitement images
- Analyses images: Extraction des prédicteurs, Kmean sur prédicteurs, Bag of Visual words
- Analyses images: Transfert learning ImageNet VGG16 entraînement non supervisé
- Analyses images: Transfert learning ImageNet VGG16 entraînement supervisé

Prétraiter des données image pour obtenir un jeu de données exploitable
Prétraiter des données texte pour obtenir un jeu de données exploitable
Représenter graphiquement des données à grandes dimensions
Mettre en œuvre des techniques de réduction de dimension
Utiliser des techniques d’augmentation des données
Définir la stratégie de collecte de données en recensant les API disponibles
Définir la stratégie d’élaboration d’un modèle d'apprentissage profond
Évaluer la performance des modèles d’apprentissage profond selon différents critères

Un ou des notebooks contenant les fonctions permettant le prétraitement et la feature extraction des données textes et images ainsi que les résultats de l’étude de faisabilité (graphiques, mesure de similarité).
Un support de présentation pour la soutenance, détaillant le travail réalisé.