- Réaliser, dans une première itération, une étude de faisabilité d'un moteur de classification d'articles, basé sur une image et une description, pour l'automatisation de l'attribution de la catégorie de l'article.
- Une réduction en 2 dimensions
- Analyse du graphique afin d’en déduire faisabilité de regrouper automatiquement des produits de même catégorie.
- Réalisation d’une mesure pour confirmer ton analyse visuelle.
- Prétraitement et analyse textuelles et images (SIFT / ORB / SURF, CNN Transfer Learning) des produits.
- Prétraitement textuelles
- Analyses textuelles: Bag-of-words, Tf-idf, Word2Vec, BERT, Universal Sentence Encoder
- Prétraitement images
- Analyses images: Extraction des prédicteurs, Kmean sur prédicteurs, Bag of Visual words
- Analyses images: Transfert learning ImageNet VGG16 entraînement non supervisé
- Analyses images: Transfert learning ImageNet VGG16 entraînement supervisé
- Prétraiter des données image pour obtenir un jeu de données exploitable
- Prétraiter des données texte pour obtenir un jeu de données exploitable
- Représenter graphiquement des données à grandes dimensions
- Mettre en œuvre des techniques de réduction de dimension
- Utiliser des techniques d’augmentation des données
- Définir la stratégie de collecte de données en recensant les API disponibles
- Définir la stratégie d’élaboration d’un modèle d'apprentissage profond
- Évaluer la performance des modèles d’apprentissage profond selon différents critères
- Un ou des notebooks contenant les fonctions permettant le prétraitement et la feature extraction des données textes et images ainsi que les résultats de l’étude de faisabilité (graphiques, mesure de similarité).
- Un support de présentation pour la soutenance, détaillant le travail réalisé.