Faster-RCNN-Receipt-detection

Transfert learning(Faster R-CNN) : détection de zones délimitantes les réçus ainsi que leur total( voir work_notebook.ipynb pour le code)

PicsArt_12-03-03 19 40

-- Objectif : Développer un système d'extraction d'informations pertinantes d'une image ( reçu et sa zone de total dans notre cas)

Dataset utilisé:

Environnement:

  • Model : Faster-RCNN
  • Google colab : Torch>=1.5.0 (Gpu) + pandas + matplotib + PIL

les points abordées dans ce notebook sont:

  • Extraction des coordonnées délimitant les reçus et leur total des fichiers d'annotation
  • Sélection des reçus disposant de coordonnées de points les délimitant
  • Redimensionnement des images (moyenne des longueurs et largeurs des 4 premieres resolutions apparaissant le plus dans le dataset)
  • Modification des classes pytorch pour l'entrainement sur le dataset( certains fichiers et lignes de codes proviennent du répertoire github officiel de pythorch : segmentation et prediction COCO)
  • Utilisation d'un modèele Faster R-CNN avec un réseau ResNET-50 fPN pour l'entrainnement
  • Visualisation des résultats sur les données de test