Transfert learning(Faster R-CNN) : détection de zones délimitantes les réçus ainsi que leur total( voir work_notebook.ipynb pour le code)
-- Objectif : Développer un système d'extraction d'informations pertinantes d'une image ( reçu et sa zone de total dans notre cas)
- Lien du dataset : https://github.com/clovaai/cord);
- Documentation du dataset: https://openreview.net/pdf
- Les données et le model n'ont pas pu être téléchargés ici à cause des contraintes de taille
- Model : Faster-RCNN
- Google colab : Torch>=1.5.0 (Gpu) + pandas + matplotib + PIL
- Extraction des coordonnées délimitant les reçus et leur total des fichiers d'annotation
- Sélection des reçus disposant de coordonnées de points les délimitant
- Redimensionnement des images (moyenne des longueurs et largeurs des 4 premieres resolutions apparaissant le plus dans le dataset)
- Modification des classes pytorch pour l'entrainement sur le dataset( certains fichiers et lignes de codes proviennent du répertoire github officiel de pythorch : segmentation et prediction COCO)
- Utilisation d'un modèele Faster R-CNN avec un réseau ResNET-50 fPN pour l'entrainnement
- Visualisation des résultats sur les données de test