BasedePublicationsScientifiques

Il s’agit de créer une base, une collection, d’y insérer des données et de l’interroger grâce à Python. Les documents fournis correspondent à un extrait d’une base de publications scientifiques, The DBLP Computer Science Bibliography.

https://www.mongodb.com/python https://docs.mongodb.com/manual/

Contexte du projet

Le centre de recherche Kusanagi International souhaite un petit module d'accès simple aux publications scientifiques. On vous demande de mettre en place une base de données MongoDB, orientée documents, pour gérer l'accès à ces publications. De votre coté, vous allez tester les datas grâce à un petit script Python.

Modalités pédagogiques

Le projet se fait en groupe de 2 ou 3 apprenants et doit être rendu vendredi. Vous allez suivre les étapes suivantes pour réaliser le projet :

Faire une veille sur le connecteur PyMongo (Voir liens proposés), Tester le connecteur avec une base Mongo, Créer la base DBLP et y ajouter une collection publis, importer dans la base les données du fichier dblp.json (Ca peut prendre un peu de temps), écrire le script Python pour tester la base, exécuter le script et vérifier les résultats. Le script Python doit permettre :

Compter le nombre de documents de la collection publis; Lister tous les livres (type “Book”) ; Lister les livres depuis 2014 ; Lister les publications de l’auteur “Toru Ishida” ; Lister tous les auteurs distincts ; Trier les publications de “Toru Ishida” par titre de livre ; Compter le nombre de ses publications ; Compter le nombre de publications depuis 2011 et par type ; Compter le nombre de publications par auteur et trier le résultat par ordre croissant ; Tous les affichages se font dans la console.

Et s'il vous reste du temps écrire un petit script qui :

demande le chemin d'un fichier json, insére un ou plusieurs nouveaux documents, à partir de ce fichier, dans la collection publis. Pour tester ce dernier script, créer un fichier json à partir des informations trouvées sur le site proposé en lien.

Critères de performance

La connexion à MongoDB doit fonctionner et celle-ci doit contenir la collection publis avec l'ensemble des documents enregistrés. Le code Python doit exécuter l'ensemble des requêtes demandées.

Modalités d'évaluation

Présentation du code devant la promo et évaluation par les paires.

Livrables

Un lien Github vers le code Python.