/Oc-P2

Analyse de marché pour Books Online

Primary LanguagePython

Oc-P2 : Analyse de marché pour Books Online


logo

Objectif

Ce programme est un exercice proposé par OpenClassRooms dans le cadre de la formation : Développeur d'applications Python Il s'agit d'une version bêta d'un système de suivi de prix des livres en ligne. Cette version scrute le site Books to Scrape un revendeur de livres en ligne, pour en extraire les données sur les livres

Fonctionnement

Les informations sont extraites dans des fichiers CSV (un fichier par catégorie) dans le répertoire ''csv'', les images (couverture des livres) sont stockées dans le répertoire ''img''.
Le nom des répertoires de destination peut être modifié via la ligne de commande (voir utilisation ci-dessous).
Les images sont classées dans les sous répertoires correspondants à la catégorie des livres. Les fichiers image respectent la convention de nommage suivante : <title>.png

<title> correspond aux 40 premiers caractères du titre du livre.

Installation

# Creer l'environnement virtuel
python -m venv env
source env/bin/activate

# cloner le projet
git clone https://github.com/Slb59/Oc-P2.git
cd Oc-P2

# installer les dépendances
pip install -r requirements.txt

# executer le programme
python scrape.py

Utilisation

Vous pouver lancer le programme sans paramètre. Les fichiers csv et images générés seront alors stockés respectivement dans les répertoires csv et img

python scrape.py

Il est possible de préciser les répertoires de destination

python scrape.py --csv-dir mon_rep_csv --img-dir mon_rep_img

License