Aquest projecte s'ha realitzat amb l'objectiu d'entregar una pràctica amb els coneixements apresos sobre les tècniques de Web Scraping a l'assignatura Tipologia i cicle de vida de les dades, que es realitza dins el Màster de Ciència de Dades de la UOC.
A més del codi aquí present, s'entrega amb un document pdf que descriu la feina feta. Aquest document es troba dins la carpeta /pdf d'aquest mateix projecte.
pip install -r requirements.txt
A més, si volem accedir als preus dels jocs de Stadia, haurem d'indicar el nostre nom d'usuari i password a l'arxiu config.properties
.
Hi ha quatre modes per a obtenir les dades:
-
Obtenir totes les dades:
python3 main.py all
-
Obtenir només les dades dels títols dels jocs i informació per als jocs en altres plataformes.
python3 main.py external
-
Obtenir només dades dels preus dels jocs de Stadia.
python3 main.py stadia-only
-
Actualitzar els preus dels jocs en a l'arxiu
output_data/data.csv
.python3 main.py stadia-update
El fitxer output es troba a output_data/stadia_games_info.csv
El full de respostes de l'exercici es troba a pdf/respostes.pdf