/scrapping-rugby-school

Projet de scrapping IA M1

Primary LanguageJupyter Notebook

Controle continue de web scrapping

MEBENGA ATANGA STEPHANE


Technologies utilisées

  • Python 3.10

Procédure d'Installation

  1. Installation des dépendances

pip install -r requirements.txt


Description du projet


Tout le code est contenu dans le notebook main.ipynb, ou alors si vous voulez exécuter le script en ligne de commande aller dans le dossier scripts.

Le script permet de de scrapper le site de la ligue nationale de rugby. Nous récupérons la liste de tous les jours ayant une licence au top 14. Les données extrait sont enregistrés dans le fichier liste_joueurs_top_14.xlsx.

Dans ce fichier vous pouvez remarque que certaines colonnes sont vides, il s'agit des pages qui ne conenaient pas les informations totales du joueurs. Les champs qui ont été crees sont les champs suivant:

  • Nom et prenom
  • Date de naissance
  • Taille
  • Poids
  • Poste
  • Club actuelle

On a au total 584 Enregistrements.