Projet Data Engineering - Blent.ai
Explorer tous les projets »
Ce projet a pour but de vous initier aux techniques d'analyse de données et de visualisation avec Python. Vous utiliserez des bibliothèques telles que Pandas, Matplotlib, Seaborn, et Plotly pour explorer et visualiser les données des accidents corporels de la circulation routière 2022 de France. Ensuite, vous intégrerez vos visualisations dans une application interactive Streamlit et déploierez cette application sur Streamlit Cloud.
L'objectif final est de créer un tableau de bord interactif permettant de mieux comprendre les accidents corporels de la circulation routière et de faciliter la prise de décisions.
- Explorer les datasets pour étudier les propriétés statistiques des variables
- Nettoyer et préparer les données pour l'analyse
- Créer des visualisations de données avec Matplotlib, Seaborn, et Plotly
- Intégrer les visualisations dans une application Streamlit
- Déployer l'application sur Streamlit Cloud
Une fois le projet terminé, vous devriez avoir un tableau de bord interactif qui présente les données des accidents de manière claire et attrayante, en utilisant diverses visualisations.
Le tableau de bord doit inclure deux pages, une pour analyser de manière globale les accidents de l'année 2022 avec des bar chart, séries temporelles, pie chart etc. et dans la deuxième page une carte avec tous les accidents avec la possibilités de filtrer sur des colonnes spécifiques comme le département où a eu lieu l'accident, les conditions atmosphériques, type de collision etc.
- Tableau de bord
- Carte des accidents routiers
Note: Ces graphiques et filtres sont juste à titre d'exemples, vous pouvez les adapter selon les besoins analytiques que vous jugez nécessaires.
Le dépôt Git contient les éléments suivants :
notebooks/
: contient les Notebooks Jupyter du projet
streamlit/
: contient l'application Streamlit
data/
: contient les jeux de données
LICENSE.txt
: licence du projet
requirements.txt
: liste des dépendances Python
README.md
: fichier description du projet
Les instructions suivantes vous permettent d'exécuter le projet sur votre PC.
Le projet nécessite Python 3 d'installé sur le système.
- Cloner le projet Git :
git clone https://github.com/Hamagistral/Projet-Data-Eng-Accidents.git
- Installer les dépendances du fichier requirements.txt dans un environnement virtuel.
Linux / MacOS
python3 -m venv venv/
source venv/bin/activate
pip install -r requirements.txt
Windows
python -m venv venv/
venv\Scripts\activate.bat
pip install -r requirements.txt
- Lancer un Notebook Jupyter pour explorer et analyser les données :
jupyter notebook notebooks/your_notebook.ipynb
- Pour lancer l'application Streamlit en local :
streamlit run app/app.py
- Déploiement
Pour déployer votre application sur Streamlit Cloud :
- Connectez-vous à Streamlit Cloud.
- Créez une nouvelle application en reliant votre dépôt GitHub. C3. onfigurez les paramètres de déploiement et lancez votre application.