/Ejercicios-Dataframe-Pandas

Tasca M3 T02 Introducció a la llibreria Pandas, als Dataframes i els mètodes. Anàlisi exploratòria de les dades.

Primary LanguageJupyter Notebook

estructures_Dataframe

Tasca M3 T02 Exercicis amb Dataframes.

  • Exercici 1 Descarrega el data set Airlines Delay: Airline on-time statistics and delay causes i carrega’l a un Pandas Dataframe. Explora les dades que conté, explica breument quines variables hi ha i queda’t únicament amb les columnes que consideris rellevants. Justifica la teva elecció.

->Airlines Delay: Airline on-time statistics and delay causes

Important

Redueix la dimensió del dataset de manera aleatòria per tal d'obtenir un dataset de només 200.000 registres. Tots els exercicis s'han de fer amb aquest dataset reduït.

  • Exercici 2 Fes un informe complet del dataset:

Resumeix estadísticament el dataset i les columnes d’interès. Fes una anàlisi estadístic del que consideris rellevant. Troba quantes dades faltants hi ha per columna. Crea columnes noves (velocitat mitjana del vol, si ha arribat tard o no...). Fes una taula de les aerolínies amb més endarreriments acumulats. Quins són els vols més llargs? I els més endarrerits? Busca les rutes més llargues i les que acumulen més retards. Aporta allò que consideris rellevant.

  • Exercici 3 Exporta el dataset net i amb les noves columnes a Excel.