Pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.
- Leer todos los archivos
- Concatenar archivos
- Eliminar datos nulos de archivos
- Leer xlsx y convertir a csv archivos
- cambiar nombre de columna
- Filtrar archivos
- Unir archivos
- Selecionar informacion
- Convertir a CSV y xlsx para informe
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
import glob
import os
import openpyxl
import pdfkit
todos=[]
for f in glob.glob(os.path.join("ubicaciòn archivos")):
df=pd.read_excel(f)
todos.append(pd.read_excel(f))
df = pd.concat(todos,ignore_index="True")
df = df.fillna(0)
df.to_excel("ubicacion.xlsx", index = None, header=True)
todosne = pd.read_excel(r"ubicacion.xlsx")
todosne.to_csv(r"Ubicacion_final", index = None, header=True)
df1.rename(columns={'CodigoBus': 'Bus'}, inplace=True)
filtrado = df[(df.Responsable == "Cop") & (df.Observación == "F2 inicio_fin Ruta") | (df.Observación == "Estados de Localización")]
output1 = pd.merge(df1, filtrado, on = ['Bus','ViajeLinea','ServicioBus','Coche'], how ='inner')
derived_df = output1.filter(['Fecha_y', 'Operador', 'NumeroBus',
'NumEventosBus', 'Linea', 'OrdenViaje', 'IDViaje', 'Tipo', 'Nodo',
'Descripcion', 'HoraTeorica', 'HoraReferencia', 'HoraLlegada',
'HoraSalida', 'Evento', 'TiempoRegulacion', 'Alarma',
'TiempoAperturaPuertas', 'Conductor', 'NombreConductor'])
df.to_xlsx()
df.to_csv()
⭐️ fradurgo19