/kt-02-pandasvspolars

Primary LanguageJupyter NotebookApache License 2.0Apache-2.0

dkt #02 - Pandas vs. Polars

Este repositorio contiene dos notebooks de Python que comparan las bibliotecas Polars y Pandas en términos de rendimiento y funcionalidad para el análisis de datos.

Dataset

Te dejamos acá el dataset que acompaña la notebook por si querés replicar el experimento.

El dataset completo se puede descargar en el siguiente enlace.

Descripción de las notebooks

pandas.ipynb polars.ipynb

En estas dos notebooks, exploramos y demostramos las capacidades de Pandas y Polars en paralelo, incluyendo:

  • Carga y Data Wrangling
  • Operaciones sobre Columnas
  • Aplicación de Transformaciones
  • Generación de Estadísticas Descriptivas

Requisitos

Para ejecutar las notebooks, necesitas tener instaladas las siguientes bibliotecas:

pandas
polars
numpy
matplotlib
scipy
pathlib

Puedes instalar estas bibliotecas usando pip:

bash

pip install pandas polars numpy matplotlib scipy pathlib

Uso

Clona este repositorio en tu máquina local.
Descargar el dataset
Navega al directorio del repositorio.
Crear una carpeta dataset en el repositorio descomprimir el .zip esta última carpeta
Abre las notebooks utilizando Jupyter Notebook o cualquier otra herramienta compatible desde el directorio del repositorio.

bash

git clone git@github.com:deployr-ai/kt-02-pandasvspolars.git
cd kt-02-pandasvspolars
jupyter notebook

Contribuciones

¡Las contribuciones son bienvenidas! Si tienes alguna idea para mejorar estas notebooks o agregar más comparaciones, no dudes en abrir un issue o enviar un pull request.

Contacto

Para cualquier pregunta o sugerencia, puedes contactarme a través de fabricio@deployr.ai

O en nuestra página web.