ProcesamientoDeDatosBanner

Proyecto de Finalización - Procesamiento de Datos - ISPC

Comisión Sala 1 - Cohorte 2022

GRUPO 2

Integrantes:

  • Alvarez, Agustín
  • Bolatti Cristofaro, María Carolina
  • de Rosario Boero, Aldana Mailén
  • Galván, Sebastián Alejandro
  • Octtinger, Martina
  • Siccardi, Luis
  • Vila, Mariano Raúl

Datasets:

(2 tipos)

Video Presentación:

Reportes:

Notebooks:

Requerimientos:

Como el dataset de mbti supera los 100 MB hay instalar el git lfs para usar archivos grandes:

Colab

# instalacion de pandas
!python -V
!pip -V
!pip install pandas==1.5.3
# Clonacion de repositorio
from google.colab import drive
drive.mount('/content/drive')
! ls 'drive/MyDrive/Colab Notebooks/ProcesamientoDeDatos'
! cd 'drive/MyDrive/Colab Notebooks/ProcesamientoDeDatos'
! git clone https://github.com/Carolina-Bolatti/Pro.Fin.-Proces.Datos.git
# Actualizacion con github
from google.colab import drive
drive.mount('/content/drive')
%cd 'Pro.Fin.-Proces.Datos'
!git lfs install
!git lfs fetch
!git lfs pull
!git pull
!ls -lisa
# Chequeo que tenemos los datos
from google.colab import drive
drive.mount('/content/drive')
%cd 'Pro.Fin.-Proces.Datos'
!git lfs install
!ls -lrt data
!head -2 data/*
# Carga de datos de empleo
from google.colab import drive
drive.mount('/content/drive')
!ls
import pandas as pd
empleados = pd.read_csv('data/Employee.csv')
print(empleados)

VsCode

Crear entorono vitrual y activarlo:

python -m venv venv
venv\Script\activate

Insatar las dependencias:

pip install -r requirements.txt