Proyecto APA

El objetivo es desarrollar un modelo de clasificación para predecir si la paciente tendra diabetes o no.

Contenido

Readme.md: Este archivo.
report.pdf: Documentación sobre el proyecto
dataset/diabetes.csv : Dataset
project.iphnb: Codigo del proyecto

Dataset

El conjunto de datos de Pima Indians Diabetes que se encuentra en Kaggle, dispone de 768 datos de mujeres con edad mínima de 21 años. Además incluye 8 variables predictoras médicas y un target:

Pregnancies: número de veces que ha estado embarazada.
Glucose: concentración de glucosa en plasma a las 2 horas, en una prueba de tolerancia oral a la glucosa
BloodPressure: presión arterial diastólica (mm Hg)
SkinThickness: grosor del pliegue del tríceps (mm)
Insulin: insulina sérica de 2 horas (mu U/ml)
BMI: índice de masa corporal (peso en kg/(altura en m)$^2$)
DiabetesPedigreeFunction: función de pedigrí de diabetes
Age: Edad (años) /
[target] Outcome: variable clasificadora (0 o 1), indica si es diabética o no. 268 de 768 son 1 (diabéticas) y el resto son 0 (no diabéticas)

Instrucciones

Para ejecutar este proyecto, solo hace falta:

Descomentar los requisitos de ejecución (primera celda de código)
Ejecutar el notebook.

Autora

Míriam Méndez

Licencia