El objetivo es desarrollar un modelo de clasificación para predecir si la paciente tendra diabetes o no.
Readme.md
: Este archivo.report.pdf
: Documentación sobre el proyectodataset/diabetes.csv
: Datasetproject.iphnb
: Codigo del proyecto
El conjunto de datos de Pima Indians Diabetes que se encuentra en Kaggle, dispone de 768 datos de mujeres con edad mínima de 21 años. Además incluye 8 variables predictoras médicas y un target:
- Pregnancies: número de veces que ha estado embarazada.
- Glucose: concentración de glucosa en plasma a las 2 horas, en una prueba de tolerancia oral a la glucosa
- BloodPressure: presión arterial diastólica (mm Hg)
- SkinThickness: grosor del pliegue del tríceps (mm)
- Insulin: insulina sérica de 2 horas (mu U/ml)
- BMI: índice de masa corporal (peso en kg/(altura en m)$^2$)
- DiabetesPedigreeFunction: función de pedigrí de diabetes
- Age: Edad (años) /
- [target] Outcome: variable clasificadora (0 o 1), indica si es diabética o no. 268 de 768 son 1 (diabéticas) y el resto son 0 (no diabéticas)
Para ejecutar este proyecto, solo hace falta:
- Descomentar los requisitos de ejecución (primera celda de código)
- Ejecutar el notebook.
Míriam Méndez
Este proyecto se encuentra bajo MIT License