/Pima-Indians-Diabetes

ML project

Primary LanguageJupyter Notebook

Proyecto APA

El objetivo es desarrollar un modelo de clasificación para predecir si la paciente tendra diabetes o no.

Contenido

  • Readme.md: Este archivo.
  • report.pdf: Documentación sobre el proyecto
  • dataset/diabetes.csv : Dataset
  • project.iphnb: Codigo del proyecto

Dataset

El conjunto de datos de Pima Indians Diabetes que se encuentra en Kaggle, dispone de 768 datos de mujeres con edad mínima de 21 años. Además incluye 8 variables predictoras médicas y un target:

  • Pregnancies: número de veces que ha estado embarazada.
  • Glucose: concentración de glucosa en plasma a las 2 horas, en una prueba de tolerancia oral a la glucosa
  • BloodPressure: presión arterial diastólica (mm Hg)
  • SkinThickness: grosor del pliegue del tríceps (mm)
  • Insulin: insulina sérica de 2 horas (mu U/ml)
  • BMI: índice de masa corporal (peso en kg/(altura en m)$^2$)
  • DiabetesPedigreeFunction: función de pedigrí de diabetes
  • Age: Edad (años) /
  • [target] Outcome: variable clasificadora (0 o 1), indica si es diabética o no. 268 de 768 son 1 (diabéticas) y el resto son 0 (no diabéticas)

Instrucciones

Para ejecutar este proyecto, solo hace falta:

  • Descomentar los requisitos de ejecución (primera celda de código)
  • Ejecutar el notebook.

Autora

Míriam Méndez

Licencia

Este proyecto se encuentra bajo MIT License