/heart-disease

Explorar e analisar o dataset "heart disease", fazer perguntas e apresentar o resultado com base em: Teste de hipóteses, Aprendizado de máquina supervisionado e/ou Aprendizado de máquina não supervisionado.

Primary LanguageJupyter Notebook

INTRODUÇÃO

Explorar e analisar o dataset "heart disease", fazer perguntas e apresentar o resultado com base em: Teste de hipóteses, Aprendizado de máquina supervisionado e/ou Aprendizado de máquina não supervisionado.

Heart Disease Dataset

O tema do nosso trabalho é sobre o dataset Heart Disease Dataset do ano de 1988 que tem quatro bancos de dados: Cleveland, Hungria, Suíça e Long Beach V.

A base de dados do dataset é relacionada a dados experimentais com pacientes sobre doença cardíaca. Ele contém 76 atributos, porém todos os experimentos publicados são referentes ao subconjunto de 14 deles, todos do banco de dados Cleveland, os quais vamos analisar.

O campo "target" do dataset é referente à presença de cardiopatia no paciente. Este campo pode ter o valor 0 (zero) ou 1 (um), sendo que o valor 0 (zero) é para pacientes que não tem a doença de cardiopatia e 1, para quem tem a doença de cardiopatia.

O dataset usado foi extraído do site Kaggle https://www.kaggle.com/datasets/johnsmith88/heart-disease-dataset?resource=download&select=heart.csv, que é um site que disponibiliza vários dataset, porém existe vários sites que publicam o mesmo dataset, como por exempo o site UC Irvine Machine Learning Repository https://archive.ics.uci.edu/dataset/45/heart+disease.

Contextualização

Base de dados experimentais com pacientes sobre doença cardíaca em 4 bancos de dados: Cleveland, Hungria, Suíça e Long Beach V.

Iremos analisar o banco de dados de Cleveland (experimentos publicados).

Importando bibliotecas e dados

Quando for carregar o drive fazer as devidas alteraçõe pontando o local do dataset que está na pasta data.