Explorar e analisar o dataset "heart disease", fazer perguntas e apresentar o resultado com base em: Teste de hipóteses, Aprendizado de máquina supervisionado e/ou Aprendizado de máquina não supervisionado.
Heart Disease Dataset
O tema do nosso trabalho é sobre o dataset Heart Disease Dataset do ano de 1988 que tem quatro bancos de dados: Cleveland, Hungria, Suíça e Long Beach V.
A base de dados do dataset é relacionada a dados experimentais com pacientes sobre doença cardíaca. Ele contém 76 atributos, porém todos os experimentos publicados são referentes ao subconjunto de 14 deles, todos do banco de dados Cleveland, os quais vamos analisar.
O campo "target" do dataset é referente à presença de cardiopatia no paciente. Este campo pode ter o valor 0 (zero) ou 1 (um), sendo que o valor 0 (zero) é para pacientes que não tem a doença de cardiopatia e 1, para quem tem a doença de cardiopatia.
O dataset usado foi extraído do site Kaggle https://www.kaggle.com/datasets/johnsmith88/heart-disease-dataset?resource=download&select=heart.csv, que é um site que disponibiliza vários dataset, porém existe vários sites que publicam o mesmo dataset, como por exempo o site UC Irvine Machine Learning Repository https://archive.ics.uci.edu/dataset/45/heart+disease.
Base de dados experimentais com pacientes sobre doença cardíaca em 4 bancos de dados: Cleveland, Hungria, Suíça e Long Beach V.
Iremos analisar o banco de dados de Cleveland (experimentos publicados).
Quando for carregar o drive fazer as devidas alteraçõe pontando o local do dataset que está na pasta data
.