Esse é um projeto da matéria de Algebra Linear e Teoria da Informação do Insper para o curso de Ciência da Computação.
Neste projeto, projetaremos e avaliaremos o classificador linear e o classificador por árvore de decisão no problema de predizer AVCs à partir da base de dados que está disponível no Kaggle. Também, avaliaremos quais foram os fatores de risco identificados por cada um dos classificadores e, após, verificaremos se esses fatores de risco identificados pelos classificadores já foram identificados anteriormente por algum estudo na área. Para isso, vamos usar classificadores para identificar quais são os fatores de risco para o acidente vascular cerebral (AVC). Um AVC (stroke) é um dano cerebral causado pela interrupção de seu fluxo sanguíneo. Ter um AVC é um problema sério porque pode levar a sequelas, então é melhor preveni-lo do que tentar lidar com suas consequências.
Primeiramente, colocamos os dados em dados teste e de treino, o modelo foi criado por meio de regressão linear, definiu-se a função de perda, a matriz de peso
Nos concluimos que os principais fatores de risco para o AVC estão relacionados a hipertensão e tabagismo. Além disso, através da nossa pesquisa, utilizamos o site do governo como referência e, vimos que a hipertensão e tabagismo são um dos principais riscos para desenvolver um AVC, o que mostra que nosso resultado já era o esperado.
https://github.com/st4pzz/APS_AVC
pip install -r requirements.txt
python notebook.ipynb
MINISTÉRIO DA SAÚDE. Acidente Vascular Cerebral. Disponível em https://www.gov.br/saude/pt-br/assuntos/saude-de-a-a-z/a/avc. Acesso em 01 de Maio de 2023.