Analise dos estudantes de medicina

Exercício prático da Semana 2 sobre Analise de dados

Coleta dos dados

Os dados foram coletados no site do Kaggle https://www.kaggle.com/datasets/slmsshk/medical-students-dataset

Perguntas a serem respondidas

  • Qual o significado das variáveis do dataframe?
  • Quais os tipos de variáveis você tem?
  • Tem estudante duplicado?
  • A base tem dados nulos? Se sim, vamos tratar
  • O tipo das variáveis está certo?
  • Qual a média da idade dos estudantes de medicina?
  • Qual percentual por gênero dos estudantes?
  • Qual o tipo sanguineo mais comum entre os estudantes?
  • A maioria dos estudantes tem diabetes?
  • Qual percentual de homens e mulheres que fumam?
  • Qual percentual de homens e mulheres que tem diabetes?
  • Qual a distribuição da massa corporal dos estudantes?
  • Qual a distribuição das idades dos estudantes? É assimétrico?
  • Qual a distribuição das idades dos estudantes por gênero?
  • Qual a distribuição do colesterol dos estudantes? É assimétrico?
  • Qual a distribuição do colesterol dos estudantes por gênero?
  • Qual a distribuição do peso dos estudantes? É assimétrico?
  • Qual a distribuição da altura dos estudantes? É assimétrico?
  • Qual o principal tipo sanguineo dos estudantes masculinos?

Como executar o código

Você pode acessar no video do youtube: https://youtu.be/p8ShvB4RNZI