Exercício prático da Semana 2 sobre Analise de dados
Os dados foram coletados no site do Kaggle https://www.kaggle.com/datasets/slmsshk/medical-students-dataset
- Qual o significado das variáveis do dataframe?
- Quais os tipos de variáveis você tem?
- Tem estudante duplicado?
- A base tem dados nulos? Se sim, vamos tratar
- O tipo das variáveis está certo?
- Qual a média da idade dos estudantes de medicina?
- Qual percentual por gênero dos estudantes?
- Qual o tipo sanguineo mais comum entre os estudantes?
- A maioria dos estudantes tem diabetes?
- Qual percentual de homens e mulheres que fumam?
- Qual percentual de homens e mulheres que tem diabetes?
- Qual a distribuição da massa corporal dos estudantes?
- Qual a distribuição das idades dos estudantes? É assimétrico?
- Qual a distribuição das idades dos estudantes por gênero?
- Qual a distribuição do colesterol dos estudantes? É assimétrico?
- Qual a distribuição do colesterol dos estudantes por gênero?
- Qual a distribuição do peso dos estudantes? É assimétrico?
- Qual a distribuição da altura dos estudantes? É assimétrico?
- Qual o principal tipo sanguineo dos estudantes masculinos?
Você pode acessar no video do youtube: https://youtu.be/p8ShvB4RNZI