- Entender o Problema
- Coletar os Dados
- Processar os Dados
- Exploração dos Dados
- Comunicar os Resultados
- Feedback
- Em relação aos tipos de armazenamentos os dados podem ser numéricos ou categóricos
- Dados Qualitativos
- Nominal: Profissão, Sexo, Religião
- Ordinal: Dados que tem uma hierarquia como por exemplo escolaridade.
- Dados Quantitativos
- Discreta: Dados numéricos de valores inteiros como por exemplo nº de filhos
- Contínua: Dados numéricos de valores decimais como por exemplo altura, peso etc.
- Em relação à fonte de dados eles podem ser primários ou secundários
- Dados Primários
- São dados próprios, geralmente são gerados dentro da própria empresa, podem facilmente ser manipulados pelo analista de dados.
- Dados Secundários
- Não são dados próprios, geralmente são fornecidos por terceiros ou em alguns casos alguma parceria de troca de informações, esse tipo de dado não é de domínio público
- Dados Terciários
- Assim como os dados secundários, os dados terciário são fornecidos por terceiros, a única diferença é que eles são de domínio público.
- Em relação à linguagem de programação eles podem ser primitivos ou não primitivos
- Dados Primitivos
- Dados do tipo int, str, float, booelan
- Dados não Primitivos
- Dados do tipo list, tuple, dict
- Independente dos itens anteriores os dados podem ser estruturados, semi estruturados ou não estruturados
- Dados Estruturados
- São dados que seguem uma classificação e lógica formal, geralmente são dados em formatos tabulares como em bancos de dados relacionais ou planilhas do Excel.
- Dados Semi Estruturados
- São dados sem uma devida organização, no entanto já estão classificados de alguma forma, portanto a compreensão de como os dados estão separados é mais fácil, mas ainda sim algum trabalho de estruturação será necessária. Alguns exemplos de dados semi estruturados são arquivos no formato XML, JSON.
- Dados Não Estruturados
- Dados não estruturados são informações que não possuem um formato fixo ou organização pré-definida, tornando-se mais difíceis de serem processados e analisados de maneira convencional.
- Não existe análise de Dados Não Estruturados, os dados devem ser pré processados para que se tornem esruturados antes de qualquer análise.

