/Data_Analysis

My databases analysis

Primary LanguageJupyter NotebookMIT LicenseMIT

Data Analysis

Ciclo de Vida Ciência de Dados

  • Entender o Problema
  • Coletar os Dados
  • Processar os Dados
  • Exploração dos Dados
  • Comunicar os Resultados
  • Feedback



Tipos de Dados

  1. Em relação aos tipos de armazenamentos os dados podem ser numéricos ou categóricos

    • Dados Qualitativos
      • Nominal: Profissão, Sexo, Religião
      • Ordinal: Dados que tem uma hierarquia como por exemplo escolaridade.
    • Dados Quantitativos
      • Discreta: Dados numéricos de valores inteiros como por exemplo nº de filhos
      • Contínua: Dados numéricos de valores decimais como por exemplo altura, peso etc.

  2. Em relação à fonte de dados eles podem ser primários ou secundários

    • Dados Primários
      • São dados próprios, geralmente são gerados dentro da própria empresa, podem facilmente ser manipulados pelo analista de dados.
    • Dados Secundários
      • Não são dados próprios, geralmente são fornecidos por terceiros ou em alguns casos alguma parceria de troca de informações, esse tipo de dado não é de domínio público
    • Dados Terciários
      • Assim como os dados secundários, os dados terciário são fornecidos por terceiros, a única diferença é que eles são de domínio público.

  3. Em relação à linguagem de programação eles podem ser primitivos ou não primitivos

    • Dados Primitivos
      • Dados do tipo int, str, float, booelan
    • Dados não Primitivos
      • Dados do tipo list, tuple, dict

  4. Independente dos itens anteriores os dados podem ser estruturados, semi estruturados ou não estruturados

    • Dados Estruturados
      • São dados que seguem uma classificação e lógica formal, geralmente são dados em formatos tabulares como em bancos de dados relacionais ou planilhas do Excel.
    • Dados Semi Estruturados
      • São dados sem uma devida organização, no entanto já estão classificados de alguma forma, portanto a compreensão de como os dados estão separados é mais fácil, mas ainda sim algum trabalho de estruturação será necessária. Alguns exemplos de dados semi estruturados são arquivos no formato XML, JSON.
    • Dados Não Estruturados
      • Dados não estruturados são informações que não possuem um formato fixo ou organização pré-definida, tornando-se mais difíceis de serem processados e analisados de maneira convencional.

OBS:

  • Não existe análise de Dados Não Estruturados, os dados devem ser pré processados para que se tornem esruturados antes de qualquer análise.

Sobre mim: