/abc-dev-search

Data Warehouse baseado em dados do senso 2010 sobre o perfil dos desenvolvedores do ABC

Startup de Tecnologia na região do ABC

Perpectiva do negócio

Um grupo de empreendedores querem abrir uma startup de tecnologia na região do ABC. Para tal precisam de informações sobre os profissionais que residem na área, para averiguar se é viável abrir um escritório na região. Com base na análise desses dados, as seguintes perguntas são respondidas:

  • Qual é a faixa salarial dos profissionais?
  • Qual é o tamanho da empresa que os profissionais trabalham?
  • Qual é o tempo que os profissionais gastam no deslocamento para o trabalho?
  • Qual é o nível de formação dos profissionais?
  • Qual é a previsão de formação dos profissionais?
  • Qual é o estado civil dos profissionais?
  • Qual é o sexo dos profissionais?
  • Qual é o número de profissionais que exercem dupla jornada?
  • O profissional tem disponibilidade para viagens a trabalho?

Objetivos

  • Verificar o perfil do profissional de tecnologia residente no ABC;
  • Verficar a existência de profissionais qualificados residentes na região;
  • Verificar as condições de trabalho (salário, distância do trabalho atual, situação de moradia) destes profissionais.

Campos selecionados e justificativas (Macro)

  • Dados residenciais
  • Idade
  • Informações acadêmicas
  • Informações trabalhistas
    • Salário
    • Área de atuação
    • Local de trabalho
    • Tempo de deslocamento entre casa e trabalho

Campos de acordo com o documento do censo

  • UNIDADE DA FEDERAÇÃO
  • CÓDIGO DO MUNICÍPIO
  • REGIÃO GEOGRÁFICA
  • CÓDIGO DA MESORREGIÃO
  • CÓDIGO DA MICRORREGIÃO
  • CÓDIGO DA REGIÃO METROPOLITANA
  • SITUAÇÃO DO DOMICÍLIO
  • SEXO
  • VARIÁVEL AUXILIAR DA IDADE CALCULADA (ANOS E MESES)
  • TEMPO DE MORADIA NA UF
  • TEMPO DE MORADIA NO MUNICÍPIO
  • UF DE RESIDÊNCIA ANTERIOR
  • MUNICÍPIO DE RESIDÊNCIA ANTERIOR
  • CURSO QUE FREQUENTA
  • SÉRIE / ANO QUE FREQUENTA
  • SÉRIE QUE FREQUENTA
  • CONCLUSÃO DE OUTRO CURSO SUPERIOR DE GRADUAÇÃO
  • CURSO MAIS ELEVADO QUE FREQUENTOU
  • CONCLUSÃO DESTE CURSO
  • ESPÉCIE DO CURSO MAIS ELEVADO CONCLUÍDO
  • NÍVEL DE INSTRUÇÃO
  • CURSO SUPERIOR DE GRADUAÇÃO
  • CURSO DE MESTRADO
  • CURSO DE DOUTORADO
  • MUNICÍPIO E UNIDADE DA FEDERAÇÃO OU PAÍS ESTRANGEIRO QUE FREQUENTAVA ESCOLA (OU CRECHE)
  • UF QUE FREQUENTAVA ESCOLA (OU CRECHE)
  • MUNICÍPIO QUE FREQUENTAVA ESCOLA (OU CRECHE)
  • PAÍS ESTRANGEIRO QUE FREQUENTAVA ESCOLA (OU CRECHE)
  • VIVE EM COMPANHIA DE CÔNJUGE OU COMPANHEIRO(A)
  • NATUREZA DA UNIÃO
  • ESTADO CIVIL
  • QUANTOS TRABALHOS TINHA
  • OCUPAÇÃO
  • ATIVIDADE
  • NESSE TRABALHO ERA
  • QUANTAS PESSOAS EMPREGAVA NESSE TRABALHO
  • NO TRABALHO PRINCIPAL, QUAL ERA O RENDIMENTO BRUTO (OU A RETIRADA) MENSAL QUE GANHAVA HABITUALMENTE * EM JULHO DE 2010
  • VALOR DO RENDIMENTO BRUTO (OU A RETIRADA) MENSAL NO TRABALHO PRINCIPAL
  • RENDIMENTO NO TRABALHO PRINCIPAL
  • VALOR DO RENDIMENTO BRUTO (OU A RETIRADA) MENSAL NOS DEMAIS TRABALHOS (EM REAIS)
  • RENDIMENTO EM TODOS OS TRABALHOS
  • RENDIMENTO EM TODOS OS TRABALHOS EM Nº DE SALÁRIOS MÍNIMOS
  • EM QUE MUNICÍPIO E UNIDADE DA FEDERAÇÃO OU PAÍS ESTRANGEIRO TRABALHA
  • EM QUE UNIDADE DA FEDERAÇÃO TRABALHAVA
  • EM QUE MUNICÍPIO TRABALHAVA
  • EM QUE PAÍS ESTRANGEIRO TRABALHAVA
  • RETORNA DO TRABALHO PARA CASA DIARIAMENTE
  • QUAL É O TEMPO HABITUAL GASTO DE DESLOCAMENTO DE SUA CASA ATÉ O TRABALHO

Tabelas auxiliares utilizadas

  • Cursos Doutorado_Estrutura 2010.xls;
  • Cursos Mestrado_Estrutura 2010.xls;
  • Cursos Superiores_Estrutura 2010.xls;
  • Estrutura atividade CD2000.xls;
  • Ocupação COD 2010.xls;
  • Unidades da Federação, Mesorregiões, microrregiões e municípios 2010.xls.

Desenvolvimento

Staging Area

Foi utilizado a ferramenta de ETL da Microsoft (SSDT) para a construção da Staging Area.

Dados da tabela de informações pessoais:

alt text

Lista de tabelas da Staging Area:

alt text

ETL

Os pacotes de importação foram divididos em:

  • Importar Dados Pessoais;
  • Importar Regiões;
  • Importar Cursos Superiores;
  • Importar Cursos de Doutorado;
  • Importar Cursos de Mestrado;
  • Importar Ocupação;
  • Importar Atividades.

Pacotes ETL:

alt text

Pacote "Importar Dados Pessoais":

alt text

Todas as linhas são exportadas no passo "Amostra Censo 2010" e as colunas são geradas no "Derived Column". Depois, é feito o pareamento e envio dos dados para o banco de dados no último passo.

Demais pacotes de importação:

alt text