Descrição do desafio módulo 3 – Processamento de Dados Simplificado com Power BI
- Feito a criação do mesmo.
- Criado e inserido os dados.
- Feita a integração.
-
Verifique os cabeçalhos e tipos de dados
- Feito.
-
Modifique os valores monetários para o tipo double preciso
- Feito.
-
Verifique a existência dos nulos e analise a remoção
- Feito.
-
Os employees com nulos em
Super_ssn
podem ser os gerentes. Verifique se há algum colaborador sem gerente- Feito.
-
Verifique se há algum departamento sem gerente
- Feito.
-
Se houver departamento sem gerente, suponha que você possui os dados e preencha as lacunas
- Ok.
-
Verifique o número de horas dos projetos
- Ok.
-
Separar colunas complexas
- Ok.
-
Mesclar consultas
employee
edepartment
para criar uma tabelaemployee
com o nome dos departamentos associados aos colaboradores. A mescla terá como base a tabelaemployee
. Fique atento, essa informação influencia no tipo de junção- Ok.
-
Neste processo elimine as colunas desnecessárias
- Ok.
-
Realize a junção dos colaboradores e respectivos nomes dos gerentes. Isso pode ser feito com consulta SQL ou pela mescla de tabelas com Power BI. Caso utilize SQL, especifique no README a query utilizada no processo
SELECT e.Fname, e.Lname, e.Ssn, e.Super_ssn, (SELECT CONCAT(supervisor.Fname, ' ', supervisor.Lname) FROM azure_company.employee AS supervisor WHERE supervisor.Ssn = e.Super_ssn ) AS Supervisor_Name FROM azure_company.employee AS e;
-
Mescle as colunas de Nome e Sobrenome para ter apenas uma coluna definindo os nomes dos colaboradores
- Ok.
-
Mescle os nomes de departamentos e localização. Isso fará com que cada combinação departamento-local seja única. Isso irá auxiliar na criação do modelo estrela em um módulo futuro
- Ok.
-
Explique por que, neste caso supracitado, podemos apenas utilizar o mesclar e não o atribuir
Neste caso, não queremos adicionar ou modificar o conteúdo de uma coluna existente ou nova. Estamos apenas combinando dados de duas ou mais colunas em uma única coluna. Isso não altera o número de linhas na tabela. Como a intenção é consolidar informações para simplificar a análise e visualização dos dados, utilizamos o processo de mesclar.
-
Agrupe os dados a fim de saber quantos colaboradores existem por gerente
SELECT (SELECT CONCAT(supervisor.Fname, ' ', supervisor.Lname) FROM azure_company.employee AS supervisor WHERE supervisor.Ssn = e.Super_ssn ) AS Supervisor_Name, COUNT(e.Fname) AS Quantidade FROM azure_company.employee AS e GROUP BY Supervisor_Name;
-
Elimine as colunas desnecessárias, que não serão usadas no relatório, de cada tabela
- Ok.