Este repositório contém os notebooks e as consultas (queries) de uma análise de dados realizada sobre uma base de dados de venda de produtos. A base de dados é composta por quatro tabelas, a saber: vendas, clientes, produtos e lojas. A figura abaixo mostra as tabelas e os relacionamentos entre estas na base de dados:
Através de consultas, que podem ser realizadas tanto por SQL (Structured Query Language) quanto pela biblioteca Pandas, do Python, são respondidas cinco perguntas sobre a base de dados, que são:
- Qual a quantidade de produtos únicos que foram vendidos?
- Quais os três produtos mais vendidos e as quantidades destes?
- Quais as quantidades mensais vendidas do produto camisa de tamanho G no ano de 2019?
- Qual a média da receita líquida mensal de vendas no ano de 2019?
- Qual loja teve a maior receita líquida de vendas no ano de 2019?
As consultas que respondem as perguntas em SQL (SQLite, especificamente) se encontram no diretório queries, já as consultas com o Pandas se encontram no notebook queries-pandas. Além destes, o notebook queries-sqlite3 apresenta as consultas executadas diretamente no Python, através da biblioteca SQLite3.
Links úteis:
- Blog post sobre SQL x Pandas: Medium.