/Data-visualization-Matplotlib

Conteúdo do 8º curso da formação Data Science, da Alura.

Primary LanguageJupyter Notebook

Data-visualization-Matplotlib

Badge em Desenvolvimento

Badge code size

🪧 Vitrine.Dev
✨ Nome Data Visualization: criação de gráficos com o Matplotlib
🏷️ Tecnologias python
🚀 URL Notebook no Kaggle
🔥 Desafio Conteúdo do curso

Sobre o curso 📚

Ainda no tópico Visualização de Dados, da formação Data Science, oferecido pela Alura, passamos o foco para aprender a criar gráficos e visualizações de dados com a biblioteca Matplotlib. Desta vez, o curso foi ministrado pelo Luis Meazzini e aprendi:

  • conceitos sobre o funcionamento de figuras e eixos,
  • a personalizar as visualizações com diferentes cores, estilos e anotações,
  • e criar visualizações para diversos tipos de dados, como séries temporais e dados categóricos.

Em resumo, sair da configuração padrão:

image

image

E desenvolver um gráfico que esteja mais alinhado com determinada situação/empresa:

image

image

Minha prática 👩🏻‍💻

Para praticar o que aprendi, utilizei dois datasets, ambos disponíveis no Kaggle. O primeiro é sobre registros climáticos de mais de 40 regiões da Austrália entre 2008 até 2017.

image

O primeiro gráfico que decidi plotar foi referente às temperaturas máximas de Sydney, usando apenas o .plot, definindo as datas no eixo x e as temperaturas no eixo y:

image

Aos poucos, aumentei a figura, adicionei um título, uma legenda aos eixos, alterei seus tamanhos, coloquei uma legenda para a variável que está sendo apresentada e mudei a cor do gráfico.

image

Nada de muito diferente, certo? Até que o instrutor começou a apresentar configurações que eu não tinha explorado ainda, por exemplo, alterar a espessura da linha ou substituí-la por pontos ao longo do gráfico.

image image image

Até o momento, o gráfico mostra todos os registros, de 2008 até 2017. Porém, podemos limitar sua visualização, ao determinar um período, com o parâmetro set_xlim. Neste caso, determinei que o gráfico estivesse focado nos registros de 01/01/2016 até 01/01/2017.

image

Da mesma forma, também aprendi a criar um novo eixo e apresentar informações adicionais. Por exemplo, no gráfico “principal” temos os registros de 2016 e no gráfico menor, vemos todos os registros.

image

Ou, podemos limitar os registros do gráfico principal com um mês, enquanto o segundo gráfico apresenta as informações do ano inteiro.

image

Uma outra configuração que achei interessante, foi apresentar linhas que indicam o maior e o menor valor dos dados, adicionando setas e texto apontando para estes pontos do gráfico.

image


O segundo dataset que utilizei foi referente ao consumo de energia elétrica em uma indústria de aço, com registros de janeiro de 2018 até dezembro de 2018.

image

Além das datas, este dataset tem uma coluna com os dias da semana. Então, plotei um gráfico apresentando a média de consumo de energia a cada dia da semana.

image

Alterei seu tamanho, atribuí uma cor para cada dia, adicionei título, legendas e uma linha em volta das barras.

image

Ainda sobre a média de consumo de energia, desta vez, fiz um gráfico de pizza.

image

Mantive as cores que foram usadas no gráfico de barras, acrescentei a porcentagem de cada dia da semana e destaquei os dois dias em que o consumo é maior.

image

No próximo passo, fiz um gráfico de dispersão entre o consumo de energia com a potência reativa.

image

Este dataset também possui uma coluna chamada Load_Type, em que os registros são divididos em: Carga Leve, Carga Média e Carga Máxima. Utilizei esta informação para diferenciar os pontos no gráfico, mudando sua cor e forma.

image

Também aprendi a configurar gráficos do tipo box-plot, saindo da configuração padrão:

image

Até uma que tivesse tamanho e cores personalizadas.

image

E finalizei com um histograma, saindo da configuração básica:

image

Até desenvolver um histograma que apresentasse informações mais específicas.

image

Conclusão 🏁

Eu gostei bastante de fazer este curso, pois ele me mostrou que, dependendo da análise e seu conteúdo, o matplotlib consegue resolver muita coisa e apresentar os dados de formas mais assertivas e personalizadas.


Muito obrigada por chegar até aqui e até a próxima 🤗

Ferramentas utilizadas 🧰

python pandas numpy matplotlib