/tutorial-iptu-pandas

Tutorial de acesso aos dados de IPTU do município de São Paulo por Pandas em Python

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

Tutorial - Acessando dados de IPTU com Python e Pandas

Este repositório tem como objetivo servir de ponto de partida para quem quer aprender um pouco de Python para auxiliar nas tarefas de análise, visualização e tratamento de grandes volumes de dados. Um bom caso de estudo é o cadastro de IPTU da cidade de São Paulo, disponível para download no site do GeoSampa, e dessa forma vamos utiliza-lo como exemplo fazendo anãlises, consultas e visualizações.

Para acompanhar esse tutorial, é necessário ter um ambiente de trabalho com Python e algumas bibliotecas de gratuitas, distribuídas de forma livre e com código aberto.

Este tutorial deve iniciar um ciclo de tutoriais utilizando os dados de GeoInfo como ensejo para disseminar o conhecimento e uso de linguagens e técnicas de programação.

Serão abordados nesse primeiro tutorial:

  • Vantagens de conhecer e utilizar linguagem de programação para processamento de dados
  • A linguagem de programação Python e como configurar um ambiente de trabalho mínimo
  • Variáveis e lista, atribuindo e organizando a memória
  • Acessando o conjunto de dados do IPTU 2020 de São Paulo
  • Visualizando os dados de IPTU
  • Consultando os dados de IPTU
  • Agrupando os dados de IPTU
  • Gerando gráficos, estatístas, correlações e análises básicas
  • Processamento básico de informações de IPTU
  • Exportando dados
  • Próximos passos