Este repositório tem como objetivo servir de ponto de partida para quem quer aprender um pouco de Python para auxiliar nas tarefas de análise, visualização e tratamento de grandes volumes de dados. Um bom caso de estudo é o cadastro de IPTU da cidade de São Paulo, disponível para download no site do GeoSampa, e dessa forma vamos utiliza-lo como exemplo fazendo anãlises, consultas e visualizações.
Para acompanhar esse tutorial, é necessário ter um ambiente de trabalho com Python e algumas bibliotecas de gratuitas, distribuídas de forma livre e com código aberto.
Este tutorial deve iniciar um ciclo de tutoriais utilizando os dados de GeoInfo como ensejo para disseminar o conhecimento e uso de linguagens e técnicas de programação.
Serão abordados nesse primeiro tutorial:
- Vantagens de conhecer e utilizar linguagem de programação para processamento de dados
- A linguagem de programação Python e como configurar um ambiente de trabalho mínimo
- Variáveis e lista, atribuindo e organizando a memória
- Acessando o conjunto de dados do IPTU 2020 de São Paulo
- Visualizando os dados de IPTU
- Consultando os dados de IPTU
- Agrupando os dados de IPTU
- Gerando gráficos, estatístas, correlações e análises básicas
- Processamento básico de informações de IPTU
- Exportando dados
- Próximos passos