/imersao-pandas

Primary LanguageJupyter Notebook

Imersão de Pandas

Seja bem vindo ao Téo Me Why, um canal na Twitch e YouTube destinado a ajudar todos aqueles que desejam aprender um pouco mais sobre a vida de um cientista de dados. Nossa missão é levar conteúdo relevante, apresentando a realidade e os desafios enfrentados por um profissional desta área.

Importante: Não vendemos absolutamente nada em nossas transmissões, bem como temos todo o conteúdo livre e disponível em nossos canais. Somos orientados a disseminar conhecimento, possibilitanto que o maior número de pessoas possam acessá-lo e aprender com ele. Sinta-se livre para compartilhar e divulgar este material de forma gratuíta, mas ressaltamos a proibição da comercialização deste material, sob a licença Creative Commons BY-NC-SA 3.0 BR.

Público alvo

Todos aqueles que são iniciantes na linguagem Python, bem como no mundo de Data Science e Análise de Dados serão bem vindos à nossa imersão. Basta comparecer durante a transmissão, a parada é grátis e é ao vivo.

Aviso: A live não ficará gravada!!! Para aqueles que são Subs Twitch, a gravação da live está disponível em nosso histórico, pode conferir.

Regras:

  • Ser gentil
  • Ter paciência com os inciantes
  • Não somos tolerantes com intolerantes, o ban vem na hora!

Local e horário

Nossa live acontecerá na twitch no dia 30/01 ás 9:00 da manhã.

Horário Programação
8:30 Portões abertos
9:00 Início do curso
12:00 Almoço
13:00 Retomada
17:00 Encerramento

Conteúdo

Vamos navegar por funcionalidade que utilizamos no dia a dia em trabalho que envolvem análise e manipulação de dados. Fazemos questão de apresentar os conceitos básicos e evoluir para assuntos mais sofisticados, como joins e group-by.

Tópicos

  • Revisão Turbo de Python

  • Comandos básicos

    • Importação da biblioteca
    • O que são Series e Dataframes?
    • Criando o primeiro dataframe
    • Leitura de arquivos
    • Operações básicas de DataFrame
  • Utilitários

  • Navegação pelo DataFrame

  • Filtros

    • Comparações lógicas de ==, >, >=, <, <=, !=
    • isna()
    • isin()
  • Renomeando Colunas

  • Transformações, conversões e remoções

    • Operações com escalares
    • Operações entre colunas
    • apply()
    • funções anônimas
  • Stack e Unstack

    • Empilhando e desempilhando dados
  • Group by & Sort by

    • Operações Estatísticas: sum, mean, count, std...
    • Agrupando por chave
  • Joins

    • merge com left, right, inner, etc.
    • 'on' como chave
  • Integração com banco de dados SQL

    • Enviando query para o banco
    • Consumindo tabela do banco
    • Enviando dados para o banco

Dados

Os dados que utilizaremos serão referentes à eleiçòes brasileiras entre os anos de 2014 e 2018. Realizamos alguns ajustes para trabalhar com estes dados provenientes do BrasilIO, e você pode obtê-los aqui.