/python-cienciadados

Repositório com códigos do ecossistema Python para fundamentos de programação na área de Ciência de Dados

Primary LanguagePythonGNU General Public License v3.0GPL-3.0

Ecossistema Python para Ciência de Dados

  • Repositório com códigos do ecossistema Python para fundamentos de programação na área de Ciência de Dados

  • Python focado em Ciência de Dados e Mineração de Dados, com duração de 6 encontros:

Autores: Alexandre Zamberlan, Bernardo Viero, Sylvio A. G. Vieira e Robertson Ebling dos Santos

Encontro 1: Introdução ao Python e Ambiente de Desenvolvimento

  • Apresentação da disciplina e seus objetivos.
  • Breve introdução à linguagem Python: história, características e aplicabilidade.
  • Configuração do ambiente de desenvolvimento (instalação do Python, Google Colab e pacotes necessários para ciência de dados).
  • Primeiros passos: interação com o interpretador Python, operadores básicos, variáveis e tipos de dados.
  • Exercícios práticos para aplicação dos conceitos aprendidos.

Encontro 2: Estruturas de Controle e Funções em Python

  • Estruturas de controle: condicionais (if, else, elif) e loops (for, while).
  • Funções em Python: definição, parâmetros, retorno de valores e escopo.
  • Boas práticas de programação e legibilidade de código.
  • Exercícios práticos para aplicação das estruturas de controle e funções.

Encontro 3: Manipulação de Dados com Bibliotecas Básicas

  • Introdução à manipulação de dados com Python usando bibliotecas básicas como NumPy e Pandas.
  • Trabalhando com arrays NumPy: criação, indexação, slicing e operações básicas.
  • Introdução aos DataFrames do Pandas: estrutura, leitura e escrita de dados, manipulação de índices e seleção de dados.
  • Exercícios práticos para manipulação de dados com NumPy e Pandas.

Encontro 4: Visualização de Dados com Matplotlib e Seaborn

  • Introdução à visualização de dados com Python usando as bibliotecas Matplotlib e Seaborn.
  • Construção de gráficos básicos com Matplotlib: scatter plots, line plots, bar plots e histogramas.
  • Aprimoramento da visualização com Seaborn: box plots, heatmaps e pair plots.
  • Práticas de formatação e customização de gráficos.
  • Exercícios práticos para criação e personalização de visualizações de dados.

Encontro 5: Introdução à Análise de Dados e Estatística Descritiva

  • Fundamentos de análise de dados e estatística descritiva.
  • Exploração de dados: medidas de tendência central, dispersão e correlação.
  • Utilização de funções estatísticas do Pandas para análise descritiva.
  • Exercícios práticos para aplicação de conceitos de análise de dados e estatística descritiva.

Encontro 6: Introdução à Mineração de Dados e Conclusão

  • Conceitos básicos de mineração de dados e sua importância.
  • Apresentação de técnicas simples de mineração de dados, como classificação e clustering.
  • Aplicação prática de técnicas de mineração de dados em conjunto de dados reais.
  • Revisão dos tópicos abordados ao longo da disciplina.
  • Discussão sobre os próximos passos na jornada de aprendizado em Python para ciência de dados.
  • Considerações finais e encerramento da disciplina.

Este plano de aula é projetado para introduzir os alunos ao Python e ao ecossistema de ciência de dados de forma gradual e prática, permitindo-lhes adquirir habilidades essenciais para projetar e construir sistemas para mineração de dados. Cada encontro aborda tópicos específicos e inclui exercícios práticos para reforçar o aprendizado teórico.