/mq_2018_WebScraping

MQ-UFMG 2017 - Captura, sistematização e análise de dados da web com R

Primary LanguageR

MQ-UFMG 2018 - Web Scraping: Captura e análise de dados da web com R

Informações Básicas

Professores:

  • Denisson Silva

  • Rogério Jerônimo Barbosa

Horário: 17h00 às 20h00

Data: 23 de Julho a 27 de Agosto de 2018

Elaboração de Materiais Didáticos e Tutoriais:

Leonardo Sangali Barone

Aulas

  • Dia 1 - 23/07/2018 - Coleta de tabelas. Introdução ao HTML
  • Dia 2 - 24/07/2018 - XML e XPath usando rvest. Selector Gadget e CSS. Coleta de notícias
  • Dia 3 - 25/07/2018 - Mineração de texto com R - uma introdução breve
  • Dia 4 - 26/07/2018 - Formulários (GET, POST), Sessions e Selenium.
  • Dia 5 - 27/07/2018 - APIs

Materiais deste Curso

Além desses tutoriais, produzimos scripts detalhados para cada aula. Eles estarão sempre organizados numa pasta do Google Drive, que disponibilizaremos no link http://tinyurl.com/mq2018Rweb

A cada dia, liberaremos os materiais das respectivas aulas -- sempre após o término da classe. Fazemos isso para estimular que você escreva cada código por si mesmo no seu computador, tentando compreender a linguagem e produzir seus próprios resultados. Acreditamos que um aprendizado efetivo depende da participação ativa do aluno na construção do conhecimento. E isso se faz, dentre outras coisas, por meio do registro pessoal do conteúdo das aulas, que envolverão, inclusive, erros e tropeços. Não use o scripts das aulas como expectador (ou como "cola"), rs...

Extras e materiais de apoio

R Básico

  • Se você não conhece muito da linguagem R, recomendamos que dê uma olhada nos materiais do curso ministrado por nós na semana anterior, aqui mesmo no MQ (o curso de introdução ao R). Ele está disponível aqui

Tutoriais produzidos por Leonardo Barone (R Básico e além!)

Recomendamos ainda os excelentes tutoriais produzidos por Leonardo Barone, nosso parceiro e amigo, também especialista na linguagem R:

  • Sobre data frames e vetores, clique aqui

  • Sobre as funcionalidades básicas do R, este tutorial

  • Sobre operadores relacionais e lógicos, cláusulas condicionais, loops e funções, clique aqui trata de .

  • Sobre abertura de dados no R, veja este tutorial

  • Para aprender sobre manipulação de dados com a gramática básica do R, leia este aqui

  • Finalmente, se quiser aprender sobre o pacote dplyr faça os sobre o básico do dplyr e bases de dados relacionais com dplyr

Livro: R for Data Science

Recomendamos fortemente que você dê uma olhada no livro R for Data Science. O livro está completamente disponível online e de forma gratuita.