Leonardo S. Barone
De 14 a 18 de Maio de 2018, das 9h às 13h, no auditório do CEBRAP
O curso oferece uma introdução à captura de dados na Internet usando a linguagem R. Por meio de exercícios práticos, os participantes aprenderão estratégias de captura de páginas simples de internet, como páginas de Legislativos brasileiros e/ou de jornais com a finalidade de construir bases de dados úteis à pesquisa em ciências sociais. O curso contempla ainda uma rápida introdução ao uso de APIs de redes sociais [Twitter e Facebook] usando R. O requisito para participar do curso é ter tido exposição prévia à linguagem R ou realizar um tutorial de preparação antes do início das aulas.
Ter tido exposição prévia à linguagem R e ao ambiente de trabalho do RStudio.
- 14/05/2018 - O básico da captura de páginas com R - páginas com tabelas
- 15/05/2018 - O básico da captura de páginas com R - portais de notícias
- 16/05/2018- Tópicos de captura de dados - Formulários web, twitter, facebook e .pdf
- [17/05/2018] - Mineração de texto com R - uma introdução breve
- [18/05/2018] - Desafios de raspagem de dados
Tutorial 1 - Páginas com tabelas
Tutorial 2 - Introdução ao XPath
Tutorial 3 - Captura de notícias da Folha
Tutorial 4 - Captura de notícias do Data Folha
Tutorial 5 - Mineração de Texto - pacote stringr
Tutorial 6 - Mineração de Texto - pacote tm
Tutorial 7 - Mineração de Texto - pacote tidytext
Tutorial 8 - Formulários na web
Tutorial 9 - Twitter
Tutorial 10- PDF
Tutorial 11 - Facebook
- Grolemund, Garrett (2014). Hands-On Programming with R. Ed: O'Reilly Media. Não distribuído gratuitamente. Informações no site da editora aqui
- Wichkam, Hadley e Grolemund, Garrett (2016). R for Data Science. Ed: O'Reilly Media. Disponível gratuitamente Disponível gratuitamente aqui
- Wichkam, Hadley (2014). Advanced R. Ed: Chapman and Hall/CRC. Disponível gratuitamente Disponível gratuitamente aqui
- Gillespie, Colin e Lovelace, Robin (2016). Efficient R programming. Ed: O'Reilly Media. Disponível gratuitamente Disponível gratuitamente aqui