Workshop Para mineria de texto

pre requisitos.

  1. Instalar R y Rstudio. (recomendamos este tutorial de Rladies)
  2. Instalar los siguientes paquetes:
install.packages('tidyverse')
install.packages('tm')
install.packages('rtweet')
install.packages('wordcloud2')
install.packages('topicmodels')
install.packages('LDAvis')
install.packages('tsne')
install.packages('devtools')
install.packages('jsonlite')
devtools::install_github("VerbalExpressions/RVerbalExpressions")
  1. Tener cuenta de twitter, y de twitter developer (se aplica desde acá). Como aplicar a una cuenta de developer de twitter no es trivial, y no siempre se conceden los permisos, se puede venir sin este requisito, aunque es necesario para replicar los procesamientos en otros proyectos.

  2. Es aconsejable tener una base de R y R studio para poder seguir mejor el desarrollo del curso. En caso de no tener experiencia previa en R se recomienda estas notas introductorias de Laura Ación y Riva Quiroga

  3. Descargar los materiales del curso:

usethis::use_course('https://github.com/DiegoKoz/workshop_text_mining/archive/master.zip')

Materiales:

Temario:

  • Introducción
  • Análisis de texto en Ciencias Sociales
  • Bag of Words
  • Normalización
    • Caracteres especiales.
  • Distancia de palabras
  • Distancia de caracteres
  • Distancia Conceptual
  • Distancia de Documentos
    • Similitud Coseno
  • Topic Modelling
  • Implementaciones en R:
    • rtweet
    • tm
    • RVerbalExpressions
    • wordcloud2
    • LDAvis
    • tsne