tutorial-dplyr-es
es un tutorial en español para:
- aprender a usar dplyr (paquete R)
- entender los verbos y los "pipes" (tubos)
- comparar la velocidad con otros metodos
En apendice el lector encontrará como fueron creado los datos.
Como lo presenta su autor, Hadley Wickham, dplyr es la nueva iteración del paquete plyr, enfocado a las data.frames, con 3 objectivos:
-
identificar cual son las manipulaciones más importantes para analisar datos y hacerlas faciles con R.
-
escribir las partes-llaves en C++ para manipular los datos en memoria muy rapidamente.
-
usar las misma interace para trabajar donde sea los datos: data frame, data table o database.
Los datos que serviran de base al tutorial son los famosos gastos de la tarjetas black de Caja Madrid.
- Uso de dplyr para analisar los gastos.
- Uso de ggplot2 para graficar las estatisticas
- .Rmd: algunos programas estaran escrito por comandos de R encapsulados dentro de un texto Markdown. Rstudio propone una muy buena interface para ejecutar/editar esto archivo.
- .R simple escripte R
Se usa cuando posible el estilo recomendado por Hadley Wickham.