/tutorial-dplyr-es

Tutorial en espñol para aprender a usar dplyr (R) pero tambien github y como organisar datos (tidy)

Primary LanguageRGNU General Public License v2.0GPL-2.0

tutorial-dplyr-es

objetivo

tutorial-dplyr-es es un tutorial en español para:

  • aprender a usar dplyr (paquete R)
  • entender los verbos y los "pipes" (tubos)
  • comparar la velocidad con otros metodos

En apendice el lector encontrará como fueron creado los datos.

Programa

0. Entender como funcionan dplyr y las data.tables

Como lo presenta su autor, Hadley Wickham, dplyr es la nueva iteración del paquete plyr, enfocado a las data.frames, con 3 objectivos:

  • identificar cual son las manipulaciones más importantes para analisar datos y hacerlas faciles con R.

  • escribir las partes-llaves en C++ para manipular los datos en memoria muy rapidamente.

  • usar las misma interace para trabajar donde sea los datos: data frame, data table o database.

1. Pillar y organisar los datos

Los datos que serviran de base al tutorial son los famosos gastos de la tarjetas black de Caja Madrid.

2. Analisar los datos gracias a dplyr

  • Uso de dplyr para analisar los gastos.
  • Uso de ggplot2 para graficar las estatisticas

Nota

Formato

  • .Rmd: algunos programas estaran escrito por comandos de R encapsulados dentro de un texto Markdown. Rstudio propone una muy buena interface para ejecutar/editar esto archivo.
  • .R simple escripte R

Estilo

Se usa cuando posible el estilo recomendado por Hadley Wickham.