intro-r
es un curso de introductorio al lenguaje de programación R que
incluye manipulación y visualización de datos.
R
es un lenguaje de programación específico para análisis,
manipulación y visualización de datos.
Incluye de serie una potente y completa variedad de funciones estadísticas, y dispone de más de 15.000 paquetes adicionales que resuelven problemas de diversa índole (ej. psicometría, econometría, machine learning, series temporales, bioinformática…).
R
es código abierto y de uso gratuito. Se encuentra
disponible para una amplia variedad de
plataformas UNIX, para Windows y MacOS.
R
tiene como percursor el lenguaje de programación S
que fue creado
por el estadístico John
Chambers en 1976
dentro de los míticos Bell Labs.
Chambers recibe en 1998 el prestigioso premio ACM Sotfware System Award por el desarrollo de sistemas software de reconocida y duradera influencia.
R
fue creado por Ross Ihaka
y Robert
Gentleman,
profesores de estadística de la Universidad Auckland, New Zealand en
1992.
Figuras relevantes que están contribuyendo significativamente al desarrollo y expansión del lenguaje son: Hadley Wickham, Yihui Xie, y Kirill Müller entre otros.
R aporta a un proyecto de análisis de datos tres características fundamentales: replicabilidad, amplitud, y libertad.
Otros lenguajes de programación estadística son SAS, SPSS, ó Stata. Todos ellos son distribuidos por distintas empresas bajo licencia comercial.
R
es un lenguaje consolidado con de 20 años de historia que sigue
creciendo su uso exponencialmente.
Fuente: imagen creada por usando un script de Gergely Daróczi
En el mundo académico se está convirtiendo en un estándar de-facto para la realización de análisis estadísticos, visualización y difusión de resultados que está desbancando a SPSS.
Fuente: The Popularity of Data Science Software en r4stats.com
En la industria, la tendencia es que R
le ha ido ganando terreno a SAS
llegándole a superar en popularidad. La siguiente gráfica extraida de
r4stats muestra la evolución de la demanda del
empleo para ambos lenguajes.
Fuente: The Popularity of Data Science Software en r4stats.com
Actualmente R
se encuentra las primeras posiciones de las listas más
importantes sobre lenguajes de programación, con el añadido de ser un
lenguaje de nicho (ej. séptima posición en el The 2018 Top Programming
Languages
de IEEE Spectrum).
La siguiente gráfica compara número de proyectos en github, el repositorio de software libre más popular, y popularidad en stackoverflow, el portal más importante de preguntas-respuestas sobre lenguajes de programación.
Fuente: The RedMonk Programming Language Rankings: June 2018 en https://redmonk.com
Grandes compañías como Microsoft han apostado fuerte por R
. Microsoft
mantiene su propia versión del intérprete del lenguaje Microsoft Open
R, y su propio repositorio de
paquetes basado en CRAN.
IBM también integra R
en sus productos orientados a ciencia de datos
como IBM Data Science Experience.
R
es un lenguaje popular en las ramas de estadística, bioinformática,
y ciencias sociales, así como entre la comunidad de científicos de datos
donde comparte espacio con Python.
- Preparacion: instalación y configuración del entorno (html)
- https://www.r-project.org/: página oficial del lenguaje.
- https://cran.rediris.es/: repositorio de paquetes en España.
- https://www.rdocumentation.org/: página con la documentación de los paquetes.
- https://github.com/trending/r?since=monthly: paquetes de
R
más populares en github. - http://r-bloggers.com: portal más importante sobre noticias y
tutoriales de
R
- https://stackoverflow.com/questions/tagged/r: preguntas y
respuestas sobre
R
en stackoverflow - https://twitter.com/search?q=%23rstats: tuits con el hashtag #rstats
- R for Beginners tutorial para principiantes elaborado por Emmanuel Paradis.
- An Introduction to R manual creado por el R development core Team.
- R in Action libro del autor del port Quick-R.
- The R
Book:
todo sobre
R
. - R for Data Science referencia básica por
el mayor experto actual en
R
. - An Introduction to Statistical
Learning:
libro fundamental par introducirse al machine learning con
R
.
- R Studio
Cheatsheets:
resúmenes con comandos básicos de distintas funcionales y
herramientas que usan
R
. - Quick-R: portal con ejemplos y tutoriales sencillos.
- R Programming en Coursera.
- Introduction to R for Data Science en Edx por Microsoft.
- Introduction to R en Datacamp.
El
material de este repositorio se licencia bajo
Creative
Commons Attribution 4.0 International License.