/datos-de-miercoles

Primo latinoamericano de #tidytuesday

Primary LanguageHTMLOtherNOASSERTION

Datos de miércoles

Un proyecto semanal de datos en R

Datos de miércoles es el primo latinoamericano de #tidytuesday, un proyecto semanal de datos organizado por la comunidad de R, que busca que sus participantes desarrollen sus habilidades procesando datos para crear gráficos significativos usando ggplot2, tidyr, dplyr y otras herramientas del tidyverse. El proyecto original surgió en el marco de la comunidad de aprendizaje online R4DS y desde abril de 2019 la comunidad sudamericana de R impulsa una versión local en español.


Únete a la comunidad hispanoamericana de R y participa en #DatosDeMiercoles. Cada semana publicaremos un conjunto de datos para explorar. Como los datos no necesariamente estarán listos para el análisis, será necesario que apliques estrategias como las propuestas en el libro "R para Ciencia de Datos" para lograr ordenarlos. El objetivo de Datos de miércoles es aplicar tus habilidades en un desafío concreto, recibir retroalimentación, explorar el trabajo de otras personas y conectarte con la comunidad hispanohablante de R. Se trata de generar un espacio de diálogo seguro y amable para practicar tus habilidades procesando y visualizando datos, independiente de tu nivel de manejo de R.

Cómo participar

  • Cada miércoles en la mañana publicaremos un set de datos y, de ser posible, incluiremos un enlace a algún artículo en español para darles contexto.
  • Los cargaremos en la carpeta datos en formato .csv y/o .xlsx y anunciaremos que están disponibles desde la cuenta de R4DS en español en Twitter. Más abajo encontrarás un enlace directo a la carpeta de cada semana.
  • Dentro de la carpeta encontrarás un archivo readme con una descripción del dataset y las variables que lo componen. También incluiremos el código para importar directamente los datos a R.
  • ¡Pon en práctica tus habilidades procesando y visualizando datos! ¿Cómo? Puedes elegir algún aspecto que explorar y proponer una visualización. Piensa en alguna pregunta que sería interesante responder y explora las posibilidades que entrega R para visualizar tus resultados.
  • ¡Comparte lo que hiciste! Incluye una imagen de la visualización que creaste y una copia del código utilizado para crearla. Incluye comentarios en tu código cuando sea posible para que el resto de la comunidad entienda tu proceso. En la sección "enlaces útiles" encontrarás sugerencias sobre cómo compartir una imagen del código y cómo exportar tus visualizaciones desde R.
  • Usa el hashtag #DatosDeMiercoles en Twitter para compartir tu trabajo. Si te alcanzan los caracteres, agrega el de la comunidad de R en español: #rstatsES.
  • Retuitearemos las contribuciones desde la cuenta de R4DS en español.
  • Dale crédito a la fuente original, cuando sea posible.
  • Si quieres ver ejemplos, puedes explorar en Twitter lo que otras personas han hecho para la versión en inglés del proyecto buscando el hashtag #TidyTuesday.

Cosas a considerar

Todas las personas son bienvenidas para participar, independiente de si recién están empezando a usar R o ya tienen más experiencia. Ten en cuenta lo siguiente:

  • Esta comunidad tiene un código de conducta, que puedes leer más abajo. Para participar es necesario que adhieras a lo que en él se señala.
  • Los datos provienen de la fuente que se indica en cada ocasión. En caso de que los hayamos editado de algún modo (por ejemplo, traduciéndolos al español), lo indicaremos. Nuestro objetivo al seleccionarlos es que puedas poner en práctica tus habilidades para procesar y visualizar datos.
  • Los datos son lo que son. Eres libre de explorar el tema más allá del set de datos de la semana, pero ten en cuenta que el objetivo de "Datos de miércoles" es usarlos como ejemplo para practicar tus habilidades.
  • En caso de que incluyamos un artículo o gráfico de ejemplo para darles contexto, el objetivo no es criticarlos. Tampoco a las personas que trabajaron en ellos. El objetivo es aprender y mejorar tus habilidades en R.
  • La idea no es criticar o destruir el trabajo de las personas de la comunidad de #rstatsES que participan. Sé amable y alienta el trabajo del resto. Dale un "like" a sus publicaciones y ayúdanos a promover la comunidad de R en español.

Código de conducta

Datos de miércoles es una comunidad libre de acoso y hostigamiento, independiente del sexo, identidad, género, edad, orientación sexual, discapacidad, apariencia física, tamaño corporal, etnia, religión (o la falta de ella), ideología, nacionalidad, variante lingüística u opciones tecnológicas. No se tolerará el acoso ni el hostigamiento en ninguna de sus formas. Quienes incurran en este tipo de conductas serán marginados de la comunidad. El lenguaje sexual y las imágenes de ese tipo no son apropiados en ningún espacio de este proyecto.


Propuesta de datos

¿Quieres proponer un conjunto de datos para utilizar en el proyecto? Abre un Issue y comparte en él el enlace a la fuente de los datos. Así podemos revisarlo y analizar si lo incluimos en un próximo #DatosDeMiercoles.


Datos

Semana Fecha Datos Fuente Artículo/visualización relacionada
1 2019-04-10 Copas Mundiales de fútbol masculino OpenFootball Visualizaciones Rusia 2018
2 2019-04-17 Juego de Tronos varias Tiempo en pantalla personajes
3 2019-04-24 Gapminder (en español) paquete datos Charla TED de Hans Rosling
4 2019-05-01 Comercio mundial Open Trade Statistics Artículo El País
5 2019-05-08 Datos parlamentarios Unión Interparlamentaria Aplicación Shiny: mujeres en el parlamento (2000 - 2018)
6 2019-05-15 Ranking musicales Rspotify Mapa Spotify
7 2019-05-22 Datos de la OMS sobre tuberculosis paquete datos Visualizaciones de "Our World in Data"
8 2019-05-29 Terremotos USGS Mapbox
9 2019-06-05 Datos de Airbnb de Latinoamérica Inside Airbnb ¿Dónde están los Airbnb's en CDMX?
10 2019-06-12 Datos sobre vinos Kaggle TidyTuesday
11 2019-06-19 Datos sobre legislación orientación sexual ILGA Mapas legislación sobre orientación sexual
12 2019-06-26 Datos sobre eventos de RLadies paquete meetupr Aplicación Shiny: capítulos de RLadies
13 2019-07-03 Datos sobre R y paquetes en CRAN CRAN y el paquete cranlogs Análisis evolución de paquetes en CRAN
14 2019-07-10 Datos sobre Pokémon Kaggle y PokémonDB Grafos sobre Pokémon
15 2019-07-17 Datos sobre Copas Mundiales de Fútbol Femenino data.world Tidy Tuesday
16 2019-07-24 Datos sobre Google Play Store Kaggle Análisis datos de Google Play Store
17 2019-07-31 Subtítulos de "La Casa de Papel" My Subs Análisis subtítulos Rick & Morty
18 2019-08-07 Reporte de Felicidad Mundial World Happiness Report 2019 Mapas Puntaje de Felicidad
19 2019-08-14 Índice de Libertad Humana The Human Freedom Index Libertad Humana en el mundo
20 2019-08-21 Emisiones de CO2 Banco mundial Make over Monday
21 2019-08-28 Bicis de Buenos Aires API pública de transporte Cuántas bicis hay
22 2019-09-04 Programas presidenciales Sitios web partidos políticos Visualizaciones de discursos políticos
23 2019-09-11 Incendios en el Amazonas FIRMS, NASA Visualizaciones incendios
24 2019-09-18 Pre LatinR -- --
25 2019-09-25 LatinR -- --
26 2019-10-02 Twitter LatinR 2019 Twitter TuQmano Blog TuQmano
27 2019-10-09 Datos meteorológicos Claris LPB Visualizaciones de temperaturas
28 2019-10-16 Datos empleo y género Banco Mundial Visualizaciones sobre (des)empleo femenino
29 & 30 2019-10-23 Datos Constitución Abierta Chile constitucionabierta.cl
31-34 noviembre Desafío de 30 días de mapas #30DayMapChallenge #30DayMapChallenge
35 2019-12-04 Datos canasta gestión menstrual menstruscrapper Análisis de Natsumi Shokida
36 2019-12-11 Día de los Derechos Humanos Paquetes presentes y pinochet Documentación 📦 presentes y Documentación 📦pinochet
-- [pausa de verano] --- --- ---
37 2020-02-12 Casos Nuevo Coronavirus Universidad John Hopkins Dashboard Coronavirus John Hopkins / Shiny app John Coene / Mapa interactivo de Google
38 2020-02-19 Ranking películas IMDB Kaggle Visualizaciones sobre cine

Enlaces útiles

Enlace Descripción
🔗 El libro "R for Data Science" en inglés
🔗 Traducción al español de "R for Data Science"
🔗 Carbon: herramienta para compartir imágenes de tu código (en inglés)
🔗 Cómo guardar imágenes de ggplot2 en alta resolución (en inglés)