/Curso-R-FLACSO

Primary LanguageHTMLMIT LicenseMIT

Materiales de cursada

Docentes: Pablo Tiscornia - Guido Weksler - Diego Kozlowski - Natsumi Shokida.

Presentación

En los últimos años se han difundido muchas herramientas estadísticas novedosas para el análisis de información socioeconómica. En particular el software denominado "R", por tratarse de un software libre, se extiende cada vez más en diferentes disciplinas y recibe el aporte de investigadores e investigadoras en todo el mundo, multiplicando sistemáticamente sus capacidades.

Este programa se destaca, entre varias cosas, por su capacidad de trabajar con grandes volúmenes de información, utilizar múltiples bases de datos en simultáneo, generar reportes, realizar gráficos a nivel de publicación y por su comunidad de usuarios y usuarias que publican sus sintaxis y comparten sus problemas, hecho que potencia la capacidad de consulta y de crecimiento. A su vez, la expresividad del lenguaje permite diseñar funciones específicas que permiten optimizar de forma personalizada el trabajo cotidiano con R.


Objetivos del curso

El presente Taller tiene como objetivo principal introducirse en el aprendizaje del lenguaje de programación “R” aplicado procesamiento de la Encuesta Permanente de Hogares (EPH) - INDEC. Se apunta a brindar a los y las participantes herramientas prácticas para el procesamiento de datos haciendo énfasis en la producción y el análisis de estadísticas socioeconómicas en pos de abrir puertas para realizar investigaciones propias sobre diversas temáticas relacionadas al mercado de trabajo y las condiciones de vida de la población.

La Encuesta Permanente de Hogares será la base de datos de aplicación elegida para el curso, dado que representa un insumo fundamental para realizar estudios sobre el mercado de trabajo y las condiciones de vida de la población. Se hará una introducción a los lineamientos conceptuales principales de la encuesta, en pos de que los y las participantes puedan abordar con datos distintas problemáticas vinculadas al mercado de trabajo y las condiciones de vida de la población.


Programa

Clases y contenido

Clase 1 - Conceptos Principales de EPH:

  • Temas de clase:

    • Presentación del curso.
    • Presentación de la Encuesta Permanente de Hogares: Lineamientos conceptuales y metodología
    • Abordaje del marco teórico y analítico de la EPH y sus aplicaciones prácticas.
    • Síntesis del operativo de campo, cobertura y periodicidad de la Encuesta
    • Definiciones de las principales variables de interés a abordar en el curso: Condición de actividad, categoría ocupacional, precariedad y pobreza
    • Metodología usuaria de las Bases de microdatos. Utilización del Diseño de Registro.
  • Presentación


Clase 2 – Introduciendo a R:

  • Temas de clase:

    • Descripción del programa “R”. Lógica sintáctica del lenguaje y comandos básicos
    • Presentación de la plataforma RStudio para trabajar en “R”
    • Caracteres especiales en “R”
    • Operadores lógicos y aritméticos
    • Definición de Objetos: Valores, Vectores y DataFrames
    • Tipos de variable (numérica, de caracteres, lógicas)
    • Lectura y Escritura de Archivos
  • Presentación

  • Explicación

  • Práctica guiada

  • Práctica independiente


Clase 3 – Clase 3 - Tidyverse - Tasas basicas

  • Temas de clase:

    • Limpieza de Base de datos: Renombrar y recodificar variables, tratamiento de valores faltantes (missing values/ NA´s)
    • Seleccionar variables, ordenar y agrupar la base de datos para realizar cálculos
    • Creación de nuevas variables
    • Aplicar filtros sobre la base de datos
    • Construir medidas de resumen de la información
    • Tratamiento de variables numéricas (edad, ingresos, horas de trabajo, cantidad de hijos / componentes del hogar, entre otras).
    • Ejercicios prácticos para aplicar lo expuesto: Replicar Informe Técnico de Mercado de Trabajo (EPH-INDEC)
    • Cálculo de tasas básicas del mercado de trabajo (tasa de actividad, empleo, desempleo, entre otras)
    • Cálculo de tasas para distintos subconjuntos poblacionales (por aglomerado, sexo, grupos de edad)
  • Explicación

  • Práctica guiada

  • Práctica Independiente


Clase 4 - Tidyverse - Pobreza

  • Temas de clase:

    • Definición de la Canasta Básica Alimentaria y Canasta Básica Total
    • Metodología del cálculo de pobreza por línea (para personas y hogares)
    • Ejercicio de estimación de tasas de Pobreza e Indigencia
    • Ejercicio de estimación de tasas de Pobreza e Indigencia para subgrupos poblacionales (Género, Edad, Regiones)
  • Explicación

  • Práctica guiada

  • Práctica independiente


Clase 5 - Visualización de la información

  • Temas de clase:
    • Gráficos básicos de R (función “plot”): Comandos para la visualización ágil de la información
    • Gráficos elaborados en R (función “ggplot”):
      • Gráficos de línea, barras, Boxplots
      • Extensiones de ggplot

Clase 6: Documentación en R. Generación de reportes/informes.

  • Temas de clase:
    • Manejo de las extensiones del software “Rmarkdown” y “RNotebook” para elaborar documentos de trabajo, presentaciones interactivas e informes:
      • Opciones para mostrar u ocultar código en los reportes
      • Definición de tamaño, títulos y formato con el cual se despliegan los gráficos y tablas en el informe
      • Caracteres especiales para incluir múltiples recursos en el texto del informe: Links a páginas web, notas al pie, enumeraciones, cambios en el formato de letra (tamaño, negrita, cursiva)
      • Código embebido en el texto para automatización de reportes

Clase 7 -Strings

  • Temas de clase:
    • Acercamiento a técnicas de text mining:
      • Paquete stringr: Localización, substracción, y reemplazo de patrones en variables strings
      • Expresiones regulares
      • Corpus de texto, Normalización, Armado de DocumentTermMatrix y Nubes de Palabras

Clase 8: Programación Funcional:

  • Temas de clase:
    • Acercamiento a técnicas más sofisticadas en R, útiles para automatizar el procesamiento periódico de la información:
      • Estructuras de código condicionales
      • Loops
      • Creación de funciones a medida del usuario

Clase 9: Trabajos prácticos, repaso general y consultas

  • Se presentará a los/as alumnos/as problemas concretos vinculados a la EPH y en relación a las experiencias que se fueron volcando a lo largo de la cursada. Se deberán abordar mediante el uso de R, aplicando lo aprendido en los módulos anteriores. En conjunto se expondrán los desafíos que emergen en el momento y la evaluación de las herramientas adecuadas para su abordaje y resolución. Entre los temas giran aquellos vinculados a la distribución personal del ingreso/Construcción de percentiles de ingreso; el mercado laboral a través de la herramienta Panel de datos; la documentación en R (Estilo de Notas de Clase).
  • Espacio para consultas puntuales sobre los temas vistos durante el curso y presentación del trabajo final a entregar.

Clase "Yapa" - Regresión Lineal

  • Temas de clase:
    • Covarianza
    • Correlación
    • Regresión lineal simple
    • Regresión lineal múltiple
    • Ingeniería de variables
    • Transformaciones log-lineales

Librerias a instalar

install.packages(c("tidyverse","openxlsx",'ggplot2','ggthemes', 'ggrepel','ggalt','kableExtra','GGally','ggridges','fs','purrr','rmarkdown','esquisse','eph','treemapify','gapminder','viridis'))