/PI03-Analytics

Repositorio del PI03 de Data Science

PROYECTO INDIVIDUAL Nº3

MOOCs

¡Bienvenidos al último proyecto individual de la etapa de labs! En esta ocasión, deberán hacer un trabajo situándose en el rol de un Data Analyst.

Descripción del problema (Contexto y rol a desarrollar)

Contexto

Los MOOCs (cursos masivos abiertos y online, por sus siglas en inglés) han revolucionado el mundo de la educación desde principios de la década pasada, cuando el profesor Sebastian Thrun comenzó con la transmisión online de su curso introductorio a la Inteligencia Artificial. Poco tiempo después, Thrun fundó Udacity y con el pasar de los años se han ido sumando otras plataformas como edX y Coursera, brindando servicios similares: acceso a contenido específico, de calidad y de manera práctica, desde la comodidad del hogar. Muchas de estas plataformas tienen contenido gratuito mientras que el modelo de negocio en general se basa ya sea en el pago de suscripciones recurrentes para acceso general o únicas, para acceder a certificaciones o a cursos premium. Con el aumento de la popularidad de los MOOCs, no solo han aparecido nuevas plataformas privadas como las mencionadas anteriormente, sino que también muchas universidades y organizaciones sin fines de lucro han sumado a la oferta haciendo el mercado mucho más competitivo. En este contexto, resulta imperante para cada plataforma, ajustar sus modelos de negocio, los cursos y el contenido que se ofrece en los mismos para lograr captar y retener a la mayor cantidad de clientes.

Rol a desarrollar

Nuestra PM se dirigió a nosotros con un nuevo ticket de trabajo. Una startup de tecnología está interesada en sumarse al mercado de cursos online, pero de una manera eficiente, por lo que compró datasets de posibles competidores para analizar y sacar conclusiones de los datos recolectados.

Ellos solicitan segmentar los el nivel de ventas según precio, idioma, nivel y rating de cada curso para analizar qué tanto influyen dichas variables en la demanda del producto vendido.

Por otra parte se nos solicita un WordCloud de las palabras clave que más se repiten dentro del título. (Se puede añadir otras variables de nuestro interés).

Por último, se nos pide una demo en un rango de tiempo de no más de 10 min donde presentamos las funcionalidades del dashboard y las conclusiones/recomendaciones de nuestra parte.

Con el fin de monitorear la eficacia de los objetivos de la empresa, se le pide establecer al menos 1 KPI producto de su análisis y que el mismo se pueda visualizar en un dashboard.

Propuesta de trabajo (indicaciones)

Análisis Exploratorio de los datos(Exploratory Data Analysis = EDA): Debe incluir un informe en el que explique y justifique el análisis expuesto y los datos utilizados, complementando con las salidas visuales incorporadas en el EDA. El reporte debe presentrase en un notebook (.ipynb) adecuadamente comentado.

Dashboard: Debe ser funcional y coherente con el análisis y la historia que vayan a relatar.

Análisis: ⚠️ No se calificará solamente la producción de gráficos con datos (dashboard), sino también los análisis y conclusiones que encuentren de estos.

KPIs: Se debe sugerir al menos 1 KPI bien formulado y debe aparecer en el dashboard. Tenga en cuenta que debe tener relación con el dataset y la historia que está contando, y debe explicar en la presentación el análisis y la funcionalidad de los KPIs sugeridos.
MUY IMPORTANTE: repasar qué es un KPI y cómo se diferencia de una métrica convencional. En el material de apoyo tienen lectura que puede ser de ayuda.

Repositorio de GitHub: El repositorio debe contener un Readme principal donde se presente de forma general su proyecto.

PLUS
Nota: la realización de los siguientes ítems no es intercambiable con los requerimientos mínimos establecidos en la sección anterior "Propuesta de trabajo". Empiece con esta sección una vez haya cumplido con los requerimientos mínimos, a modo de desafiarse a usted mismo.

  • Redactar un reporte escrito de análisis realizado en base a sus dashboard e incluirlo en el readme de sus repositorios. También debe incluir el análisis y la funcionalidad de los KPIs sugeridos.
  • Cruce de datos con datasets complementarios.

Fuente de datos:


Lo que tendremos en cuenta a la hora de evaluar:

Serás evaluado en dos grandes áreas, ambas con igual peso entre si: Tech y Soft!

Las habilidades técnicas (Tech) para este proyecto de analytics incluyen el tipo de herramientas utilizadas para la realización de dashboard (herramientas de Business Intelligence y/o DataViz), elección de gráficas pertinentes para la representación del dato y un dashboard efectivo (organización, uso de filtros y criterios estéticos y de diagramación (dónde se ubican los filtros y visualizaciones, etc) 💅)

Las habilidades blandas (Soft) para este proyecto tendrán en cuenta la puntualidad y preparacion para la demo, su comunicación oral y storytelling, la forma en que cuentas tu historia (los datos duros que presentas son útiles para tu audiencia?) y finalmente (esto es mucho muy importante), ⚠️EL ANÁLISIS⚠️ (¿brindas un contexto?, ¿haces comparaciones con otros datos?, tienes conclusiones interesantes y realizas análisis no triviales?).

Spoiler: Te vamos a dar feedback y también vamos a evaluar tu capacidad de recepción a este 😛

Material de apoyo

Recomendaciones finales

¡La demo es para reportar su análisis apoyándose en las funcionalidades de sus dashboard, NO tienen que mostrar código!

La DEMO, donde defenderán el proyecto, se realizará el día jueves o viernes. Estar atentos a Slack y calendar para ver qué día y horario les corresponde. Tendrán 10 minutos para exponer su análisis, luego de lo cual, habrá una devolución del corrector asignado. Es importante que sepan gestionar bien su tiempo y tengan un speech ya preparado, acorde al tiempo disponible.

Recordamos que sean puntuales y prueben el correcto funcionamiento de las herramientas empleadas antes de ingresar a la meet.

Disclaimer

De parte del equipo de Henry se quiere aclarar y remarcar que los fines de los proyectos propuestos son exclusivamente pedagógicos, con el objetivo de realizar proyectos que simulen un entorno laboral, en el cual se trabajen diversas temáticas ajustadas a la realidad. No reflejan necesariamente la filosofía y valores de la organización. Además, Henry no alienta ni tampoco recomienda a los alumnos y/o cualquier persona leyendo los repositorios (y entregas de proyectos) que tomen acciones en base a los datos que pudieran o no haber recabado. Toda la información expuesta y resultados obtenidos en los proyectos, nunca deben ser tomados en cuenta para la toma real de decisiones (especialmente en la temática de finanzas, salud, política, etc.).