Descripción del problema (Contexto y rol a desarrollar)

Contexto

Los MOOCs (cursos masivos abiertos y online, por sus siglas en inglés) han revolucionado el mundo de la educación desde principios de la década pasada, cuando el profesor Sebastian Thrun comenzó con la transmisión online de su curso introductorio a la Inteligencia Artificial. Poco tiempo después, Thrun fundó Udacity y con el pasar de los años se han ido sumando otras plataformas como edX y Coursera, brindando servicios similares: acceso a contenido específico, de calidad y de manera práctica, desde la comodidad del hogar. Muchas de estas plataformas tienen contenido gratuito mientras que el modelo de negocio en general se basa ya sea en el pago de suscripciones recurrentes para acceso general o únicas, para acceder a certificaciones o a cursos premium. Con el aumento de la popularidad de los MOOCs, no solo han aparecido nuevas plataformas privadas como las mencionadas anteriormente, sino que también muchas universidades y organizaciones sin fines de lucro han sumado a la oferta haciendo el mercado mucho más competitivo. En este contexto, resulta imperante para cada plataforma, ajustar sus modelos de negocio, los cursos y el contenido que se ofrece en los mismos para lograr captar y retener a la mayor cantidad de clientes.

Rol a desarrollar

Este proyecto simula una presentación de datos ante una startup de tecnología está interesada en sumarse al mercado de cursos online. Para lo cual se hizo uso de los siguientes datasets ubicados en el siguiente enlace:

Enlace a datasets

Se realizó una segmentación de acuerdo a el nivel de ventas según precio, idioma, nivel y rating de cada curso segun se tenga a disposición, para analizar qué tanto influyen dichas variables en la demanda del producto vendido.

Por otra parte se realizó un WordCloud de las palabras clave que más se repiten dentro del título.

Además, con el fin de monitorear la eficacia de los objetivos de la empresa, se estableció algunos KPI's producto del análisis y este se pueda visualizar en un dashboard. Que para este caso si hizo uso de PowerBI.

Indicaciones adicionales:

Los archivos contenidos en este repositorio se detallan de la siguiente manera:

  • Dashboard.pbix (Representación gráfica de los datos realizados en powerBI).
  • EDA_Coursera.ipynb (Analisis exploratorio de datos de dataset Coursera_courses.csv y Coursera_reviews.csv).
  • EDA_Edx.ipynb (Analisis exploratorio de datos de dataset edx_courses.csv)
  • EDA_Udemy.ipynb (Analisis exploratorio de datos de dataset udemy_courses.csv).
  • Reporte_Coursera.html (Resultado premilinar de EDA correspondiente a Cousera).
  • Reporte_Edx.html (Resultado premilinar de EDA correspondiente a Edx).
  • Reporte_Udemy.html (Resultado premilinar de EDA correspondiente a Udemy).