/DataAnalysis_NetflixPrizeData

Exploratory Data Analysis (EDA) with "Netflix Prize data" dataset from Kaggle.

Primary LanguageHTML

Exploratory Data Analysis(EDA)

In this study, the data set “Netflix Prize data” obtained from the [Kaggle] website (https://www.kaggle.com/netflix-inc/netflix-prize-data) will be analyzed. This dataset was created as a competition to find the best algorithm for predicting the score that users give to the films on the platform.

The objective is to analyze various aspects and statistics of the variables and represent it graphically.

Index (Spanish document)

  • Introducción
    • Combined Data
    • Movie titles
  • Carga y lectura de datos
  • Construcción del modelo de datos
  • Analizando nuestros datos
    • Estructura del modelo de datos
    • Calificaciones de las películas
    • ¿Cuántas calificaciones hay en total y cómo se distribuyen?
    • ¿Cuáles son las películas más votadas?
    • ¿Cuál es la distribución de las calificaciones de la película más votada?
    • ¿Cuál es la distribución de las calificaciones de la película menos votada?
    • ¿Afecta la estación del año al número de calificaciones que hacen los usuarios?
    • ¿Afecta el día de la semana al número de visualizaciones y calificaciones que hacen los usuarios?
    • ¿Cómo se distribuyen las votaciones por año?
    • ¿Cómo se distribuye el score promedio por año?
    • Comparación entre películas
    • Comparamos las 5 películas más votadas
    • ¿Qué películas/series son consideradas como las mejores?
    • Distribución de las películas por año de estreno
    • ¿Afecta el año de estreno a la puntuación que los usuarios dan a una película?
  • Nuestra visión del análisis