Implementar un sistema de recomendacion de peliculas que permita al usuario encontrar filmes de acuerdo a sus intereses y nuevos a explorar usando redes neuronales.
Nombre de los alumnos participantes
André Dario Pilco Chiuyare
Luis Felipe Poma Astete
Breve descripción del dataset
Los datasets no se pudieron subir al repositorio debido al tamaño limite excedido, por lo cual al ejecutar el notebook se descargara desde Kaggle automaticamente.
movies_metadata.csv
Columna
Descripción
Id
Identificador único para cada película.
adult
Indica si la película es para adultos (true/false).
belongs_to_collection
Información sobre la colección a la que pertenece la película, si la tiene.
budget
Presupuesto de la película en dólares.
genres
Géneros asociados con la película.
original_language
Idioma original en el que se produjo la película.
overview
Breve descripción general de la trama de la película.
popularity
Puntuación de popularidad de la película.
production_companies
Compañías productoras involucradas en la realización de la película.
release_date
Fecha de lanzamiento de la película.
revenue
Ingresos generados por la película en taquilla.
runtime
Duración de la película en minutos.
spoken_languages
Idiomas hablados en la película.
status
Estado de la película (por ejemplo, lanzada, en producción, etc.).
tagline
Lema o eslogan asociado con la película.
vote_average
Promedio de las calificaciones de la película.
vote_count
Número total de votos recibidos por la película.
ratings.csv
Columna
Descripción
user_id
Identificador único del usuario que proporcionó la calificación.
movie_id
Identificador único de la película que recibió la calificación.
rating
Calificación otorgada por el usuario a la película (escala del 1 al 5).
timestamp
Marca de tiempo que indica cuándo se registró la calificación.
keywords.csv
Columna
Descripción
Id
Identificador único de la película.
keywords
Conjunto de palabras clave que describen la película.
credits.csv
Columna
Descripción
Id
Identificador único de la película.
crew
Lista de información de cada involucrado en la película (director, escritor, etc.).
cast
Lista de información de cada actor y qué personaje interpreta en la película.
Conclusiones
Recomendaciones basadas en contenido del largometraje (BERT fine-tuning): Evaluar la efectividad del modelo BERT fine-tuning en predecir las preferencias del usuario utilizando características del largometraje reveló una capacidad notable para generar recomendaciones personalizadas. Este enfoque aprovecha eficazmente las representaciones semánticas aprendidas, proporcionando recomendaciones relevantes basadas en similitudes conceptuales entre películas. Sin embargo, las limitaciones incluyen la dependencia de la calidad y cantidad de datos de entrenamiento disponibles.
Recomendaciones basadas en historial de calificaciones (redes profundas para matriz de factorización): El modelo de redes profundas para la matriz de factorización demostró ser efectivo para mejorar las recomendaciones basadas en el historial de calificaciones de los usuarios. Comparado con métodos tradicionales. Sin embargo, la complejidad computacional y el tiempo de entrenamiento pueden ser significativos, aunque los beneficios en precisión y personalización justifican estos costos.
Recomendaciones sin información sobre el usuario: Las estrategias utilizadas para hacer recomendaciones cuando no se dispone de información sobre el usuario incluyeron métodos de recomendación basados en la popularidad. Esta estrategia demostró ser efectiva en términos de ofrecer recomendaciones relevantes y diversas, especialmente en escenarios donde la información del usuario es limitada o no disponible.
Licencia
Este trabajo está disponible bajo la licencia CC BY-SA 4.0.