Este repositorio contiene un dataset y scripts para producirlo. A su vez, analiza información sobre videojuegos, utilizando datos de la API de RAWG. El análisis se centra en identificar tendencias y patrones en la popularidad de diferentes géneros de videojuegos a lo largo del tiempo.
El dataset incluye los siguientes atributos:
genre
(NOMINAL): El género del videojuego. Representa la categoría o tipo del juego: Acción, RPG, Aventura, etc.year
(NUMERIC): El año de lanzamiento.average_rating
(NUMERIC): La calificación o rating de ese género para ese año en concreto.game_count
(NUMERIC): La cantidad de juegos del género en cuestión que fueron lanzados ese mismo año.genre_successful
(NOMINAL): Etiqueta o clase, valor binario (1 o 0) que muestra si un género es considerado exitoso en un año basado en el umbral de calificación promedio.
El proceso de análisis consta de los siguientes pasos:
- Extracción de Datos: Utilizando la API de RAWG, se recopilan diferentes datos de videojuegos como el nombre, género, fecha de lanzamiento y calificaciones.
- Procesamiento de Datos: Los datos se procesan para calcular el rating promedio y la cantidad de juegos lanzados por género y año. También se determina si un género es exitoso en un año específico basándose en un umbral de calificación promedio, con esto se etiqueta o clasifica la instancia.
- Almacenamiento de Datos: Los datos procesados se almacenan en un archivo en formato ARFF, con objeto de poder ser analizado fácilmente.
Puede ser utilizado para realizar análisis en aplicaciones machine learning; puede servir para explorar tendencias en la industria de los videojuegos y entender cómo han ido evolucionado los géneros y la recepción de los juegos durante su historia.
- Python 3
- Bibliotecas de Python:
pandas
,requests
- Clonar el repositorio.
- Ejecutar el script
game_data_analyzer.py
para recopilar y procesar los datos. - Listo, en el nuevo directorio
data/arff
se dispondrá del dataset actualizado y listo para ser analizado.
Aingeru García