/videogames-dataset-analysis

Este repositorio contiene un dataset y scripts para producirlo. A su vez, analiza información sobre videojuegos, utilizando datos de la API de RAWG. El análisis se centra en identificar tendencias y patrones en la popularidad de diferentes géneros de videojuegos a lo largo del tiempo.

Primary LanguagePython

Video Games Dataset Analysis

Controles

Descripción General

Este repositorio contiene un dataset y scripts para producirlo. A su vez, analiza información sobre videojuegos, utilizando datos de la API de RAWG. El análisis se centra en identificar tendencias y patrones en la popularidad de diferentes géneros de videojuegos a lo largo del tiempo.

Estructura del Dataset

El dataset incluye los siguientes atributos:

  • genre (NOMINAL): El género del videojuego. Representa la categoría o tipo del juego: Acción, RPG, Aventura, etc.
  • year (NUMERIC): El año de lanzamiento.
  • average_rating (NUMERIC): La calificación o rating de ese género para ese año en concreto.
  • game_count (NUMERIC): La cantidad de juegos del género en cuestión que fueron lanzados ese mismo año.
  • genre_successful (NOMINAL): Etiqueta o clase, valor binario (1 o 0) que muestra si un género es considerado exitoso en un año basado en el umbral de calificación promedio.

Proceso de Análisis

El proceso de análisis consta de los siguientes pasos:

  1. Extracción de Datos: Utilizando la API de RAWG, se recopilan diferentes datos de videojuegos como el nombre, género, fecha de lanzamiento y calificaciones.
  2. Procesamiento de Datos: Los datos se procesan para calcular el rating promedio y la cantidad de juegos lanzados por género y año. También se determina si un género es exitoso en un año específico basándose en un umbral de calificación promedio, con esto se etiqueta o clasifica la instancia.
  3. Almacenamiento de Datos: Los datos procesados se almacenan en un archivo en formato ARFF, con objeto de poder ser analizado fácilmente.

Uso del Dataset

Puede ser utilizado para realizar análisis en aplicaciones machine learning; puede servir para explorar tendencias en la industria de los videojuegos y entender cómo han ido evolucionado los géneros y la recepción de los juegos durante su historia.

Requisitos

  • Python 3
  • Bibliotecas de Python: pandas, requests

Cómo Ejecutar

  1. Clonar el repositorio.
  2. Ejecutar el script game_data_analyzer.py para recopilar y procesar los datos.
  3. Listo, en el nuevo directorio data/arff se dispondrá del dataset actualizado y listo para ser analizado.

Autores

Aingeru García