🔎 Proyecto integrador N1 🔍

Introduccion

📌 Para este proyecto se nos proporciono un conjunto de tres archivos de steam (Steam es una plataforma de distribución digital de videojuegos desarrollada por Valve Corporation) para poder trabajar en ellos y poder crear una api para que un servicio web en la nube consuma lo que fuimos haciendo una vez ya terminada la investigacion.

Contexto

Trabaje con tres archivos de datos principales:

steam_games: Este archivo nos proporciona informacion sobre distintos videojuegos dentro de la plataforma, incluyendo titulos, generos, desarroladores, precios de productos, entre otros.

user_reviews: Este contiene reseñas de usuarios sobre diferentes juegos.

user_items: Este contiene detalles sobre los juegos que los usuarios poseen.

Transformaciones

Antes de poder extraer valor de estos datos, tuve que someterlos a un proceso de ETL, este proceso es esencial para limpiar, transformar y preparar los datos para analizarlos posteriormente.

extraccion: Comence cargando los archivos para poder entender cada columna y el tipo de datos que contenia. ✔️

transformacion: Realice una transformacion de los datos, eliminando duplicados, tratando valores nulos, y realizando conversiones de tipos cuando fue necesario, este ultimo punto tambien tuve que hacerlo en el proceso de feature engineering fuera de los datasets originales para poder realizar las funciones. ✔️

carga: Una vez limpios y transformados, cargue estos datos en una estructura mas adecuada para su analisis y posterior implementacion, en mi caso fue esencial pasar estos archivos ya con el proceso de etl realizado a formato de tipo parquet para poder subirlo a github y que render me los tome ya que quedaban muy grandes de tamaño. ✔️

Feature Engineering

Una vez realizado el etl, con mis datos limpios, procedi a hacer el proceso de feature engineering, donde tuve que crear analisis de sentimiento y varias funciones mas que se pidieron, una vez realizado todo tuve que crear una API local que me permita interactuar con las funciones realizadas con los datos, utilice render para levantar un servicio web en linea, donde cualquier persona puede interactuar con los datos y obtener informacion.:boom:

Funciones a realizar

userdata(User_id: str): Esta función toma como entrada el ID de un usuario y devuelve la cantidad de dinero gastado por ese usuario, el porcentaje de recomendación basado en las revisiones (reviews.recommend) y la cantidad de items relacionados con ese usuario.

countreviews(YYYY-MM-DD y YYYY-MM-DD: str): Esta función toma dos fechas en formato YYYY-MM-DD como entrada y devuelve la cantidad de usuarios que realizaron reviews entre esas dos fechas, así como el porcentaje de recomendación basado en las reviews realizadas durante ese período.

genre(género: str): Esta función toma un género como entrada y devuelve la posición en la que se encuentra ese género en un ranking analizado bajo la columna PlayTimeForever.

userforgenre(género: str): Esta función toma un género como entrada y devuelve los cinco usuarios con más horas de juego en ese género, junto con sus URL de usuario (del juego) y sus IDs de usuario.

developer(desarrollador: str): Esta función toma como entrada el nombre de una empresa desarrolladora y devuelve la cantidad de items (juegos o contenido) producidos por esa empresa por año, así como el porcentaje de contenido gratuito en esos items.

sentiment_analysis(año: int): Esta función toma un año como entrada y devuelve una lista con la cantidad de registros de reseñas de usuarios que se encuentren categorizados con un análisis de sentimiento para ese año en particular.

API

link al entorno web de la api realizada para poder realizar consultas: https://prueba-api-gj31.onrender.com/docs#

VIDEO

link al video explicativo del proyecto y sus funciones: https://www.youtube.com/watch?v=-e8pdmXf3C4

valentinocaputa/proyecto