/pyspark-video-game-analysis

Este projeto mergulha no universo dos videogames por meio da análise de dados com PySpark. Através de notebooks interativos, abordo diversas técnicas de visualização, preparação e análise de dados para desvendar informações valiosas sobre os jogos mais populares.

Primary LanguageJupyter Notebook

Análise de Dados de Jogos de Videogame com PySpark

Este projeto foi criado com o objetivo de explorar e aprofundar conhecimentos em análise de dados utilizando PySpark, uma poderosa ferramenta para processamento de big data e análise de dados em escala. O foco da análise é um conjunto de dados contendo informações sobre os jogos de videogame mais vendidos em diferentes regiões do mundo.

Sobre o Projeto

Neste projeto, você encontrará:

  • Notebooks interativos que abordam diversas técnicas para visualização, preparação e análise de dados. Uma apresentação em PowerPoint que ilustra uma linha do tempo das gerações de consoles e destaca os jogos mais influentes de cada ano.
  • Um processo ETL (Extração, Transformação e Carga) desenvolvido em PySpark, que extrai os registros do conjunto de dados, realiza limpeza e transformações, e finalmente os armazena como modelos gráficos visuais.
  • Análises detalhadas, incluindo agrupamentos, somatórios, contagens e insights interessantes obtidos a partir dos dados. Dataset
  • O conjunto de dados utilizado contém informações abrangentes sobre jogos de videogame, incluindo nome, plataforma, ano de lançamento, gênero, editora e vendas por região. Esses dados foram explorados de maneira criativa para identificar tendências, padrões e informações valiosas relacionadas aos jogos mais populares e suas características.

Motivação

A escolha deste projeto foi inspirada pela afinidade com jogos de videogame. Através da análise de dados, foi possível não apenas mergulhar no mundo dos videogames, mas também adquirir habilidades práticas em processamento de dados e visualização.

Principais Técnicas e Análises

Durante a exploração dos dados, várias técnicas foram aplicadas, tais como:

Agrupamentos com índice multinível para categorização avançada.

  • Somatórios de vendas por gênero e plataforma.
  • Contagens de lançamentos de jogos por gênero e plataforma.
  • Análise de tendências, incluindo a contagem de jogos de luta e RPGs mais vendidos.
  • Criação de uma linha do tempo das gerações de consoles e seus jogos mais destacados.

Como Utilizar

O projeto inclui notebooks interativos que demonstram passo a passo as análises realizadas, permitindo que você explore e adapte as técnicas utilizadas de acordo com suas necessidades. O processo ETL também está disponível, possibilitando a extração, transformação e carga de dados similares.

Fonte do dataset

https://www.kaggle.com/datasets/sidtwr/videogames-sales-dataset