/Inside-the-World-of-Pokemon

A repository for the Machine Learning course project.

Primary LanguageR


"Inside the World of Pokémon!"
a Machine Learning Project

Overview   |   Istruzioni   |   Dataset   |   Data Visualization   |   Conclusioni   |   About us  


☍   Overview

Quello dei Pokémon è un franchise giapponese di grande successo di proprietà di The Pokémon Company che fonda il suo successo, oltre che sulla serie animata, anche su tutta una serie di videogiochi realizzati in forma Role Playing Game (RPG) a partire dal 1996 e pubblicati da Nintendo.
Mossi dalla curiosità di esplorare a fondo questo mondo ci siamo proposti diverse domande di ricerca, tra cui:
i) È possibile classificare i Pokémon cosiddetti “leggendari” (ovvero le creature simbolo di ogni generazione che dovrebbero rappresentare delle specie di divinità all’interno dei videogames) sulla base delle statistiche con le quali sono caratterizzati? Oppure la loro importanza è dovuta solo alla difficoltà che si ha nella loro cattura?
ii) È possibile ricondurre la difficoltà in cui ci si può imbattere nel trovare e catturare un Pokémon alle sue statistiche oppure è un parametro scelto a priori dagli sviluppatori, completamente slegato da quelle che sono le effettive capacità delle creature?

Con il software KNIME abbiamo provato a dare una risposta a questi interrogativi con gli strumenti propri del Machine Learning.


☍   Istruzioni

Per il progetto, abbiamo dovuto seguire le istruzioni ivi riportate:

  • Scegliere un dataset da Kaggle;
  • Dare vita a un Team (min. 2 membri, max. 5);
  • Usare tutte le tecniche e gli strumenti a nostra disposizione e imparati a lezione (con logica e buon senso);
  • Sviluppare un workflow di Knime;
  • Dare vita a un report tecnico (sotto le 8 pagine, a propria discrezione in italiano o in inglese).

Nota Bene:

Abbiamo deciso di sviluppo il report in lingua italiana per mantenere una coerenza con l'insegnamento e per evitare di complicarci eccessivamente la vita in fase di stesura.
Tuttavia, abbiamo l'intento di dar vita a una versione in inglese nel breve periodo.


☍   Dataset

Il dataset utilizzato è disponibile al seguente link:

    ◃   Pokémon

Un ringraziamento a @alopez247 per averlo reso disponibile sulla piattaforma di Kaggle


☍   Data Visualization

Tentando di mettere in pratica quanto imparato in materia di visualizzazione dei dati, abbiamo dato vita ad alcune infografiche.
Per accedere alla versione interattiva delle stesse, clicckare sull'immagine sopra riportata oppure sul seguente link, il quale rimanda a una pagina di Tableau Public:

☞   Inside the World of Pokémon - Data Visualization


☍   Conclusioni

In conclusione, riportiamo sinteticamente le risposte alle principali domande di ricerca:

  • È possibile individuare i Pokémon leggendari solamente in base alle loro statistiche “fisiche"?
    La risposta è sì, e con risultati piuttosto consistenti: infatti, l’accuracy (nonché la misura di F-Measure) raggiunta dai classificatori per tale compito è piuttosto alta, e tutti i modelli di classificazione usati per l’analisi si sono rilevati sostanzialmente equivalenti e ben performanti.
    In particolare, abbiamo scoperto che bastano pochi attributi comuni selezionati attraverso Feature Selection per ottenere ottimi risultati di classificazione, segno che il risultato è chiaramente interpretabile tramite il significato che questi attributi assumono nel mondo dei Pokémon. In linea di massima possiamo affermare che i Pokémon etichettati -dai creatori del gioco- come leggendari non posseggono tale titolo solo per ragioni di trama o convenienza, ma perché dotati a tutti gli effetti di statistiche di combattimento generalmente piuttosto elevate.

  • È possibile predire in base alle statistiche generali la facilità di cattura di un Pokémon?
    La risposta è (parzialmente) sì: con la classificazione multibinaria che abbiamo effettuato, avente come target la variabile rarity_class da noi creata, abbiamo ottenuto un’accuracy media pari all’incirca a 0.8, comune a tutti i classificatori adottati. Tale risultato indica che i relativamente pochi attributi selezionati (dalla Feature Selection) influenzano in modo significativo il processo di cattura.

I risultati sono probabilmente incrementabili applicando direttamente una regressione alla variabile continua catch_rate, tuttavia la risposta alla domanda principale sarebbe in questo frangente offuscata (se non contraddetta, in alcuni casi) dal peso del fattore random che gioca un ruolo importante durante il processo di cattura. Con la nostra discretizzazione pensiamo di ottenere un risultato più affidabile in termini di riscontro nel gioco, benché meno predittivo nello specifico.


☍   About us

Il nome del nostro gruppo di lavoro per questo progetto è stato Team 09, e qui di seguito ne verranno presentati brevemente i componenti:

⊜   Dario Bertazioli

  • Cosa studio: Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Traguardi precedenti: Laurea triennale in Fisica presso l'Università degli Studi di Milano.

Qui di seguito vengono riportati i principali canali social:

 

⊜   Alessandro Borroni

  • Cosa studio: Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Traguardi precedenti: Laurea triennale in Economia e Commercio presso l'Università degli Studi di Milano-Bicocca;

Qui di seguito vengono riportati i principali canali social:

 

⊜   Fabrizio D'Intinosante

  • Cosa studio: Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Traguardi precedenti: Laurea triennale in Economia e Statistica per le organizzazioni presso l'Università degli Studi di Torino.

Qui di seguito vengono riportati i principali canali social:

 

⊜   Mirko Giugliano

  • Cosa studio: Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Traguardi precedenti: Laurea triennale in Marketing, Comunicazione Aziendale e Mercati Globali presso l'Università degli Studi di Milano-Bicocca.

Qui di seguito vengono riportati i principali canali social:

 

⊜   Massimiliano Perletti

  • Cosa studio: Studente Magistrale di Data Science presso l'Università degli Studi di Milano-Bicocca;
  • Traguardi precedenti: Laurea triennale in Ingegneria dei materiali e delle nano-tecnologie presso il Politecnico di Milano.

Qui di seguito vengono riportati i principali canali social:



Grazie infinitamente per la cortese attenzione!



Readme layout by @malborroni