Leggere e rappresentare i progetti culturali innovativi. Tutto il materiale è rilasciato secondo la licenza:
Creative Commons Attribuzione - Non commerciale 3.0 Italia (CC BY-NC 3.0 IT)
Questo progetto nasce dalla mutua connessione dei datasets relativi ai progetti culturali. I dati organizzati e connessi "a rete" consentono di individuare strutture legate a particolari tematiche, quali la migrazione, l'educazione e la didattica, collegate attraverso ponti geografici che possono consentire a diversi attori di comunicare ed interagire. Le connessioni che si creano corrispondono al percorso culturale naturale verso la conoscenza e la consapevolezza dei fenomeni migratori.
L'elaborato sottoposto al bando Open Data Cultura 2017 è disponibile nella mia pagina Behance.
I dati utilizzati nel progetto sono scaricabili dalle fonti citate nel Bando e disponibili nella cartella /data del repository. Sono stati inoltre utilizzati ulteriori dati provenienti dal sito del Ministero dell'Interno Italiano, relativi ai centri di accoglienza dei migranti in Italia.
I dati dei singoli bandi sono stati organizzati in una struttura a grafo, evidenziando le naturali connessioni tra i soggetti proponenti i progetti, la loro provenienza, e l'ambito (argomenti) delle proposte progettuali.
Il database a grafo Neo4j è stata una scelta naturale per rappresentare, interrogare e visualizzare dati connessi. In questo progetto è stata utilizzata la versione Community 3.2.3, gratuitamente scaricabile dal sito del produttore.
Al fine di procedere con l'elaborazione dei dati, questi ultimi sono stati opportunamenti "puliti" e formattati in un formato leggibile in fase di importazione nel database Neo4j, in formato .csv. Tutta la fase di lettura, pulizia e formattazione è riproducibile attraverso lo script Python disponibile in src/CleanExportData.py.
I file di output dello script Python possono essere importati in Neo4j attraverso la procedura LOAD CSV, contenuta nello script Cypher src/LOADCSV.cypher. Il modello dati proposto è visualizzabile nel file ModelloDati.png. Lo script contiene inoltre la parte di creazione delle aggregazioni tra città e Regioni di appartenenza.
Il database completo è stato quindi esportato in Gephi per visualizzare e clusterizzare opportunamenti i dati. Per l'esportazione da Neo4j è necessario scaricare il file .jar delle procedure APOC. Lo script di esportazione del grafo in streaming a Gephi è disponibile in src/ExportGephi.cypher, completo delle istruzioni per il corretto settaggio delle comunicazioni. Il file risultante dallo streaming dei dati è disponibile in src/OpenDataCultura.gephi e manipolabile per ulteriori visualizzazioni e/o ricerca di informazioni.
Grazie al team LARUS per il costante supporto nella ricerca e nell'analisi dati con database a grafo.