/DataMiningProject_PortoTaxiClustering

Class Project for the Data Mining (Big Data Context) course (6 ECTS). Objective: Facility location problem ("find the best places to place N facilities"). Solved with: Clustering, applying and implementing several techniques (i.e. K-Means, K-Median). Results analyzed via: Silhouette coefficient, Hopkins statistics, Objective Function. Dataset: GPS coordinates from the city of Porto, Portugal.

Primary LanguageJava

Facility location problem analysis (Porto Taxi stand location)


Dimostrazioni di facility location sulle posizioni dei taxi nella città di porto

ESEGUIRE DA TERMINALE (GRADLE)

Per eseguire da terminale con gradle: Su linux si può eseguire direttamente con
./gradlew run
Su Windows bisogna scaricare winutils.exe da https://github.com/steveloughran/winutils e metterlo nella cartella bin
Poi si può eseguire con
gradlew.bat run

ESEGUIRE DA ECLIPSE

Per eseguire in eclipse:
Aprire Run>Run configurations...
Doppio click su gradle peoject
In Gradle Tasks inserire "run"
Poi premere Workspace e selezionare la cartella
Dare un nome alla configurazione, applicare e chiudere
Ora si può eseguire con la nuova configurazione

DATASET

Per utilizzare il dataset completo, scaricare il file a questo link:
https://archive.ics.uci.edu/ml/machine-learning-databases/00339/train.csv.zip
Spacchettare e mettere nella cartella data il file train.csv