/Mitos-Data-Analysis

Πρότζεκτ το οποίο σχετίζεται με την ανάλυση δεδομένων του mitos.gov.gr και το στήσιμο υποδομής testing προσπαθειών big data.

Mitos Big Data Implementation

Μίτος

O Μίτος είναι μία πλατφόρμα παροχής πληροφοριών για τις διαδικασίες του δημοσίου. Εξηγεί με λεπτομέρεια τα δικαιλογητικά που χρειάζεται κανείς,τις υπηρεσίες στις οποίες πρέπει να απευθυνθεί, και τα βήματα που πρέπει να ακολουθήσει για να ολοκληρώσει κάποια διαδικασία.

Μέχρι στιγμής έχουν καταγραφεί 3600+ διαδικασίες και υπάρχει άπλετο περιεχόμενο το οποίο η ακαδημαϊκή κοινότητα αναλύει με διάφορους τρόπους, ώστε να εξάγει συμπεράσματα και να κάνει προτάσεις βελτίωσης.

Συνοπτικά πρόκειται για το στήσιμο ενός συστήματος που έχει ήδη υλοποιηθεί σε συγκεκριμένες υποδομές που θα μας δώσουν, και από εκεί και πέρα λόγω του όγκου δεδομένων που θα υπάρχουν θα μπορούν αναλύσεις κάθε είδους, είτε με νευρωνικά δίκτυα είτε με απλή στατιστική είτε απλή οπτικοποίηση ενδιαφέροντων πληροφοριών, δεν υπάρχουν όρια στο τι κάποιος μπορεί να κάνει, γενικά ψάχνουμε τις ιδέες όλων, οπότε είμαστε ανοιχτοί σε προτάσεις.

Project Description

(Εδώ θα μπει η πρόταση που θα μας σταλεί από τον υπεύθυνο καθηγητή)

Θεωρητικό υπόβαθρο

Για να ασχοληθεί κανείς με το πρότζεκτ αυτό θα χρειάζεται να γνωρίζει κάποιες έννοιες και κάποια εργαλεία, που αν θέλει να εμβαθύνει σημαντικά μπορεί να αναζητήσει και μόνος του υπάρχει αρκετό υλικό(η wikipedia έχει κάτι για όλα αυτά). Εδώ θα δοθεί η γενική εικόνα όλων αυτών.

RDF (Resource Description Framework)

Πρόκειται για έναν τρόπο να περιγράψεις και να μεταδόσεις δεδομένα τα οποία έχουν μορφή γράφου. Ουσιαστικά είναι ένας ακυκλικός γράφος ο οποίος αποτελείται από τριπλέτες(triple statements). Μία δήλωση RDF έχει έναν κόμβο για το υποκείμενο, ένα κόμβο για το αντικείμενο, και μία ακμή που συνδέει το υποκείμενο με το αντικείμενο για να ολοκληρωθεί το νόημα.

Όμως υπάρχει μία σημαντική λεπτομέρεια, τα πάντα είναι URIs(ουσιαστικά ένας δείκτης για το πού θα βρω μία πληροφορία) είτε απλά μία τιμή. Αυτό τεχνικά μας δίνει την δυνατότητα να εκφράσουμε πολύ σύνθετες σχέσεις. Μία πιο ολοκληρωμένη εξήγηση με παραδείγματα μπορεί να την βρει κανείς εδώ.

Semantic Web

Στα ελληνικά σημασιολογικός ιστός, είναι ουσιαστικά standards τα οποία με την χρήση τεχνολογιών(RDF και OWL), προσφέρουν τρόπους για να καταστήσουν τις πληροφορίες "machine readable" και για να ενισχύσουν την διαλειτουργικότητα μεταξύ εφαρμογών. Η πληροφορία οργανώνεται με τρόπους που μας δίνουν δυνατότητες καλύτερης οργάνωσης της γνώσης. Χρησιμοποιείται σε βιομηχανίες με μεγάλο μερίδιο R&D όπως τις φαρμακοβιομηχανίες για την διαχείριση της γνώσης που παράγεται και την σύνδεση νέων πληροφοριών με τις ήδη υπάρχουσες.

Virtuoso

Πρόκειται για μία τεχνολογία που πρόκειται για μια βάση δεδομένων RDF. Όπως και στις κλασσικές(σχεσιακές) βάσεις δεδομένων, έτσι και εκεί μπορείς να κάνεις αιτήματα για να λάβεις ή να τροποποιήσεις πληροφορία. Αντί για SQL χρησιμοποιείται η SPARQL η οποία έχει παρόμοια λειτουργικότητα απλά αφορά RDF βάσεις δεδομένων.

CV (Core Vocabularies)

CPSV (Core Public Service Vocabulary)

Big Data Testing Infrastructure EU

Τι έχει ήδη γίνει

<διπλωματική ++++>

Τι μπορεί να γίνει