italia/daf-ontologie-vocabolari-controllati

classificazione territoriale: semplificazione riuso elementi

seralf opened this issue · 2 comments

Ciao

per territorial-classification abbiamo usato una convenzione sugli URI del tipo:
<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/{codice_istat}-(data_inizio_validità)>.

In questo modo possono essere tracciate versioni "nel tempo" dei vari comuni (ogni istanza avrà potenzialmente anche la data di fine validità), di fatto materializzando risorse diverse, eventualmente collegabili tra di loro.

Ad esempio per il comune di "Agliè" abbiamo un URI del tipo:
<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/001001-(1861-03-17)>

dove il {codice_istat} era preso dalla fonte ISTAT, mentre {data_inizio_validità} da ANPR, come si vede dal template URI:
https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/{'ANPR_codistat'}-({'ANPR_data_istituzione'})" usato nel mapping R2RML.

In molti casi sembra emergere d'altro canto la possibilità di reperire il codice ISTAT ma non la data di inizio validità, al massimo un range di validità.

Mi chiedevo de non potremmo introdurre dei puntamenti di comodo, per facilitare delle riconciliazioni più "imprecise".

ipotesi 1
Ipotizzavo qualcosa del tipo:
<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/001001-(0000-00-00)>
per costruire un puntamento all'ultima "versione" del comune "Aglié", e la risorsa potrebbe internamente linkare a sua volta (magari tramite un timeinterval) alle versioni nel tempo.

ipotesi 2
Analogamente potremmo immaginare degli URI fittizi più "tecnici", da far materializzare all'occorrenza a chi dispone di date di validità osservabili sui dati di domini specifici, e quindi non necessariamente "autoritative" (ma con esse confrontabili, ad un qualche livello logico).

In questo caso potrebbe essere ad esempio qualcosa del tipo:
<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/[{data_presunta_inizio_validità}]/[{data_presunta_fine_validità}]/001001>
dove se nella banca dati di una ipotetica PA esistesse il record "Agliè" e disponessimo solo dell'informazione sull'anno, potrebbe essere generato un URI simile al seguente:
<https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/[1861-**-**]/[****-**-**]/001001>:

Entrambe queste ipotesi non sostituirebbero gli URI già definiti, ma introdurrebbero semmai delle entità di supporto, immaginate per favorire delle attività di linkage sulle quali stabilire anche un certo grado calcolabile di incertezza. Questo potrebbe facilitare da un lato l'utilizzo applicativo nella pratica di molte implementazioni, e dall'altro tracciare in qualche modo il "grado di imprecisione" adottato/ammissible.

che ne pensi @giorgialodi ?

che ne pensi @giorgialodi ?

Come scritto anche nell'altro repository non mi è chiaro perché fare tutti questi giri. Che cosa sono le entità di supporto che menzioni nell'ultimo paragrafo? E perché dovremmo introdurle nel dataset visto che nessuno le aveva previste? E' un vocabolario ufficiale che prende informazioni da due dataset ufficiali e li mette insieme.

Se però mi fai un esempio pratico di turtle risultante rispetto a quello che scrivi magari capisco meglio e riesco meglio a dare una posizione in merito.
Cioè prendiamo il pezzo di turtle che descrive questo URI https://w3id.org/italia/controlled-vocabulary/territorial-classifications/cities/048017-(1939-11-15) e vediamo in pratica cosa si dovrebbe fare.

Tra l'altro bisognerebbe rimaneggiare il processo ipotizzo e al momento non è possibile.