/UCA-relacionesgeograficas

UCA collection relaciones geograficas

Primary LanguageJupyter Notebook

UCA-relacionesgeograficas

UCA collection relaciones geográficas

Binder

Introducción

Proyecto para la extracción y transformación de la colección digital Relaciones Geográficas a un modelo semántico basado en el vocabulario European Data Model.

En este prototipo se han seleccionado 81 obras a través de sus manifests en formato JSON de la colección Relaciones Geográficas of Mexico and Guatemala. El dataset se ha transformado al formato RDF siguiendo el vocabulario EDM.

El prototipo incluye las modificaciones realizadas para la transformación a RDF con la herramienta Open Refine. También se ha desarrollado un Jupyter Notebook que se puede ejecutar en la plataforma Binder.

Proceso de transformación a RDF

El proceso de transformación a RDF funciona en cuatro pasos:

  • Identificación de recursos a través de sus manifest.json
  • Transformación a un fichero tabulado CSV
  • Modelado de datos RDF a través del vocabulario EDM con la herramienta OpenRefine
  • Enriquecimiento con repositorios externos como Wikidata y GeoNames

Scripts

  • UCAmanifests2CSV.py: transforma los manifests (json) presentes en el fichero (input/manifests.txt)[input/manifests.txt] a un fichero CSV.
  • rdfAnalisis.py: realiza consultas SPARQL al repositorio creado tras el proceso de transformación.

Modelo de datos con EDM

Roles autoridad

Los textos originales para los autores incluyen el rol con el que se asigna el autor. Siguiendo los roles que ofrece EDM, se ha realizado el siguiente mapeo:

  • creator: signer, artist
  • contributor: interpreter, collector, scribe, contributor, witness

Otros posibles modelos:

Clases (Europeana Data Model y otros...)

URLs patterns

Enriquecimiento

Pendiente

Referencias