Amsterdam Museum en Linked Data. II (Proceso)

Posted on 24 abril, 2014 por

0


Continuando con el post anterior, el Amsterdam Museum en LOD, veremos el procedimiento que se llevo a cabo para que esta institución cultural formara parte de la nube LOD, permitiendo la vinculación a sus datos en abierto y enriqueciendo la descripción de sus objetos que conforman una parte del patrimonio cultural de Amsterdam.

 

Este procedimiento de conversión y vinculación de los metadatos, se produce en los siguientes pasos:

 

1º XML:

Como he comentado anteriormente, el Amsterdam Museum utiliza el software Adlib para gestionar su colección museística, desde donde se obtienen los datos XML. Los metadatos XML que van a ser tratados son:

  •  Metadatos de la colección: 73 archivos con 1.000 registros cada uno
  • Diccionario de términos-vocabulario: Thesaurus.xml
  • Autoridades de persona: People.xml

 

Tal como muestra la figura 1, podemos ver los archivos de la colección en XML:

Figura 2

Figura 1. Archivos de la colección MXL del Amsterdam Museum.

 

Os dejo los enlaces de los mismos, para que podáis profundizar desde vuestro propio interés. Os sugiero que si os interesa, le deis un vistazo a un ejemplo de los datos de autoridades en XML

 

 

2º XMLRDF:

La herramienta XMLRDF está diseñada para transcribir cada uno de los artefactos sintácticos en un modelo semántico adecuado, donde los objetos y propiedades se insertan y se relacionan semánticamente a un metamodelo semántico tales como los usados generalmente SKOS y Dublin Core. SKOS se utiliza para representar tesauros y vocabularios, mientras que Dublin Core representa metadatos de objeto (Boer et al, 2012). Basada en la transformación de XML a RDF, la herramienta XMLRDF reescribe los siguientes archivos de:

 

En la figura 2, vemos un ejemplo de reglas de XMLRDF usadas en la conversión del Amsterdam Museum.

Figura 3

Figura 2. Ejemplos de reglas de XMLRDF

 

La interactividad de XMLRDF deriva de que las reglas, individuales o combinadas, pueden ejecutarse de forma independiente entre sí y el resultado intermedio RDF puede ser inspeccionado rápidamente por el navegador de ClioPatria. Esto permite que el usuario escriba las reglas, evaluando los resultados y adaptando las reglas si fuese necesario (Ibid., 736)

 

3º RDF:

Los datos convertidos a RDF se alojan en el servidor ECuture Git, los archivos de los datos en RDF serían:

 

Actualmente, hay más de 5 millones de triples RDF que describen más de 70.000 objetos patrimoniales de Amsterdam (Isaac; Clayphan; Charles; 2013?).

 

Como indique anteriormente, el Amsterdam Museum utiliza el modelo de datos de Europeana (EDM) en este procedimiento; el EDM soporta múltiples proveedores que describen un mismo objeto, mostrando la procedencia de todos los datos que se enlaza a dicho objeto digital, esto es posible con la incorporación de los recursos proxy-agregación desde el modelo ORE. De este mismo modo, un registro de metadatos del Amsterdam Museum da lugar a un recurso de proxy así como un recurso de agregación; de modo que los RDF triples que constituyen los metadatos del objeto (autor, dimensiones, etc…) tienen el recurso proxy como su fuente, mientras que los que utilizan para la procedencia (proveedor, derechos, etc…) y la representación alternativa (imagen digital) tienen como su fuente el recurso de agregación (Boer et al, 2012).

 

En la figura 3 podemos los pasos que hemos seguido hasta ahora. Es un ejemplo de dicho proceso. En el A) Muestra un fragmento del XML que describe un único registro; B) Resultado de la conversión a RDF; C) Muestra el gráfico, tras la aplicación de las reglas vistas en la figura 2. En este gráfico final, el registro que tiene un URI basado en proxy.

Figura 3. Ejemplo de diferentes pasos.

 

4º Mapeo de esquemas de metadatos:

Se mantienen las clases y propiedades de los datos originales

  • Metadatos de la colección: am-schema.ttl
  • Diccionario de términos-vocabulario: am-thesaurus-schema.ttl
  • Autoridades de persona: am-people-rdagr2-schema.ttl
  • Elementos del RDA: ElementsGr2.rdf

 

paso4

Figura 4. Fragmento de RDF que muestra cómo el mapeo de metadatos garantiza la interoperabilidad.

 

5º Alinear el vocabulario:

Primeramente, se alinea el tesauro del Amsterdam Museum con Europeana (Linked Open Data) vinculándolo a la nuble LOD. La alineación de vocabulario se lleva a cabo con la herramienta Amalgame, que encuentra, evalúa y gestiona los alineamientos del vocabulario. En el siguiente video podéis haceros una idea de su procedimiento y utilidad:

Amalgame builder from Michiel Hildebrand on Vimeo.

 

Una vez visto el video, entenderéis cómo en este caso de estudio se alinean los conceptos del tesauro y las personas de la base de datos.

 

El concepto de tesauro se clasifica en: a) conceptos geográficos identificados en GeoNames (Holandés) y, b) otros conceptos identificados en la versión holandesa del tesauro de Arte y Arquitectura (AATNed). Se produce una vinculación de 143 conceptos a GeoNames y 2.498 a AATNed, usando aquellos con alta calidad. En la figura 5 podéis ver ese flujo:

Figura 4

Figura 5. Alineación del tesauro del Amsterdam Musem

 

Las personas de la base de datos se clasifica en: a) un subconjunto de DBPedia que contiene personas y, b) un subconjunto de Getty’s Union List of Artist Names (ULAN). Nuevamente, usando los de alta calidad, obtienen que 1.076 personas corresponden a la ULAN y 34 a DBPedia. El flujo de trabajo se muestra en la figura 6:

Figura 5

Figura 6. Alineación de personas del Amsterdam Musem

 

Dicha vinculación a GeoNames, ATTNed, ULAN y DBPedia, enriquece el conjunto de datos del Amsterdam Museum; generando los siguientes archivos:

 

6º Publicación como LOD:

El proceso de conversión, mapeado del esquema y alineado del Amsterdam Museun se registra en CKAN. Donde encontramos un ejemplo URI, el enlace con el servidor y un SPARQL endpoint.

Para conocer un ejemplo, pulse aquí

En dicho ejemplo podemos ver tanto el objeto como información descriptiva del mismo. La aplicación basada en RDF permite recuperar los datos en formato legible para la “máquina”, aunque también se pueden acceder a los datos por medio de un SPARQL endpoint (Isaac; Clayphan; Charles; 2013?).

 

 

Os enlazo unas presentaciones realizadas sobre este proyecto, procedentes de slideshare:

http://www.slideshare.net/fullscreen/vdeboer/linked-data-four-rules-and-five-stars-for-the-amsterdam-museum/30

http://www.slideshare.net/vdeboer/linked-data-four-rules-and-five-stars-for-the-amsterdam-museum

http://www.slideshare.net/vdeboer/amsterdam-museum-as-edm-linked-open-data

http://www.slideshare.net/vdeboer/victor-dcl11haarlem#

 

Fuente:

Amsterdam Museum (Web oficial)

Amsterdam Museum Linked Open Data

Amsterdam Museum in Europeana Data Model RDF

Amsterdam Museum as Linked Open Data in the Europeana Data Model

Boer et al. “Supporting Linked Data Production for Cultural Heritage Institutes: The Amsterdam Museum Case Study”. ESWC, vol. 7295, 2012, pp. 733-747.

Isaac, Antoine; Clayphan, Robina; Charles, Valentine. “ThoughtLab: Think with us“. Europeana.profesional (http://pro.europeana.eu/thoughtlab/linked-open-data), [Consultada: 31/03/2014].

 

Anuncios