De ESE a EMD. EDM y linked data. Estándares usados.

Posted on 1 octubre, 2013 por

0


En este segundo post vamos a describir qué es ESE, los problemas que generaba a Europeana, cómo los soluciona EDM y a través de qué estándares.

¿Qué es ESE?

ESE significa “Europeana Semantic Elements”; se trata del precursor de EDM; por lo tanto era un modelo de datos para estructurarlos y representarlos. Hoy en día sería un subconjunto de EDM, ya que EDM engloba a ESE. Europeana nace con este modelo de datos desde un primer momento en el año 2008; algunos autores lo consideran como un prerrequisito indispensable para el lanzamiento de Europeana. Según la propia Europeana, se trata del mínimo común denominador para los distintos estándares de metadatos con los que venían los objetos de las distintas instituciones culturales: EAD (Encoded Archival Description) en archivos, METS (Metadata Encoding and Transmission Standard) para las librerías digitales, LIDO (Lightweight Information Describing Objects) para museos, etc. Pues bien, lo que hace ESE es convertir estos conjuntos de datos a Dublin Core, como nuevo estándar para esos datos.

¿Qué problemas genera esta forma de funcionar?

En primer lugar, y en relación con lo anteriormente dicho, ESE fuerza la interoperabilidad; ello conlleva que se pierdan los metadatos originales. En segundo lugar, tiene la limitación de que impide pasar a un modelo semánticamente rico y funcional, un modelo que permita enlazar a recursos externos y que permita la extensibilidad a modelos más especializados; esto sin duda impedía que se pudiese ir hacia un proyecto con Linked Open Data, más aún cuando ESE no podía incluirse en Linked Data Namespaces.

Soluciones que proporciona EDM y características del mismo.

ESE nació con Europeana en 2008; pues bien, ya desde el verano de 2009 el grupo 1 de tareas del proyecto Europeana Connect se percató de las limitaciones de este modelo de datos; de todo ello nació EDM. EDM hace que Europeana vaya en los pasos de la Web Semántica, y si algo distingue a esta última es la interoperabilidad y la interconexión entre los datos. Para Europeana es fundamental que los distintos recursos estén interrelacionados entre sí; por ello se decidió por el paradigma Linked Open Data. EDM vino a solucionar los anteriores problemas descritos, además:

-Posibilita la participación de Europeana en la Web Semántica, basándola en un proceso abierto, a través de varios dominios y dentro de un marco basado en la Web Semántica.

-Desarrolla un modelo de datos que otorga más enlaces significativos a los datos del patrimonio cultural de Europa. De esta manera enlaza, une, datos tanto de las instituciones colaboradoras de Europeana, como de agentes externos para referenciar a personas, lugares, temas, etc. conectándolos con otras instituciones e iniciativas. Todo este complejo proceso proporciona un enriquecimiento del contenido que habría sido imposible de conseguir por una sola institución.

-Consigue unos resultados respecto a las búsquedas más ricos y una mejor visualización de datos complejos.

Pero ¿a través de que herramientas y cómo realiza esto EDM?

Para llevar esto a cabo, los recursos de Europeana necesitan estar conectados constantemente a Linked Open Data, bien a través de Internet con, por ejemplo, el proyecto Linking Open Data del grupo W3C, que se encarga de divulgar y explicar la Web Semántica, y que a través de una base de datos común que enlaza bases de datos en RDF (Resource Description Framework) y mediante el establecimiento de enlaces RDF; o bien a través de recursos de contextualización semántica propios de Europeana, como tesauros y vocabularios estructurados migrados al estándar SKOS (Simple Knowledge Organization System)

Europeana, al escoger a EDM como modelo de datos, se ha hecho compatible con la web semántica; para ello se ha servido de una serie de herramientas o estándares del W3C, alguna de los cuales ya hemos mencionado y que vamos a explicar brevemente. Estamos hablando de RDF, RDFS, OAI-ORE, SKOS, DC y FOAF.

RDF (Resource Description Framework), Marco de Descripción de Recursos, fue creado en 1997 por W3C; consiste en un sistema de metadatos que sirve para describir recursos electrónicos y que crea un marco genérico de trabajo donde engloba otros tipos de metadatos como por ejemplo Dublin Core. RDF usa URI (Uniform Resource Identifier) para identificar dónde se encuentra el objeto que a continuación se describe (más información en el siguiente enlace)

RDFS (Resource Description Framework Schema), es una especificación del W3C, que explica cómo se debe de usar RDF para describir vocabularios RDF.

OAI-ORE (Open Archives Initiative Object Reuse & Exchange), define estándares para la descripción e intercambio de agregaciones de los recursos. Estas agregaciones, también llamadas conjunto de recursos web, pueden combinar recursos con multitud de formatos como texto, imagen, datos y video. Digamos que permite un enfoque para la identificación y descripción de estos conjuntos de recursos web; es muy útil para Europeana puesto que las representaciones de objetos típicas de Europeana son entidades compuestas de varias partes.
SKOS (Simple Knowledge Organization System) Apoyado por el W3C, define un modelo para el uso de sistemas de organización del conocimiento como pueden ser un tesauro, una lista de encabezamientos de materia, esquema de clasificación y taxonomías dentro del marco de la web semántica. SKOS está preparado para establecer relaciones entre conceptos, para la documentación general sobre los mismos y, sobre todo, para trazar correspondencias entre esquemas conceptuales diferentes, como tesauros que están semánticamente relacionados.
Dublin Core, se usa como modelo compacto para describir las características de objetos culturales o científicos a través de los metadatos; son un conjunto de etiquetas definidas, como por ejemplo creador, o relaciones con otros recursos. Este estándar se utilizaba ya con ESE por lo que permite que las instituciones culturales que mandan sus datos a Europeana lo sigan haciendo de la misma manera y estos sigan siendo compatibles con los ya existentes; de hecho, para las instituciones proveedoras que no quieran  dar descripciones muy minuciosas, este estándar les viene bien en cuanto a simplicidad; además, como DC se usa en muchas aplicaciones de todo el mundo, los datos en este nuevo modelo que es el EDM serían más susceptibles de ser compartidos y reutilizados.

Fuentes:

Antoine Isaac: “The Europeana Data Model” Presentación colgada en la página web de Europeana.

Ana Ríos-Hilario, Diego Martín-Campo y Tránsito Ferreras-Fernández “Linked data y linked open data: su implantación en una biblioteca digital. El caso de Europeana.” El profesional de la Información. Mayo-junio 2012, vol. 21, núm. 3.

“EDM Factsheet” Colgada en la página de Europeana.

“El modelo de datos de Europeana (EDM)”. Meeting: 149. Information Technology, Cataloguing, Classification and Indexing with Knowledge Management. WORLD LIBRARY AND INFORMATION CONGRESS: 76TH IFLA GENERAL CONFERENCE AND ASSEMBLY. 10-15 Agosto 2010, Gotemburgo, Suecia.

Anuncios