domingo, 11 de diciembre de 2011

A barajar y repartir: publicar y reutilizar datos en Linked Open Data

El pasado dia 6 de diciembre tuvo lugar en Rotterdam el Council of Content Providers and Aggregators General Meeting, en el que participé como miembro del CCPA y del Core Technical Group. Las presentaciones pueden encontrarse aquí, aunque seguramente cambiarán de dirección puesto que el sitio Europeana Professional está todavía en construcción e irá sustituyendo paulatinamente a Europeana versión1.
Entre los temas de la agenda: el Business Plan para 2012 que tiene, en el borrador que se ha presentado y discutido, como objetivo alcanzar la implementación plena de Europeana Data Model, el sabor europeo de Linked Open Data. Las actividades claves de Europeana son Agregar, Facilitar, Distribuir y Atraer. Es decir, abrir datos, vincular datos y publicarlos y construir aplicaciones que atraigan a diferentes usuarios. Entre los detalles de los Key Performance Indicators para 2012: buscar la participación de editores, ampliar el contenido a otros medios como los materiales audiovisuales e implementar completamente EDM en el flujo de trabajo de ingesta de datos. Y todo ello afecta a los LAM que participan en Europeana en un camino de ida y vuelta, abrir datos y reutilizar. Es también previsible que se tomen importantes acuerdos acerca de la estructura organizativa de Europeana y, sobre todo, se proceda a hacer oficial el Europeana Data Exchange Agreement que, entre otras muchas cosas, aboga decididamente por el Creative Commons Universal Public Domain Dedication, y, lo que es más importante, incluye la autorización para la reutilización de los contenidos agregados por Europeana a cargo de terceras partes. El estado de la cuestión en lo que se refiere al Europeana Data Model se ha visto consolidado con la edición de una serie de documentos: el Europeana Data Model Primer, que solventa desde un punto de vista práctico la implementación del Europeana Data Model en su versión 3.2.2 y que actua claramente a modo de directrices. El documento apareció el 26 de octubre de 2011. Al día siguiente apareció publicado el Europeana Data Model Mapping Guidelines en el que se describen minuciosamente las directrices para transformar los documentos a los namespaces y clases, tanto básicas como contextuales, de EDM mediante un amplio conjunto de tablas y propiedades. El mismo día 27 de octubre apareció publicado un documento análogo a los dos primeros, el Europeana Data Model Fact Sheet, mucho más resumido y dirigido a los denominados policy makers, es decir, no tanto para técnicos sino para quiénes deben de tomar decisiones basándose en premisas técnicas.
Desde luego Europeana está ejerciendo un importantísimo liderazgo en este sentido, sus especificaciones funcionales, su modelo de datos y su normativa está contribuyendo a delimitar un camino que muchos LAM encuentran más efectivo no andar en solitario. Desde el White Paper de Stefan Grandman al Informe Final del W3C Library Linked Data Incubator Group, Linked Open Data tiene un efecto fundamental en archivos, bibliotecas y museos que no es otro que el de ampliar el ámbito de aplicación de los datos que generan los LAM y, sobre todo, el de ampliar los puntos de vista y análisis de la información. Linked Open Data (LOD) es, en definitiva, abrir datos, enlazar datos, publicar datos enlazados; el papel de los LAM es aportar y reutilizar. Con toda seguridad, en el marco de LOD, y como así ha sido tradicionalmente, no solo se puede adoptar el papel de publicar o reutilizar, ambas funciones pueden y deben realizarse.
Así lo está haciendo la Fundación Ignacio Larramendi que el pasado día 17 de noviembre con el motivo de la celebración de su XXV Aniversario anunció la Biblioteca Virtual de la Escuela de Salamanca. Desde el primer momento, las Bibliotecas Virtuales FHL se han caracterizado por seguir muy de cerca todos los procesos de normalización que se han ido avanzando en el mundo y, muy en particular, dado que España forma parte de la Unión Europea desde principios del siglo XXI, la normativa de Europeana. Lo que había de hacerse, y así se está haciendo, es aplicar el modelo de Linked Open Data tanto a los autores como a las obras de esos autores que constituyen la Escuela de Salamanca.
Se trata de editar en abierto, es decir en Open Access, esos objetos digitales y se trata también de vincular esos objetos digitales con otros, utilizando una tecnología concreta, Linked Open Data. En cualquier registro de autoridad de la Escuela de Salamanca confluyen muchas normas: FRAD, RDAMARC 21, Linked Open Data. Todos los autores están enlazados a VIAF y a DBpedia y próximamente seguirán muchos otros vínculos a la Lista de Encabezamientos de Materia para las Bibliotecas Públicas (LEM) y a través de ellas a LCSH, RAMEAU y SWD
Reutilización, pero también publicación, todos esos datos vinculados están disponibles en EDM. El software utilizado está desarrollado en España y no tiene un coste solo asumible por grandes instituciones, sino casi por cualquier tipo de institución. El programa DIGIBIB, sobre el que está implementada la Biblioteca Virtual Ignacio Larramendi de Polígrafos y muy especialmente la Biblioteca Virtual de la Escuela de Salamanca, se ajusta como un guante al conjunto de normativas citado. La Biblioteca Virtual de Polígrafos es el campo de pruebas de los desarrollos que se van añadiendo a DIGIBIB fruto de una constante tarea de vigilancia tecnológica. Nuestro objetivo para el 2012 es alcanzar las 5 estrellas Linked Open Data. Linked Open Data en su conjunto ofrece, además, una serie de ventajas: publicar significa depurar los datos, revisarlos, asegurar su calidad, pero también seleccionar fuentes adecuadas a lo que se quiere mostrar, ampliar el flujo de trabajo para incluir en los procesos de catalogación e indización la vinculación con fuentes de datos externas, desarrollar aplicaciones para que este proceso, como se hace en la Biblioteca Virtual de la Escuela de Salamanca, sea semiautomático. En definitiva, bibliografía y biblioteconomía del siglo XXI.

No hay comentarios: