Ruben Almarza e Ricardo Eito Brun (Universidad Carlos III de Madrid)
Criteria for the selection of a semantic repository for managing SKOS data
In the last years, institutions and organizations have started paying attention to the semantic data technologies as a key component of their information management infrastructure. A key component in traditional information systems that is expected to have a great relevance in the Semantic Web and linked open data projects are knowledge organization systems: classifications, thesauri, list of subject headings, etc. W3C technical standards for the Semantic Web include the SKOS (Simple Knowledge Organization System) specification for encoding and tagging these knowledge representation tools. The adaptation of an existing knowledge representation system to SKOS requires the conversion and tagging of the data. This is a task that can be easily done by the staff working at libraries, archives and documentation centers, but the conversion of existing materials to SKOS is not enough. Centers need to offer the capability of exploring and using these systems in different ways: e.g. direct search for end-users. To do that, entities need to select and deploy software tools for storing, managing and querying SKOS tools using the SPARQL standard. The complexity of the SPARQL language makes necessary to think on ways to make querying easier for end-users.
This presentation describes the results of assessing two semantic repository tools – GraphDB and Virtuoso – to manage SKOS-based vocabularies and define query interfaces adapted to the relationships between concepts used in SKOS. The result of this research activity includes the design of two alternative query interfaces to help users interact with the SKOS tools when doing complex queries
Criteri per la selezione di un archivio di tipo semantico per la gestione di dati SKOS
Negli ultimi anni, istituzioni e organizzazioni hanno iniziato a porre attenzione alle tecnologie per i dati semantici quali componenti chiave dell’infrastruttura per la gestione delle informazioni. Una componente chiave nei sistemi informativi tradizionali che ci si attende abbia un’ampia rilevanza nei progetti legati al Web semantico e ai linked open data sono i sistemi di organizzazione della conoscenza: classificazioni, tesauri, liste di intestazioni di soggetto ecc. Gli standard tecnici del W3C per il Web semantico includono la specifica SKOS (Simple Knowledge Organization System) per codificare e taggare tali strumenti. L’adattamento di un sistema di rappresentazione della conoscenza esistente a SKOS richiede la conversione e il tagging dei dati. Tale compito può essere compiuto facilmente dagli staff di biblioteche, archivi e centri di documentazione, ma la conversione di materiali esistenti in SKOS non è tutto. Le strutture devono poter offrire la capacità di esplorare e utilizzare questi sistemi in vari modi, ad esempio per la ricerca diretta da parte degli utenti finali. A tal fine, gli enti devono poter selezionare e utilizzare strumenti software per archiviare, gestire e fare ricerche tramite strumenti SKOS utilizzando lo standard SPARQL. La complessità del linguaggio SPARQL rende necessario pensare a soluzioni per facilitare le ricerche da parte degli utenti finali.
La nostra presentazione descrive i risultati della valutazione di due strumenti per l’archiviazione semantica utili a gestire vocabolari basati su SKOS e a definire interfacce di ricerca adattate alle relazioni tra concetti utilizzati in SKOS: GraphDB e Virtuoso. Il risultato di questa ricerca comprende la proposta di due interfacce alternative di query, per aiutare gli utenti finali a interagire con gli strumenti SKOS per ricerche di tipo complesso.
Angela Bellia e Fiammetta Sabba (Università degli studi di Bologna)
Modelli per la comunicazione dei dati di ricerca in archeologia: il caso dei Getty vocabularies come linked open data
Questo intervento presenta i metodi e gli strumenti creati nell’ambito del Getty vocabularies as linked open data. Il progetto esplora modelli innovativi per migliorare la scoperta e l’interpretazione del patrimonio culturale attraverso l’applicazione della tecnologia linked open data (LOD) per archivi digitali. Il progetto è parte del continuo impegno del Getty a rendere le risorse del Getty Research Institute liberamente disponibili a tutti. Con l’obiettivo generale di contribuire a rendere visibile la ricca e diversificata rete di connessioni, il progetto Getty vocabularies as linked open data è un caso di studio di pratiche di creazione LOD e contribuisce alla crescente ricerca di LOD in biblioteche, archivi e musei. Si discuterà su come i Getty vocabularies possano contribuire a creare nuovi modelli e pratiche per la pubblicazione di dati in campo archeologico al fine di alimentare lo studio collaborativo, l’analisi e la condivisione delle informazioni.
Communication patterns for archaeological research data: the case of the Getty vocabularies as linked open data
This paper presents the methods and tools developed within the Getty vocabularies as linked open data. The project aims to explore innovative patterns in order to improve the discovery and interpretation of cultural heritage through the application of linked open data (LOD) technology for digital archives. The project is part of Getty’s ongoing efforts concerning the free open access to the Getty Research Institute’s digital resources. The overall objective of the project is to bring greater visibility to the rich and diverse network of connections. For this reason, the project Getty vocabularies as linked open data is a case study in LOD creation practices: it will contribute to the growing body of research on LOD in libraries, archives and museums. We will discuss how the Getty vocabularies can help in the creation of new patterns and practices for the publication of data in the archaeological field in order to increase the sharing of studies, analysis, and information.
Barbara Bonino, Elena Borgi, Maria Pia Girelli, Gabriella Morabito, Federico Morando, Emanuela Secinaro, Luisa Schiavone e Anna Maria Viotto
(CoBiS – Coordinamento delle biblioteche speciali e specialistiche dell’area metropolitana torinese)
Coordinamento delle biblioteche speciali e specialistiche di Torino: progetto linked open data
Il CoBiS (Coordinamento delle biblioteche speciali e specialistiche dell’area metropolitana torinese) è una rete di 62 biblioteche specialistiche, orientata all’aggiornamento professionale e al miglioramento del servizio all’utenza. Il progetto linked open data (LOD) del CoBiS è il pilota per dotare il Coordinamento di un’infrastruttura per pubblicare LOD, creando una pipeline di triplificazione (trasformazione di dati in linked data) facilmente automatizzabile e replicabile. Tutto ciò utilizzando tecnologie open source, quali il linguaggio di mappatura RML (http://rml.io/), che usa i linked data per descrivere la trasformazione di XML, JSON o dati tabulari in RDF.
La prima sfida del progetto consiste nel riconciliare tra loro fonti di dati eterogenee, provenienti da almeno tre diversi software applicativi: Erasmo, SBNWeb e BIBLIOWin. Eterogenee saranno anche le tipologie di dati collegati: dati catalografici, contenuti multimediali, dati di tipo archivistico gestiti col software xDams. Grazie all’interlinking, si collegheranno le informazioni contenute nei cataloghi a fonti esterne, in particolare Wikidata, VIAF ed il Nuovo soggettario della Biblioteca nazionale di Firenze. Ciò non solo nell’ottica della connessione delle informazioni relative alle collezioni del CoBiS al resto del mondo, ma anche viceversa, rendendo veramente accessibili e visibili online le biblioteche del Coordinamento.
Coordination of the special and specialized libraries of Turin: linked open data project
The CoBiS (Coordinamento delle biblioteche speciali e specialistiche dell’area metropolitana torinese) is a network formed by 62 specialized libraries, in order to support continuing professional development and to offer a better service to the users. The linked open data (LOD) project of the CoBiS is a pilot to endow the Coordinamento with an infrastructure to publish LOD, creating a triplification pipeline (i.e., a pipeline to create linked data) designed to be easy to automate and replicate. All that using open source technologies, such as the RML mapping language (http://rml.io/) that uses linked data to describe the transformation of XML, JSON o tabular data into RDF.
The first challenge for the project consist in the reconciliation of several heterogeneous data sources, produced by three different pieces of software: Erasmo, SBNWeb e BIBLIOWin. Also the kind of linked data will be diverse: cataloging data, multimedia content, archive data managed using xDams. The interlinking with external data sources will concern, in particular, Wikidata, VIAF and the Nuovo soggettario (subject indexing) of the National Library of Florence. This will be done not only in order to connect informations available within the CoBiS network to the rest of the World, but also, conversely, to make the CoBiS libraries actually visible and accessible online.
Francesca Maria D’Agnelli, Laura Gavazzi, Adriano Belfiore, Claudia Guerrieri, Maria Teresa Rizzo, Silvia Tichetti (Gruppo di lavoro sugli authority file. Ufficio Nazionale per i beni culturali ecclesiastici. Conferenza episcopale italiana)
Gli authority file per l’integrazione cross-domain dei beni culturali: riflessioni su un approccio alla lettura trasversale dei beni culturali della Chiesa cattolica italiana
BeWeb rende possibile l’esplorazione del patrimonio culturale delle diocesi italiane fatto di beni storico artistici, librari, archivistici, edifici di culto e istituti culturali, attraverso la ricerca cross domain, gli approfondimenti tematici e il costante authority work sulle entità (persone, enti, famiglie, luoghi…), a vario titolo relazionate con i beni e con gli altri contenuti informativi del portale.
La sfida principale? Individuare i punti di accesso – authority files – per navigare trasversalmente banche dati che descrivono beni culturali di diversa natura, e potenziare le relazioni tra gli oggetti rendendoli capaci non solo di interoperare ma anche di ‘illustrarsi e introdursi’ vicendevolmente, in modo sinottico e integrato.
United they stand, coherently: reflections on an AF-based cross domain approach in documenting the Italian catholic church cultural heritage
BeWeb makes it possible to explore the cultural heritage of the Italian Dioceses – the historical and artistic, library and archival heritage, worship-allocated buildings and cultural institutions – through the cross domain research, the thematic in-depth examinations and the constant authority work on entities (people, organizations, families, places…) in various ways related to the goods and the other information contents of the portal.
What is the main challenge? It is to identify the access points – authority files – to browse across the board databases that describe the different cultural heritage, and strengthen connections between objects making them not only capable of interworking but also of illustrate and introduce themselves mutually, in a synoptic and integrated way.
Marilena Daquino e Francesca Tomasi (Università degli studi di Bologna)
L’archivio fotografico Zeri in linked open Data
La Fototeca Zeri di Bologna è uno dei primi archivi fotografici di opere d’arte ad avere avviato un progetto per la conversione del proprio patrimonio informativo in linked open data. La prima fase del progetto Zeri & LODE, condotta su un set di oltre 30.000 fotografie di opere d’arte moderna, ha previsto quale buona pratica l’utilizzo di modelli di riferimento per il settore museale e bibliografico, come CIDOC-CRM e alcune delle SPAR Ontologies. Al riuso di modelli esistenti si è affiancata la creazione di due ontologie ad hoc, OA Entry Ontology ed F Entry Ontology, quale attività necessaria a rappresentare l’eterogeneo scenario descrittivo fornito dagli standard di catalogazione ministeriali Scheda F e Scheda OA, prevedendo al contempo l’importazione di classi e predicati utili a garantire la massima espressività del dominio (i.e. FaBIO, PRO, CiTO, FRBR, PROV-O e in particolare la nuova ontologia HiCO). Lo step successivo è stata la pubblicazione del primo dataset completo in RDF, secondo le specifiche di una suite di ontologie integrate.
The Zeri Photo Archive in linked open data
The Zeri Photo Archive is one of the first main actors in the domain of photographs of artworks who transformed its heritage in linked open data. In the first phase of the Zeri & LODE project, a subset of 30.000 catalog entries of photographs depicting artworks of modern art has been transformed in RDF, according to relevant ontologies for the museal and bibliographic domains, like CIDOC-CRM and SPAR Ontologies. A couple of ad hoc ontologies, OA Entry Ontology and F Entry Ontology, have been realized to represent the heterogeneous scenario provided by the two italian metadata content standards OA Entry and F Entry, guaranteeing at the same time the import of classes and predicates necessaries to ensure the maximum expressiveness of the domain (i.e. FaBIO, PRO, CiTO, FRBR, PROV-O and, in particular, the new ontology HiCO). The next step has been the publication of the first comprehensive RDF dataset, according to a suite of integrated ontologies.
Filipe Ferreira, Rodolfo Matos, Susana Medina, Maria Manuela Pinto, Augusto Ribeiro e João Rua (Museu digital. Universidade do Porto)
U. Porto digital museum: towards convergence in university’s heritage resources management.
The University of Porto aims to promote its scientific and cultural heritage providing the aggregation of existing digital collections (archives, libraries and museums’ digital assets and remaining information systems/repositories), by developing and maintaining an information system with a single online discovery point: the U. Porto Digital Museum. To enrich the already existing collections, the project also contemplates the development of a dynamic and scalable technological platform – the OpenLab – which will enable the academic community and external players to participate in the process of co-creation and (re)using of this university’s heritage digital contents. Both application and technologic platform will be referred to the integrated management of museum collections metadata and any other related information. It will also ensure interoperability between different technological platforms and a long term digital preservation repository.
This paper will describe and discuss the model and the development of this process which has an embedded value of normalization embodied in the use of standards, such as CIDOC-CRM for metadata and SPECTRUM 4.0 for museum procedures, and an interdisciplinary theoretical approach which joins museology, information science and information systems. From the team’s point of view, the goals we wanted to achieve and the issues we needed to address before setting up this project will be examined. Finally, factors contributing to the success of the experience and the obstacles that challenged the process will be discussed.
Il museo digitale U. Porto: verso la convergenza nella gestione delle risorse culturali universitarie
L’Università di Porto intende promuovere il proprio patrimonio culturale e scientifico attraverso l’aggregazione di collezioni digitali esistenti (gli asset digitali di archivi, biblioteche e musei e di altri archivi e sistemi informativi istituzionali), mediante lo sviluppo e la gestione di un sistema informativo che sia accessibile da un unico portale web: il Museo Digitale U. Porto. Per arricchire le collezioni già esistenti, il progetto contempla anche lo sviluppo di una piattaforma tecnologica dinamica e scalabile chiamata OpenLab, che assicurerà alla comunità accademica e a utenti esterni di partecipare al processo di co-creazione e (ri)utilizzo dei contenuti digitali dell’Università. Sia l’applicazione sia la piattaforma tecnologica interagiranno con la gestione integrata dei metadati delle collezioni museali e di ogni altra informazione collegata. Verrà inoltre assicurata l’interoperabilità fra piattaforme tecnologiche diverse e un archivio istituzionale per la preservazione digitale a lungo termine.
Il contributo descriverà e discuterà il modello e lo sviluppo di tale progetto, significativo in quanto include la normalizzazione attraverso l’utilizzo di standard come il CIDOC-CRM per i metadati e SPECTRUM 4.0 per le procedure museali, e un approccio teorico interdisciplinare che accorpa la museologia, le scienze dell’informazione e i sistemi informativi. Verranno esaminati, dal punto di vista del gruppo di lavoro, gli obiettivi e le questioni aperte da risolvere nel momento in cui è stato ideato il progetto. Infine, verranno discussi i fattori che hanno contribuito al successo e gli ostacoli che hanno rallentato i risultati ottenuti con questa esperienza.
Agnese Galeffi, Andrea Marchitelli, Patrizia Martini e Lucia Sardo (Scuola vaticana di biblioteconomia, CINECA e ICCU)
Coming AUTH: per una bonifica e implementazione dell’authority file di SBN
Il progetto Coming AUTH è un progetto volto all’implementazione dell’authority file di SBN, con una modalità professionale e una modalità aperta al mondo non bibliotecario. La modalità professionale, grazie alla collaborazione fra ICCU e AIB Lazio, prevede il coinvolgimento di giovani professionisti; la scelta delle entità da bonificare verrà decisa in base alle esigenze dei diversi poli coinvolti, in una ottica di cooperazione a livello regionale.
La modalità social, avverrebbe tramite un servizio Mix’n’match come quello sviluppato da Wikimedia, invitando gli utenti, previa registrazione, a confermare la corrispondenza o meno di entità di diversa natura tratte da fonti diverse. La modalità social vorrebbe anche aprire SBN agli utenti, favorendo la partecipazione di non addetti ai lavori, aumentando la visibilità di SBN e dei progetti a esso collegati, con la possibilità di un coinvolgimento attivo anche del mondo Wikimedia.
Coming AUTH: a project for authority data enrichment and deduplication in SBN
The Coming AUTH project is about the enrichment and deduplication of authority data in SBN catalogue; the project will have both a professional procedure and a social one. Thanks to the cooperation between ICCU and AIB Lazio, the first one involves young professionals, and the choice of the data to be enriched will be decided later on.
The second one will take advantage of services like Wikimedia Mix’n’match, and will be open to everyone; anyone could register and then try to match the names of different entities.In doing so, we will be able not only to clean and enrich the authority data, but also to improve the visibility of the SBN catalogue and the participation of users to its improvement.