Bibliotime, XIV, 2 - Antonella De Robbio e Silvia Giacomazzi, Dati aperti con LODe

Esso risponde alla richiesta di un modello di codifica specifico per i dati bibliografici, al fine di produrre correlazione e scambio di dati. Il produttore di contenuti bibliografici che intenda pubblicare un database dovrà tener conto di entità e relazioni specifiche (tema, risorse, agente), necessariamente coinvolte nella descrizione della risorsa bibliografica. Le proprietà che secondo questo modello sono da considerarsi significative e utili per la pubblicazione di dati LODready sono:

La scelta, nella preparazione di metadati LODready, deve ricadere su standard ampliamente utilizzati nella comunità e su vocabolari LODe sempre più diffusi all'interno di quest'ultima.

In merito alla scelta dello standard per i metadati, specifico è il ruolo degli "alberi decisionali" che forniscono assistenza nel processo di selezione e si presentano come diagrammi di flusso che individuano le proprietà rilevanti in ciascuno dei nove gruppi. Ogni diagramma di flusso, infatti, a partire dalla specifica risorsa, presenta i principali punti decisionali e offre supporto per la soluzione dei principali problemi di codifica dei metadati.

Ogni albero decisionale è progettato per facilitarne la selezione delle strategie appropriate nelle più svariate situazioni ed esigenze. Al termine di ogni diagramma di flusso ci sono insiemi di termini alternativi per la selezione dei metadati. Ogni grafico è seguito da spiegazioni testuali, con note ed esempi e tabelle esplicative. Così si presentano le strutture promosse per la diffusione sempre più organizzata di sistemi volti alla totale apertura e fruibilità dei dati LODe.

Non è più solo importante fornire i dati in un formato aperto, ma risulta fondamentale munire i dati degli step utili a comprendere gli sviluppi che sono intervenuti su tali dati, rendendo anche graficamente i processi intervenuti sui dati stessi tramite visualizzazioni in mappe concettuali e diagrammi di flusso. Se tutto il processo risulta trasparente, il dato può essere riutilizzato nelle sue singole fasi, tramite link adeguati. Il web 2.0 e l'uso di feed possono essere di un certo interesse non solo in termini di trasparenza di dati pubblici o provenienti dal mondo della ricerca, ma nella manipolazione stessa del dato pubblico, inteso come bene comune.

Chiudiamo con una citazione tratta da un post di Gavin Starks pubblicato sul blog di Tim O'Reilly [92]:

Antonella De Robbio, CAB Centro di Ateneo per le Biblioteche - Universita' degli Studi di Padova e-mail: antonella.derobbio@unipd.it

Note

[1] <http ://wiki .openarchives .it /index .php /Open _Access ,_Open _Data ,_E -_research>.

[2] L'Open Knowledge Foundation è un'organizzazione non-profit fondata nel 2004, con lo scopo di promuovere la conoscenza aperta, nel tentativo di render sempre più ampia ed organizzata la condivisione di dati di diversa natura (dati statistici, geografici, bio-medici, ecc.), per renderli utilizzabili, riutilizzabili, ridistribuiti per scopi sociali benefici. L'Open Knowledge Foundation sostiene l'apertura di una serie di iniziative, in particolare, quelle legate all'Open Data. Esso copre: a) l'ambito scientifico, storico, geografico; b) l'ambito dei contenuti, come musica, film, libri; c) l'ambito governativo e delle altre informazioni amministrative. I dati sono contenuti all'interno del campo di applicazione della Open Knowledge Definition, che allude al protocollo Science Commons per l'implementazione dell'accesso aperto ai dati. Cfr. <http ://it .wikipedia .org /wiki /Open _knowledge>.

[3] Da Wikipedia: "gli Standard per la Gestione dell'Informazione sull'Agricoltura (AIMS), sono un'iniziativa promossa dalla FAO allo scopo di migliorare la coerenza tra i sistemi informativi agricoli. Primo obiettivo del progetto è la creazione di un 'clearing house' per gli standard di gestione dell'informazione. Ciò servirà a rendere interoperabili i sistemi informativi agricoli esistenti e quelli nuovi e a condividere e promuovere l'adozione di metodologie, standard e applicazioni comuni".

[4] Se poi tale elaborazione che consente al dato di divenire informazione sia frutto della mente umana o anche di un'elaborazione automatica, è ulteriore questione da analizzare anche nell'ottica delle nuove frontiere che riguardano l'analisi automatica dei dati, come l'analisi testuale.

[5] Studioso di cibernetica, psicologo, linguista britannico.

[6] Gregory Bateson - Mary Catherine Bateson, Dove gli angeli esitano. Verso un'epistemologia del sacro, Milano, Adelphi, Milano, 1989.

[7] Da Wikipedia, <http://it.wikipedia.org/wiki/Dato>.

[8] "Con l'espressione 'Open Government' - letteralmente 'governo aperto' - si intende un nuovo concetto di Governance a livello centrale e locale, basato su modelli, strumenti e tecnologie che consentono alle amministrazioni di essere "aperte" e "trasparenti" nei confronti dei cittadini. In particolare l'Open government prevede che tutte le attività dei governi e delle amministrazioni dello stato debbano essere aperte e disponibili, al fine di favorire azioni efficaci e garantire un controllo pubblico sull'operato" (<http ://it .wikipedia .org /wiki /Open _government>).

[9] A questo proposito vogliamo citare l'iniziativa di innovatoripa (<http://www.innovatoripa.it/>), rete sociale composta da persone che condividono l'interesse per il tema dell'innovazione e del cambiamento nella pubblica amministrazione italiana.

[10] Peter Murray-Rust, Open Data in Science. Available from Nature Precedings (2008), traduzione a cura delle autrici, <http://hdl.handle.net/10101/npre.2008.1526.1>.

[11] Anna Gold, Cyberinfrastructure, Data, and Libraries, Part 1: A Cyberinfrastructure Primer for Librarians, "D-Lib Magazine", 13 (2007), n. 9/10, <http://www.dlib.org/dlib/september07/gold/09gold-pt1.html>, traduzione a cura delle autrici.

[12] Da Wikipedia, <http ://it .wikipedia .org /wiki /Dati _aperti>.

[13] L'Open Data Foundation (ODaF) è una fondazione statunitense senza senza scopo di lucro che ha lo scopo di promuovere l'adozione globale di metadati standard e lo sviluppo di soluzioni open-source per la gestione e l'uso di dati statistici. L'OdaF si concentra sul miglioramento dei dati, l'accessibilità dei metadati e la qualità generale a sostegno della la ricerca, il processo decisionale, la trasparenza in materia sociale e nelle scienze economiche (SBE).

[14] <http://www.opendatafoundation.org/ODaF_brochure.pdf>, traduzione a cura delle autrici.

[15] Fondazione no profit con lo scopo di promuovere l'apertura di contenuti e di dati, creata il 24 maggio 2004 da Peter Murray-Rust, <http://okfn.org/>.

[16] <http://www.opendatacommons.org/>.

[17] Informazioni desunte dalla pagina Facebook <http://www.facebook.com/pages/Open-Knowledge-Foundation/138241222868769>.

[18] La definizione di conoscenza aperta è stata tradotta in ben 23 lingue diverse. La versione italiana è stata curata da Primavera De Filippi, Andrea Glorioso e Juan Carlos De Martin dello NEXA, Center for Internet & Society, del Politecnico di Torino, <http://www.opendefinition.org/okd/italiano/>.

[19] <http ://openbiblio .net />.

[20] <http ://openbiblio .net /principles /it />.

[21] <http://openbiblio.net/principles/endorse/>.

[22] <http://bonariabiancu.wordpress.com/tag/oclc/>.

[23] Si veda l'articolo dall'eloquente titolo sul blog di Dave Pattern (Self plagiarim is style), citato sempre da Bonaria Biancu, <http://www.daveyp.com/blog/archives/528>. I dati di utilizzo si possono recuperare in modalità completamente aperta e libera, <http://library.hud.ac.uk/data/usagedata/>.

[24] <http://gs-service-bookdata.web.cern.ch/gs-service-bookdata/announcement.html>.

[25] <http://www.opendatacommons.org/licenses/>.

[26] <http://obd.jisc.ac.uk/>.

[27] <http://obd.jisc.ac.uk/navigate>.

[28] <http://obd.jisc.ac.uk/examples>.

[29] <http://ckan.net/tag/library>.

[30] Per approfondimenti si rimanda a Antonella De Robbio, La tutela giuridica delle banche nel diritto d'autore e nei diritti connessi, 1999, <http://eprints.rclis.org/bitstream/10760/4012/1/dbthesis.pdf>.

[31] OCLC (Online Computer Library Center) è un'organizzazione non-profit che agisce a livello mondiale e che fornisce alle biblioteche aderenti servizi per il recupero, la catalogazione e la conservazione dei libri.

[32] L'interessante dibattito può essere seguito a questo link: <http://blog.okfn.org/2011/06/06/oclc-worldcat-rights-and-responsibilities-and-open-data-licensing/>, mentre le relative policy si possono visionare qui

<http://www.oclc.org/worldcat/recorduse/policy/default.htm>.

[33] <http://blog.andreamarchitelli.it/2008/11/nuova-policy-per-luso/>.

[34] Le vecchie linee guida furono stilate nel 1987:

<http://www.oclc.org/support/documentation/worldcat/records/guidelines/default.htm>.

[35] <http://www.oclc.org/worldcat/catalog/policy/default.htm>.

[36] <http://www.librarything.com/wiki/index.php?title=OCLC_Policy_Changes&diff=11748&oldid=11747>.

[37] Rete globale di servizi alle biblioteche che permette alle stesse di essere maggiormente interoperabili e aperte.

[38] Tra i quali FirstSearch, servizio di reference basato sull'aggregazione di banche dati di OCLC e commerciali, o ECO, Electronic Collections Online. Vedi le informazioni sul sito di IFNET, <http://www.ifnet.it/oclc/>.

[39] <https://creativecommons.org/about/cc0>.

[40] WorldCat Rights and Responsibilities for the OCLC Cooperative,

<http://www.oclc.org/worldcat/recorduse/policy/default.htm>.

[41] <http://www.oclc.org/about/purpose/default.htm>.

[42] <http://www.opendatacommons.org/licenses/by/summary/>.

[43] <http://www.opendatacommons.org/licenses/pddl/summary/>.

[44] <http://www.opendatacommons.org/licenses/by/>.

[45] A proposito di progetti Linked Open Data in seno a OCLC, si rimanda alle due esperienze di piattaforme prototipali VIAF: The Virtual International Authority File (http://viaf.org/) e Dewey Decimal Classification/Linked Data http://dewey.info/>, spazi sperimentali che usano sottoinsiemi di dati da WorldCat.

[46] Si tratta di Jordan Hatcher, definito su twitter come "geek, gamer and IP/technology lawyer with a penchant for open licensing. Founder, OpenDataCommons.org; Boardmember, okfn.org" (<http://twitter.com/#!/jordanhatcher>).

[47] A riguardo si veda l'articolo di Fabio Deotto pubblicato su "Wired" del 13 settembre 2010, Open Government: in Italia si comincia, <http://daily.wired.it/news/politica/open-government-in-italia-si-comincia.html>.

[48] <http://www.dati.piemonte.it/>.

[49] <http://www.formez.it/iodl/>.

[50] Un esempio si trova a <http://www.datagov.it/> iniziativa che nasce da parte di un gruppo di esperti di diritto e di nuove tecnologie, funzionari pubblici e privati, docenti universitari ed altri componenti della società civile che si sono riuniti nell'Associazione Italiana per l'Open Government con l'obiettivo di sensibilizzare cittadini, imprese ed Amministrazioni e promuovere l'attuazione di strategie di Open Government nel nostro Paese. Per il manifesto dell'Open Government si vada <http://www.datagov.it/il-manifesto/>.

[51] <http://www.quotidianamente.net/cronaca/fatti-dallestero/la-nuova-costituzione-islandese-si-scrive-via-facebook-e-twitter-1593.html>.

[52] Christian Morbidoni - Michele Barbera - Federico Ruberti, LinkedOpenData.it: una piattaforma italiana per i dati "aperti" e "collegati", <http ://www .linkedopendata .it>.

[53] <http://www.spaghettiopendata.org/>.

[54] <http://it.ckan.net/about>.

[55] <LinkedOpenData .it>.

[56] <http ://linkeddata .org /faq>.

[57] Open Knowledge Foundation Italia>, coordinato da Stefano Costa, <http://it.okfn.org/>. Gli incontri sono ospitati sul sito

<http://okfnpad.org/openbiblio-italia>; chiunque volesse partecipare può iscriversi liberamente.

[58] Al link <http://it.okfn.org/> si possono trovare news, eventi, report e materiali vari, che testimoniano l'attività del gruppo di lavoro Open Knowledge Foundation Italia.

[59] Oltre a Karen Koyle, bibliotecaria all'Università di Berkeley, membro del gruppo di lavoro internazionale OKFN sui dati bibliografici, fanno parte del gruppo italiano anche Andrea Zanni (Wikimedia Italia e Alma DL, Università di Bologna), Francesca Di Donato (Università di Pisa e Associazione Linked Open Data), Karen Coyle (Università di Berkeley emembro del gruppo di lavoro internazionale OKFN sui dati bibliografici), Stefano Costa (Università di Siena e coordinatore italiano di Open Knowledge Foundation).

[60] Documento tradotto in italiano.

[61] Relazioni al blog: <http://it.okfn.org/2011/05/30/openbiblio-italia-prima-puntata/>.

[62] Da Wikipedia, <http ://it .wikipedia .org /wiki /Dati _aperti>.

[63] <http://it.wikipedia.org/wiki/Dati_aperti>.

[64] "In informatica, open source (termine inglese che significa sorgente aperto) indica un software i cui autori (più precisamente i detentori dei diritti) ne permettono, anzi ne favoriscono il libero studio e l'apporto di modifiche da parte di altri programmatori indipendenti. Questo è realizzato mediante l'applicazione di apposite licenze d'uso. La collaborazione di più parti (in genere libera e spontanea) permette al prodotto finale di raggiungere una complessità maggiore di quanto potrebbe ottenere un singolo gruppo di lavoro. L'open source ha tratto grande beneficio da Internet, perché esso permette a programmatori geograficamente distanti di coordinarsi e lavorare allo stesso progetto" (<http ://it .wikipedia .org /wiki /Open _source>).

[65] "Il concetto di opera libera (dal francese '�uvre libre') o di opera a contenuto libero (dall'inglese 'Open Content') trae la sua ispirazione da quello di Open Source (sorgente libera): la differenza sta nel fatto che in un'opera di contenuti su Internet ad essere liberamente disponibile ed utilizzabile non è il codice sorgente del programma software che li genera, ma i contenuti editoriali generati dal programma, quali testi, immagini, musica e video. Non tutti i contenuti appartenenti a questa categoria sono liberamente disponibili e riproducibili allo stesso modo. Spesso i termini e le condizioni di utilizzo, riproduzione e di modifica dei contenuti, vengono stabiliti da una licenza di pubblicazione che viene scelta dall'autore (<http ://it .wikipedia .org /wiki /Contenuto _libero>).

[66] <http ://it .wikipedia .org /wiki /Open _knowledge>.

[67] <http ://it .wikipedia .org /wiki /Accesso _aperto>.

[68] <http://www.opendatacommons.org/>.

[69] <http://www.opendefinition.org/>.

[70] <http ://it .okfn .org /2011/02/19/linkedopendata -it -una -piattaforma -italiana -per -i -dati -%E 2%80%9 Caperti %E 2%80%9 D -e -%E 2%80%9 Ccollegati %E 2%80%9 D />.

[71] Per quanto riguarda la differenza tra Semantic web e Linked data si hanno pareri che si discostano un po', comunque una visione diffusa è che il Semantic Web è costituito da Linked Data, ossia il Semantic Web è il tutto, mentre Linked Data è la parte. Tim Berners-Lee, inventore del web e persona autore dei termini Semantic Web e Linked Data, ha spesso descritto Linked Data come "Semantic Web done right" (<http ://linkeddata .org /faq>).

[72] <http://it.okfn.org/2011/02/19/linkedopendata-it-una-piattaforma-italiana-per-i-dati-%E2%80%9Caperti%E2%80%9D-e-%E2%80%9Ccollegati%E2%80%9D/>.

[73] <http ://semanticweb .org /wiki /Main _Page>.

[74] <http ://www .linkeddatatools .com /semantic -web -basics>.

[75] <http ://linkeddata .org /home>.

[76] Un "dereferenceable Uniform Resource Identifier" o "dereferenceable URI" è un meccanismo di recupero delle risorse che utilizza uno dei protocolli di Internet per ottenere una copia o rappresentazione della risorsa che identifica. In altri contesti non-dereferenceable, come XML Schema, l'identificatore di namespace è ancora un URI, ma questo è semplicemente un identificativo. Nel modello Linked Data, la rappresentazione assume la forma di un documento (di solito HTML o XML) che descrive la risorsa che l'URI identifica (<http://en.wikipedia.org/wiki/Dereferenceable_Uniform_Resource_Identifier>).

[77] <http ://it .okfn .org /2011/02/19/linkedopendata -it -una -piattaforma -italiana -per -i -dati -%E 2%80%9 Caperti %E 2%80%9 D -e -%E 2%80%9 Ccollegati %E 2%80%9 D />.

[78] <http ://www .titticimmino .com /2010/07/27/linked -open -data -cui -prodest -pensieri -sparsi -su -dati -piemonte -it />.

[79] <http://lod-cloud.net/>.

[80] Semantic Web Education and Outreach (SWEO) Interest Group, <http ://semanticweb 30.wordpress .com /2009/01/25/linking -open -data -e -dbpedia />.

[81] Per citare unimportante progetto compreso nel LOD, Dbpedia lavora sugli articoli raccolti in Wikipedia, offrendone al web la versione RDF (fondamentale per l'interrogazione e il riutilizzo) e strutturando connessioni tra domini diversi. Il progetto crea una rete informativa sostanziosa, arricchita ancor più da risorse appartenenti a sorgenti diverse (Geonames).

[82] RDF, o Resource Description Framework, è uno strumento per la codifica, lo scambio e il riutilizzo di metadati strutturati. Esso si basa su alcuni presupposti fondamentali: sottende il fatto che qualsiasi elemento può essere identificato da un particolare URI (Universal Resource Identifier); richiede un linguaggio il meno espressivo possibile per la descrizione e la definizione degli elementi; fa capo all'enunciato "Qualunque cosa può dire qualunque cosa su qualunque cosa".

[83] JavaScript Object Notation semplice formato per lo scambio di dati che utilizza convenzioni proprie dei linguaggi di programmazione della famiglia del C, come C, C++, C#, Java, JavaScript, Perl, Python, ecc...

[84] Si dice che un software è dotato di una API quando fornisce un meccanismo attraverso il quale i programmi esterni sono in grado di comunicare con esso permettendo lo scambio di dati. API permette lo scambio di dati tra siti web, applicazioni e organizzazioni, mentre l'origine dei dati rimane nello stesso luogo. Le applicazioni create con le API sono comunemente chiamati mashup, combinando i dati e le funzionalità di diversi programmi. Per esempio, le API consentono di afferrare le statistiche da un sito web e la pubblicazione su un altro sito web. In questo modo non è necessario accedere a siti web singolarmente, ma si possono immediatamente combinare dati tratti da siti diversi.

[85] Sean Bechhofer et al., Why Linked Data is Not Enough for Scientists, Sixth IEEE e�Science conference (e-Science 2010), Brisbane, 2010, <http://eprints.ecs.soton.ac.uk/21587/>, traduzione a cura delle autrici.

[86] Ibid.

[87] Ibid.

[88] <http://aims.fao.org/lode/bd>.

[89] Per una più puntuale trattazione della tematica, si rimanda alla presentazione tenuta all'euroCRIS Meeting di Bologna il 26-27 aprile 2011 da Imma Subirats (FAO of the United Nations) e Marcia Zeng (Kent State University) dal titolo "Metadata: Concentrating on the data, not on the scheme", <http://www.eurocris.org/Uploads/Web%20pages/members_meetings/201105%20-%20Bologna,%20Italy/Italian%20session%20-%20Imma%20Subirats.ppt>.

[90] Ibid.

[91] Ibid.

[92] <http://radar.oreilly.com/2010/06/data-is-not-binary.html>.

Abstract

1. Introduzione all'Open Data

2. Introduzione al concetto di dato verso i territori dell'Open Data

3. Definizioni e origine dell'Open Data

4. La definizione dell'Open Data Foundation

5. Open bibliographic data (OpenBiblio)

7. Open Data in Italia

8. La filosofia che sottende l'Open Data

9. Quanto aperti devono essere i dati?

10. Il ruolo del web semantico nell'Open Data e il concetto di Linked Data

11. Verso gli Open Linked Data (LOD)

12. Dati aperti con LODe

Note