aib-logo Associazione Italiana Biblioteche. Seminari

La biblioteca digitale

Roma, 16-17 e 18 marzo 1999
(seminario diviso in tre moduli)


b) Modulo sull'informazione elettronica
Docenti: Patrizia Cotoneschi, Luca Bardi

Materiali didattici di Luca Bardi

Informazione elettronica
Introduzione - Bibliografia selezionata

J. Feather - P. Sturges. International Encyclopedia of Information and Library Science. London : Routledge, 1997.
The markets for electronic information services in the european economic area : supply, demand and information Infrastructure : European Report of the Member States' Study / Information Market Observatory. Luxembourg : European Commission - DG XIII/E, 1996.
P.A. Bruck. The content challenge: Electronic Publishing and the new content industries. In Future perspectives in electronic publishing. Frankfurt Bookfair, 1997.
M. Oyala. The life-cycle of business information. "Database" 19(3) June/July 1996, p. 79-81.
P. Hernon. Information life cycle : its place in the management of US government information resources. "Government Information Quarterly". 11 (2) 1994, pp. 143-170.

Informazione elettronica
Interoperabilità: standard e metadata

Informazione elettronica
Diritti e strategie - Approfondimenti


Informazione elettronica
Diritti e strategie - Letteratura professionale italiana

A. Scolari. Nel Labirinto delle licenze. "Bollettino AIB", 33 (1993), n. 2, p. 167-175
A.M. Mandillo. La tutela del diritto d'autore in biblioteca: un problema aperto e un accordo possibile. In "Bollettino AIB", 35 (1995), 2, p. 243-247
M. Marandola. Diritto d'autore. Roma: AIB, 1996.
M. Marandola. Il Nuovo diritto d'autore: quale futuro ?. In L'automazione delle biblioteche del Veneto: 9 seminario Angela Vinay : l'irruzione della multimedialità. Venezia, 1997
G. Vitiello. Biblioteche, editoria e diritto d'autore. In "Biblioteche oggi", genn-febbr. 1997, p. 8-15.
C. Revelli. Discussioni sul copyright. In "Biblioteche oggi", dic. 1997, , n.10, p. 46-54.

Informazione elettronica
Diritti e strategie - Letteratura professionale italiana

R. Caffo. Biblioteche e copyright: conferenza internazionale a Roma. In "AIB Notizie", 10 (1998), n. 8, p. 7
R. Caffo. Le biblioteche e la nuova direttiva europea sul copyright alla conferenza di Copenhagen. In "AIB Notizie", 10 (1998), n. 3, p. 6-7
Electronic copyright: nuove iniziative EBLIDA-AIB. In "AIB Notizie", 9 (1997), n. 6, p. 13-16.
L. Bardi. Electronic copyright and digital licensing: where are the pitfalls ?. In "AIB Notizie", 10 (1998), n. 10, p. 11-12

Informazione elettronica
Diritti e strategie - Bibliografia selezionata

M. Marandola. Diritto d'autore. Roma: AIB, 1996
L. Chimienti. Lineamenti del nuovo diritto d'autore : direttive comunitarie e normativa interna. Milano : Giuffrè, 1997
A. Okerson. Copyright or contract ?. In "Library Journal", september (1997), p. 136-139
C. Oppenheim. The legal and regulatory environment for electronic information. London : Infonortics, 1999

Informazione elettronica
Tecnologie per la gestione dei diritti - Link

SIAE
http://www.siae.it/Site2/SiaeMainSite.nsf/html/It_MMLicenza.html

Progetto ECUP+
http://www.kaapeli.fi/~eblida/ecup

Progetto Decomate
http://cdservera.blpes.lse.ac.uk/decomate

Progetto IMPRIMATUR
http://www.imprimatur.alcs.co.uk

Progetto CANDLE
http://www.sbu.ac.uk/litc/candle

Progetto ATHENS
http://www.athens.ac.uk

Informazione elettronica
Tecnologie per la gestione dei diritti - Bibliografia selezionata

C. Oppenheim. Legal issues associated with Electronic Copyright Management Systems.
A. Ramsden. Copyright Management Technologies
B. Tuck. Electronic Copyright Management Systems
Unique identifiers : a brief introduction / by G. Greene and Mark Bide, .
A Guide to using digital object identifiers

Materiali didattici di Patrizia Cotoneschi


Interoperabilità

* Interoperabilità

termine con molte istanze che impattano sull'efficacia della coesistenza di diverse risorse informative


Livelli di interoperabilità


* Semantica

-- standard per la descrizione dei contenuti

* Tecnica

-- controllo e indirizzo dello sviluppo standard e formati

* Politica

-- possesso risorse, formazione personale, sistemi più complessi

* Intercomunitaria

-- sinergie fra istituzioni e le discipline finora separate

* Internazionale

-- lingue, organizzazione

Definizioni e qualche accenno di terminologia

* Standard
* Protocollo
* Formato

Standard


* Riconoscimento con generale consenso
* Approvazione organismo ufficiale

Obiettivi

-- fornire linee guida e specifiche
-- uso comune e ripetuto
-- miglior livello di soddisfazione
(per altre definizioni vedi Eurodicautom)

Standard

* standard proprietari
sviluppati e diffusi da produttori privati

* standard aperti

disponibili

standard de facto
standard de jure

Livelli di maturità tecnologica

* Standard de facto

-- il prodotto si è imposto sul mercato, ed è riferimento per altri applicativi e (dati) e cambiamenti dipendono dal fabbricante

* Publicly available specification (PAS)

-- produttori leader si consorziano per definire un'interfaccia standard e sviluppare prodotti compatibili (X/open IETF Internet Egineering Task Force)

* Standard de jure

-- Standard garantiti da organismi ufficiali

* mancanza di prodotti

Stabilità degli standard......

* versioni
* servizi a valore aggiunto di alcuni fornitori
* poca chiarezza nelle specifiche
* utilizzo di parti
* CALS programmme del Dipartimento della Difesa US specifica gli standard adatti per la conservazione dell'informazione online
* GEDI Generic Electronic Document Interchange commissione responsabile per la standardizzazione delle applicazioni elettroniche alla documentazione e informazione Agreement for DD projects

Standard bozze di standard, e.... sogni di standard

* UNIMARC: MAchine Readable Cataloging,
* DC Dublin Core Metadata Element Set
* ANSI/NISO Z39.56-1996 (SICI)
* XML: The Extensible Markup Language
* URC: Uniform Resource Characteristics

Organizzazioni di standardizzazione nel settore dell'elaborazione dati

INTERNAZIONALI

-- W3C World Wide Web Consortium - (MIT/LCS-INRIA-KEIO) il principale per la rete
-- ISO International Organisation for Standardisation
-- IEC the International Electrotechinical Commitee
-- ITU The International Telecommunication Union
-- NISO National Information Standards Organization

* EUROPEI

-- CEN Commité européen de normalisation
-- Cenelec Commité européen de normalisation electrotechnique
-- ETSI European Telecommunications Standards


Standard
identificazione risorse


* ISBN, ISSN, ISMN Identificatori di standard bibliografici per materiale a stampa, possono essere applicati anche alle versioni elettroniche
* SICI Serials Item and Contribution Identifier
* SOIF Summary Object Interchange Format formato di metadata sviluppato in Harvest Architecture. Attraverso una indicizzazione strutturata permette di impostare richieste strutturate
* DOI Digital Object Identifier sviluppato da Association of American Publisher and CNRI principalmente per la gestione del copyright e del commercio elettronico


Identificatori di localizzazione

IETF Internet Engineering Task Force

* URI Uniform Resouce Identification termine inclusivo di:

* URL Uniform Resource Locators localizzazione della risorsa
* URN Uniform Resource Names nome della risorsa indipendentemente dalla sua localizzazione
* URC Uniform Resource Citation o Characteristics descrizione (metadata) delle risorse informative


PURL Persistent Uniform Resource Locators OCLC
HANDLE

Standard conservazione informazione elettronica


* Supporti magnetici

soprattutto standard proprietari per

* dischetti ISO/IEC 9529-1(breve tempo)
* cartucce ISO 8462-1
* nastri ISO/IES 3788:1976(10/15 anni)
* Video cassette 8mm ISO/IEC 11319
ISO/IES 12246 (2 anni)
* DAT Digital Audio Tape

Supporto ottico

* CD-DA 1980 Red book standard
* CD-ROM 1983 Yellow book standard
ISO 9660 - ISO 12246 (10/20 anni)
* CD-I Interactive Green Book based on Yellow Book Mode2
* CD-R Recordable 1988 - Orange Book part II (10/20 anni)
* CD-RW Rewritable Erasable Optical Disk 1994 - Orange Book part III (10/20 anni)
* DVD Digital Video/Versatile Disc (8-15 volte più capaci)

Protocollo


* Regole standard che governano le funzioni di comunicazione di rete descrivendo

-- i formati di un messaggio
-- il modo in cui viene scambiato con gli altri computer
--

Standard per ILL e DD

La diffusione del formato elettronico cambierà ILL in EDD
* ISO ILL 10160 e ISO ILL 10161 (non diffuso)
* Z39.50 ITEM ORDER che consente di trasportare messaggi ISO ILL 10160/1
* HTTP
* EDI Electronic Data Interchange
* STMP
* Formati DD dal GEDI agreement

-- TIFF, JPEG, PDF
--

Standard ricerca e recupero su basi dati

* Z39.50 : ANSI/NISO Information Retrieval standard Z39.50-1995, versione 1996 inclusa nella ISO 23950

* SQL:

-- ISO/IEC 9075:1992 Information Technology-Database language
-- ANSI X3.135-1992 Database Language SQL - Structured Query Language

SQL è un linguaggio standard interattivo e di programmazione per database relazionale sebbene sia ANSI e ISO standard molti prodotti per database lo supportano con estenzioni propritarie (INFORMIX, DATABASE ORACLE)

Che cos'è Z39.50

Z39.50 American National Standard Z39.50 Information Retrieval Service Definition and Protocol Specification for Library Applications
ISO23950
* NISO standard che specifica un protocollo applicativo OSI
* Standard composto di specifiche per collegamento di databases con diversi Information Retrieval Systems

* Obiettivo è la decodifica del messaggio richiesto per far comunicare due sistemi nella ricerca e recupero dell'informazione
* Interoperabilità nella definizione di diversi profili

Standard
codifica caratteri

* ISO646 ASCII - standard a 7 bit non tratta i caratteri speciali

* ISO/IEC 8859-1 (ISO Latin 1) è la più usata della ISO /IEC 8859-N (N=1-9) per tutte le lingue europee

* ISO/IEC 10646 UCS (UNICODE) Universal Charact Set disegnato per permettere l'utilizzo della maggior parte dei caratteri utilizzati , usando 2 byte (UCS-2) o (UCS-4)
Ancora poco usato, verrà supportato dall' XLM


Formati documento

* Formati plain text

-- ISO 646 ASCII - standard a 7 bit non tratta i caratteri speciali (testo=sequenza di caratteri) ASCII esteso permette di descrivere caratteri speciali in una tabella limitata

* Formati proprietari di formattazione

-- Wordperfect, Pagemaker, Ventura, Word
-- RTF Rich Text Format formato portabile di Microsoft
-- LaTeX/TeX per matematica e affini

* Formati descrizione pagina

-- PostScript standard per la descrizione della pagina di Adobe è usato per inviare o stampare testi con il loro layout.
-- PDF Portable Document Format permette ai documenti di essere visualizzati su piattaforme diverse

I formati delle riviste elettroniche

* Le prime e forse qualcuna ancora ASCII
* La maggior parte utilizzano HTML (ritenuto solo di passaggio) o PDF
* Postscript
* LaTeX
* SGML ancora in fase di valutazione - adottato da alcuni progetti americani (CLIC, Infobike, Superjournal)

Formati
Documenti con informazione strutturata

SGML
Standard Generalised Mark up Language

* HTML Hypertext Mark-up Language elementi ed entità (tags e attibuti) definiti
* XLM EXtensible Markup Language non definiti
* PROPRIETARY FORMATS standards de facto largamente diffusi in ambiente Windows

-- OLE Object Linkin Embedding Microsoft (interazione tra Excel e Word)
--

SGML e DTD

* SGML considera un documento come un'insieme di elementi posti in posizione gerarchica e ne definisce la struttura tramite la definizione della Document Type Definition.
* La specifica formale della struttura di un documento SGML si compone di un insieme di dichiarazioni espresse secondo un'apposita sintassi DTD.
* Le dichiarazioni definiscono gli elementi cioè le unità testuali che vengono considerati elementi strutturali.

XLM
EXtensible Markup Language

* Versione light di SGML
* Sistema orientato alla definizione della struttura gerarchica
* Contenuto e presentazione sono separati
* Insieme di marcatori che servono per delimitare annotazioni e commenti ad un testo
* eXtensible = linguaggio di contrassegni personalizzati = nuovi linguaggi

RDF
Resource Description Framework


Model and Syntax specification as a W3C Recommendation
"The Web is quickly becoming the world's fastest growing repository of data," explained Tim Berners-Lee, W3C director.
"RDF provides the necessary foundation and infrastructure to support the description and management of this data.
RDF can transform the Web into a more useful and powerful information resource."

RDF
Resource Description Framework

* Attività di diverse comunità che lavorano sui metadata
* Creazione architettura robusta e flessibile per supportare metadata in rete
* Raccomandazioni per uno standard che regoli il formato delle meta informazioni usando grafi etichettati riguardanti il contenuto di siti
* Riconoscimento da agenti software
* Scambio con databases con campi diversi
* Evoluzione del PICS ((Platform for Internet Content Selection) nato in 3WC per controllare accesso ai siti vietati ai minori.


Che cosa sono i metadata?
(definizione UKOLN)

Dati sui dati

Tutti di dati usati per aiutare l'identificazione, la descrizione
la localizzazione di
risorse elettroniche in rete

Metadata is data about data. Increasingly the term refers to any data used to aid the identification, description and location of networked electronic resources. In this context there now exists a variety of metadata formats from the basic proprietary records used in global internet search services, through a continuum encompassing simple attribute/value records such as the ROADS templates used in eLib subject services, the more structured TEI and MARC formats, and at the richest level detailed formats such as CIMI and EAD typically applied to archival material


Evoluzione
del concetto di metadata

* 2 accezioni del significato
* Formati bibliografici strutturati e costruiti su regole di catalogazione rigorose (MARC, CIMI)

* Elementi minimi anche destrutturati e se possibile ricavati dalla codifica del documento stesso (intestazione TEI, IAFA DC)

A chi interessano i metadata?

* Tradizionali tutori del sapere

-- biblioteche
-- archivi

* Gestori dell'informazione di rete

-- Sviluppo di collezioni su web
-- Consorzio WWW

* Gestori delle risorse di rete

-- Motori di ricerca
-- Servizi di directory


DUBLIN CORE


Abbreviazione di Dublin Metadata Core Element Set
Metadata definiti dal OCLC/NCSA Metadata Workshop in March 1995..
Semplice descrizione risorse di rete a sintassi indipendente di 15 elementi con qualificatori
Applicazioni di metadata DC nelle intestazioni dei documenti strutturati


Come nasce Dublin Core


* Chicago WWW conf. 1994
* OCLC/NCSAmetadata Work 1995
* OCLC/UKOLN Warwick Works 1996
* W3C workshop 1996
* CNI/OCLC Worshop 1996
* DC-4 Camberra 1997
* DC-5 Helsinki 1997
* CCE Metadata Workshop 1997
* DC-7 Washington 1998
* CCE Metadata Workshop 1998

Caratteristiche fondamentali del Dublin Core

* Ogni elemento è opzionale
* Ogni elemento è ripetibile
* Sintassi indipendente
* Estendibile (la descrizione si può arricchire)
* Interdisciplinare (interoperabilità semantica)
* Internazionale (10 lingue in aumento)


15 ELEMENTI DC

          CONTENUTO             PROPRIETA'            INSTANZA                   
            Title               Creator               date                       
           Subject              Publisher             type                       
         Description            Contributor           format                     
            Source              Rights                identifier                 
           Language                                                              
           Relation                                                              
           Coverage                                                              

Il contenuto dei 15 elementi DC

ETICHETTA         SIGNIFICATO                                                                            
Title             Nome dato alla risorsa dal Creator o Publisher                                         
Creator           Organizzazione o persona con responsabilità primaria del contenuto intellettuale       
Subject           Argomenti parole chiave e frasi che descrivono il contenuto es: classificazione        
Description       Descrizione del contenuto                                                              
Publisher         Entità che fornisce accesso alla risorsa                                               
Contributors      Organizzazioni o persone con responsabilità secondaria rispetto al Creator             
      Date        Data della messa a disposizione della risorsa                                          
      Type        Homepage, pre-print                                                                    
     Format       Tetxt, html, jpeg                                                                      
   Identifier                  Stringa o numero che identifica la risorsa es: URL,ISSN,URN               
     Source                       Opera da cui la risorsa deriva es: versione cartacea                   
    Language                        Codice a tre caratteri della lingua del contenuto                    
    Relation                             Esprime le relazioni con altre risorse                          
    Coverage                                 Localizzazione spazio-temporale                             
Rights            Riferimenti a copyright o server che fornisce il dato                                  



QUALIFICATORI

* due tipi di qualificatori

* scheme= specifica il contesto di interpretazione su standard esterni

-- vacabolario controllato
>> classificazione DDC (scheme=DDC 20)

* type=raffina la semantica di un elemento

-- regole di codifica
>> ISO 8601 per data
>> ISO 639/1 per la lingua

* ogni campo ha qualificatore accettato

Progetto Euler

* Progetto Europeo 1998 nel quadro di "Telematics for Libraries"
* Accesso integrato a specifiche risorse informative in rete
* Biblioteca digitale di matematica con integrazione delle eterogenee risorse già esistenti

-- basi dati bibliografiche, OPACS, riviste elettroniche, archivi di pre-prints , letteratura grigia e risorse Internet controllate,

* Unico punto d'accesso utilizzando un'unica interfaccia disponibile sul WWW.
* Descrizione di tali eterogenee risorse basata su DC
* Protocollo Z39.50


Progetto Euler

Caratteristiche principali

* Costi distribuiti
* Qualità distribuita
* Libertà di standard

-- DC
-- Z39.50
-- Tecnologia Internet

* Riutilizzo
* Ampio pubblico

-- gateways WWW
-- funzionalità HTML e JavaScript

DUBLIN CORE ESTESO NEL PROGETTO EULER

I 15 elementi del DUBLIN CORE sono stati estesi seguendo due modalità

Potenzialità di specifica dell' attibuto qualifier

Ø Il campo SUBJECT è stato definito secondo le seguenti classificazioni:

Classificazione DCD Decimal Classification Dewey

Clssificazione MSC Mathematics Subject Classification

Soggettario della LSCH Library of Congress Subject Headings

Classificazione CCS Computing Clssification Systems

Ø Il campo IDENTIFIER con i seguenti localizzatori:

ISSN

ISBN

URN

URL

Sono state inseriti alcuni campi ex-novo che rispondono a necessità emerse all'interno del sistema EULER non previsti nei 15 elementi del Dublin Core ad esempio:

Euler.Record Creator

Euler.Event Name

Euler.Delivery

DATA BASE O WEB
RECORD

Dublin Core

Z39.50

Z39.50 in Euler

* Standard di riferimento per interoperabilità della ricerca e recupero nella comunità bibliotecaria
* Flessibile

-- possibilità sviluppo sub-standards che disegnano le singole applicazioni (diversi server Z39.50)
-- parte dello Z39.50 lista attributi
-- GILS - GRS1 formato gerarchico per Z39.50
-- CROSS-DOMAIN ATTRIBUTE SET standard disegnato con DC come riferimento per la definizione dei client - standard non ancora stabile

* EULER Z39.50
* standard caratteri UNICODE e ISO 8859-1



Programma del seminario

Copyright AIB 1999-03-15, ultimo aggiornamento 1999-12-14, a cura di Ilaria Brancatisano
AIB-WEB | Presentazione Seminari | Seminari 99