[AIB] Associazione italiana biblioteche. Congresso 1998 

Associazione Italiana Biblioteche. Congresso 1998 - XLIV Congresso nazionale AIB
Sessione: Gli standard in biblioteca

Lo standard Z39.50 : esperienze italiane

M.B. Baldacci * e C. Parmeggiani**

*CNR-Istituto di Elaborazione dell'Informazione, Pisa
**Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane, Roma

Introduzione

Un'offerta illimitata di fonti di informazione, di contenuto diversissimo, accessibili in forme diverse e' cio' che ci presenta la Societa' dell'Informazione. Le biblioteche dovranno aprire l'accesso, oltre che ai tradizionali cataloghi bibliografici, a cataloghi di dati museali, archivistici, banche di dati geografici, ambientali e spaziali, archivi di documenti elettronici, informazioni prodotte dalla pubblica amministrazione e da imprese private.

La possibilita' di sfruttare pienamente risorse di informazione di natura cosi' diversa dipendera' dall'adozione di regole globali, che rendano possibile l'interoperabilita' di sistemi diversi, che superino le barriere linguistiche, che affrontino i temi di natura sociale ed economica: il diritto di autore, la sicurezza, le procedure amministrative per l'accesso a pagamento.

Il protocollo ISO SR/Z39.50, e' una risposta alle esigenze del ricupero dell'informazione nella societa' dell'informazione globale. Progettato inizialmente per il ricupero dell' informazione bibliografica, ha esteso la sua applicazione al campo piu' generale dei sistemi informativi ed e' la base di numerosi progetti promossi dall'Unione Europea e dal gruppo di nazioni denominato "G7".

In questa questa comunicazione, dopo una breve introduzione alle caratteristiche che differenziano il protocollo Z39.50 dal WWW - ampiamente noto ed usato dai bibliotecari - sono descritti i contributi che allo sviluppo del protocollo e alla sua implementazione sono stati dati dal progetto ARCA e dal progetto ACCESSIBILITA'.

Le caratteristiche del protocollo Z39.50

Il protocollo Z39.50 - il nome piu' conosciuto dello standard ISO 23950 - definisce le funzioni di ricupero dell'informazione in un ambiente di sistemi distribuiti, con architettura client/server [1]. Del protocollo Z39.50 ricordiamo qui solo le funzionalita' che lo caratterizzano rispetto ad altri protocolli e che possono risultare percio' piu' interessanti per l'utente; una introduzione alle caratteristiche di base del protocollo e' data in [2]; tuttavia il protocollo e' in continua evoluzione, ed e' consigliabile consultare il sito WEB dell'Agenzia di manutenzione [3] per avere una documentazione aggiornata del suo stato.

Nel modello di funzionamento del protocollo, il client, chiamato origin, e il server, chiamato target, comunicano con un dialogo che avviene in una connessione diretta, che viene mantenuta per tutta la sessione; al client spetta il compito di attivare la comunicazione, inviare l'interrogazione e richiedere l'invio dei record di risposta ; al target, il compito di ricevere i messaggi dal client, e, interagendo col sistema informativo a cui e' interfacciato, rispondere al client con i record che corrispondono alla interrogazione o con messaggi diagnostici.

La rilevante novita' del protocollo Z39.50 e' che esso offre, a sistemi diversi per hardware, software e contenuto informativo, la possibilita' di scambiarsi dati semanticamente riconoscibili anche al di fuori del contesto, strutturale e linguistico , in cui sono stati creati; il protocollo infatti standardizza la struttura e la semantica delle interrogazioni e dei record.

Tale "interoperabilita' semantica", che e' caratteristica del protocollo Z39.50, unita alla capacita' di offrire ricerche contemporanee su una molteplicita' di basi di dati, si traduce per l'utente nella possibilita' di:

  • fare ricerche su basi di dati diverse attaverso un'unica interfaccia: quella del suo client;
  • impostare la richiesta con il grado di precisione voluto: dei record ricercati, infatti si possono definire sia il contenuto sia la sua forma;
  • negoziare la struttura dei record che si vogliono ricevere in risposta e la forma di rappresentazione;
  • fondere e ordinare record provenienti da fonti diverse e presentarli o scaricarli nella forma desiderata.
  • Per potenziare l'interoperabilita' semantica, il protocollo definisce per il target una speciale base di dati, chiamata "EXPLAIN" da cui il client puo' ricevere informazioni sulle caratteristiche delle basi di dati disponibili oppure autoconfigurarsi in base a tale informazioni: nel primo caso, sara' l'utente a impostare ricerche compatibili con le caratteristiche delle basi dei dati a cui e' connesso; nel secondo caso, sara' il client a rendere visibili all'utente solo le funzionalita' e le modalita' di ricerca permesse dal target.

    Oltre alle funzioni finalizzati alla ricerca e al ricupero, il protocollo ne definisce altre, finalizzate al controllo, da parte del target, dell'accesso all'informazione e dell'uso delle risorse informative e, di conseguenza, dei costi della ricerca.

    Poiche' il protocollo e' rivolto ad un' ampia gamma di applicazioni - OPAC, basi di dati museali e archivistici, archivi di documenti elettronici, sistemi informativi della pubblica amministrazione, basi di dati geografici e spaziali - esso definisce con specifici profili quali funzionalita', fra quelle definite dal protocollo, debbano essere obbligatoriamente implementati per ciascuna applicazione. Componente importante di ciascun profilo, sono gli attributi , attraverso quali si specifica quali devono essere i punti di accesso, e le corrispondenti modalita' di accesso alle basi di dati affinche' siano soddisfatti i requisiti del profilo di quella specifica applicazione. Con il riferimento a differenti "insiemi di attributi", il protocollo Z39.50 permette di specializzare la semantica delle interrogazioni, mantenendo costanti i meccanismi di tutte le altre funzionalita'.

    Il progetto ARCA

    Il progetto ARCA [4] ha dato contributi originali allo sviluppo e alla implementaione del protocollo, affrontando con successo l'obiettivo di realizzare, per la parte target , un software di applicazione generale e proponendo soluzioni implementative che rendono effettiva la potenzialita' di interoperabilita' semantica fra origin e target.

    Tenteremo di illustrare queste caratteristiche in modo estremamente sintetico, rimandando per i dettagli alla documentazione del progetto e a [5,6].

    Generalita' di applicazione e portabilita' del sistema

    La generalita' di applicazione del Target ARCA risponde principalmente alla necessita' di un software che possa essere interfacciato agli OPAC delle biblioteche con un minimo sforzo di programmazione. L'implementazione del protocollo Z39.50, anche nelle sue caratteristiche basilari, richiede infatti un impegno di programmazione che difficilmente puo' trovare risposta in una biblioteca.

    La soluzione offerta dal Target ARCA riposa nella sua architettura, schematizzata in Fig. 1.

    Come e' mostrato dalla figura, il Target ARCA e' composto da due sottosistemi. Uno di questi, denominato "Target core" - il nucleo del Target ARCA - esplica tutte le funzioni di comunicazione con il client, in accordo con i requisiti del protocollo. Una sua speciale funzione e' verificare se le interrogazioni ricevute dal client sono accettabili dall' OPAC; per fare questo, il nucleo confronta la struttura e gli attributi della frase di interrogazione con le caratteristiche dell'OPAC registrate nel suo DIZIONARIO. Se la verifica da' esito positivo, il nucleo interagisce con il sottosistema "OPAC, al quale passa le interrogazioni ricevute dal client e dal quale riceve i risultati, record o messaggi diagnostici, da trasmettere in risposta al client. Se la verifica da' esito negativo, il nucleo invia in modo autonomo messaggi diagnostici al client.

    Il vantaggio offerto da tale soluzione architetturale e' che il Target esplica la maggior parte delle sue funzioni in modo indipendente dall'OPAC; all'OPAC infatti e' richiesto solo di eseguire le sue funzioni primitive, cioe' l'esecuzione delle interrogazioni e la resa dei risultati, interagendo con il nucleo attraverso l'interfaccia chiamata "Application Programming Interface-API" .

    Fig. 1 - L'architettura del Target ARCA

    Per interfacciare il Target ARCA con qualsiasi OPAC e' percio' soltanto necessario:

  • approntare un insieme minimo di funzioni API specifiche dell'OPAC;
  • registrare nel Dizionario la rappresentazione delle caratteristiche dell'OPAC attraverso una interfaccia utente, progettata per il bibliotecario-sistemista.
  • Il Target ARCA , inoltre e' capace di potenziare le funzionalita' dell'OPAC a cui e' interfacciato, permettendo, fra l'altro, di far riferimento a interrogazioni gia' eseguite e di ricercare contemporaneamente piu' basi di dati, anche se tali funzionaita' non sono presenti nell'OPAC.

    Il Target e' portabile sulle seguenti piattaforme: Solaris 2.5, SunOS 4.1, HP UX10.10, IBM AIX 3.2.5, DEC ALPHA OSF 3.2, Linux 2.0, Windows NT.

    Implementazione dell'interoperabilita' semantica

    Le caratteristiche di interoperabilita' semantica del protocollo Z39.50 hanno ricevuto pieno riconoscimento nel progetto ARCA, che ha offerto uno dei pochi esempi di implementazioni e utilizzo della base di dati EXPLAIN.

    Poiche', nella prima fase del progetto, l'analisi dei problemi connessi al mapping degli attributi aveva messo in evidenza i rischi di affidare le funzioni di origin all'interfaccia-utente degli OPAC, una delle prime scelte del progetto e' stata la realizzazione di un software autonomo per le funzioni di origin Z39.50. Obiettivo principale di tale realizzazione e' stato sfruttare pienamente una delle funzionalita' opzionali del protocollo, la base di dati EXPLAIN, per affrontare la difficolta' principale della comunicazione via Z39.50: la difficolta', cioe', di impostare interrogazioni per sistemi informativi di cui non si conoscono punti di accesso e modalita' di accesso.

    Il risultato di tali scelte di progetto e' il client ARCA, la cui caratteristica principale e' la capacita' di conformare il suo comportamento alle caratteristiche del target a cui si connette, autoconfigurandosi in base alle informazioni lette nella base di dati EXPLAIN dello stesso target.

    Nella comunicazione fra un client e un target ARCA - cosi' come nella comunicazione fra un client ARCA e qualsiasi target che abbia implementato la base di dati EXPLAIN - l'utente non ha la necessita' di documentarsi preventivamente su cio' che il target permette; e' infatti il client a mostrargli le opzioni che il Target e' capace di soddisfare, e solo quelle.

    Il progetto ACCESSIBILITA'

    Come E' noto il progetto dell'ICCU denominato "Accessibilità alle basi dati residenti sul sistema Indice SBN" ha realizzato un nuovo catalogo della rete. Gli obiettivi che si volevano raggiungere erano che fosse uno strumento flessibile, orientato all'utenza, facile da usare, accessibile liberamente via Internet e interoperabile. La realizzazione E' ed E' stata interamente finanziata dal Ministero per i Beni Culturali e Ambientali e ultimata a fine 1997.

    L'OPAC SBN oggi e' consultato da circa 20.000 utenti al giorno, contiene circa 3.800.000 notizie bibliografiche in formato UNIMARC che sono scaricate con cadenza settimanale da 3 delle 9 basi dati ospitate dall'Indice SBN: Libro moderno, Libro antico e Musica; le notizie si riferiscono a 7.500.000 di documenti localizzati in circa 800 biblioteche italiane. L'OPAC oltre all'accesso all'informazione consentirà anche tra breve l'attivazione delle richieste di prestito e fornitura documenti

    L'OPAC E' un sistema aperto che interopera con sistemi standard in rete grazie alle nuove componenti software che comprendono: le procedure di conversione dal formato SBN a UNIMARC, la base dati IR, il server SBN Z39.50, il gateway HTTP/Z39.50, il client SBNZeta in ambiente windows, il client SBN OLUIT e il client SBN per l'accesso 3270. Le procedure realizzate dal progetto sono disponibili gratuitamente per le biblioteche SBN che ne facciano richiesta all'ICCU. Ad oggi oltre 30 biblioteche hanno già ricevuto il client SBNZeta e di recente E' stata avviata anche la distribuzione di SBNOLUIT.

    L'accesso con modalità standard al target SBN E' possibile da parte di un qualsiasi client Z39.50, ma anche di un qualsiasi utente internet, grazie al modulo gateway che converte le richieste HTML in Z39.50 e viceversa. Inoltre il sistema offre un servizio particolare per gli utenti autorizzati a collegarsi al sistema gestionale dell'Indice: l'accessso all'opac senza il prerequisito dell'accesso ad internet. Questo grazie all'istallazione di un client Zeta direttamente sul sistema centrale.

    L'ICCU, per alcuni aspetti dell'implementazione, si E' avvalsa del contributo scientifico delle Università di Bologna, Firenze, Padova e Torino. In particolare l'Università di Firenze ha definito una serie di opzioni relative all'applicazione dello standard Z39.50 nel contesto SBN (mapping). Su questo nucleo iniziale E' stata avviata l'analisi progettuale che ha tenuto conto dei risultati raggiunti dai progetti finanziati dalla Comunità Europea quali ARCA e ONE[7], inoltre, per il collaudo dell'interoperabilità del sistema, l'ICCU si E' avvalso anche di esperti del CNUCE e dell'IEI.

    Una prima evoluzione del progetto Accessibilità E' attualmente in corso di realizzazione e consiste nella realizzazione di interventi migliorativi sulle procedure di scarico dei dati dalle basi dati gestionali Libro Moderno, Libro Antico e Musica verso il sistema OPAC; sarà inoltre integrata nel sistema OPAC la versioni evolute del gateway HTTP/Z39.50 nella versione stateful.

    Per gli utenti web che si collegano all'indirizzo http://opac.sbn.it E' prevista l'attivazione di un servizio di accesso contemporaneo a più basi dati. Il medesimo servizio che oggi E' offerto dalla Library of Congress.

    Entro la fine del 1998, saranno completati gli interventi innovativi che renderanno accessibili sull'OPAC anche altre due basi dati residenti sull'Indice: Anagrafe Biblioteche e Manoscritti. L'utente potrà effettuare ricerche integrate sulle basi dati dell'Indice e recuperare libri, periodici, manoscritti e stampe musicali che abbiano elementi comuni. Sono stati comunque definiti profili di ricerca specifici per ciascuna delle tipologie di materiale.

    L'evoluzione dell'OPAC prevede inoltre la realizzazione di nuove funzioni quali la visualizzazione e lo scarico in linea delle notizie in formato standard UNIMARC, il controllo degli accessi al fine dell'erogazione di servizi ad utenti riconosciuti, l'ordine di un documento ad una biblioteca, il recupero dei documenti via rete, legato alla effettiva disponibilità di documenti in formato elettronico presso le biblioteche.
    I nuovi servizi saranno attivati per gli utenti web all'indirizzo internet: http://opac.sbn.it, ma come conseguenza dell'architettura standard dell'OPAC potranno essere attuivati anche da generici client Z39.50 che abbiano sviluppato le funzioni relative allo scarico dei dati e all'ordine del documento previsti da Z39.50.

    Il profilo SBN

    Il profilo SBN, presentato nell' Appendice, descrive l'insieme delle funzioni, dei punti di accesso e delle modalità di ricerca (mapping) attivate sul nuovo sistema di interrogazione dell'Indice in applicazione a quanto prevede lo standard ISO 23950.

    Il profilo E' stato presentato a Bruxelles il 20 novembre all'ultima riunione EFILA (European Forum for Implementors of Library Automation) e ad Orlando (USA) il 22 gennaio all'ultima riunione ZIG (Z39.50 Implementor Group).

    Il profilo SBN E' sovrainsieme di quelli CENL, ONE e ATS1 che sono stati definiti nell'ambito delle più recenti realizzazioni europee e nordamericane.
    Conoscere quale profilo E' stato applicato in un OPAC consente di dare una prima soluzione a quella interoperabilità semantica che lo standard affida ad EXPLAIN. Il servizio EXPLAIN infatti non E' ancora attivo sull'OPAC dell'Indice, come in moltissime realizzazioni internazionali
    L'utente che conosce il profilo dell'OPAC può impostare ricerche compatibili con le caratteristiche della base dati a cui si sta connettendo. A tal fine su internet sono presenti moltissimi siti nei quali sono descritti i punti di accesso, le modali tà di ricerca, i servizi standard attivi, etc.

    L'uso del profilo consente ad un client Z39.50 generico (anche non SBN) di effettuare ricerche ed interoperare con il target dell'Indice utilizzando come punti di accesso:

    Oggi l'uso di tutti i punti di accesso del profilo E' previsto solo per l'interfaccia Windows del client SBNZeta; l'esigenza di rendere l'accesso piu' semplice ha, al momento, portato a scelte differenziate nella definizione dell'interfaccia grafica HTML, di quella a carattere ed anche per l'interfaccia object oriented di OLUIT.

    Note

    [1] Information Retrieval (Z39.50): Application Service Definition and Protocol Specification (ANSI/NISO Z39.50-1995). - Bethesda, MD : NISO Press, 1995. - ISBD 1-880124-22-X
    ANSI Z39.50 e' un protocollo per il livello di applicazione nel modello di interconnessione tra sistemi aperti sviluppato da NISO (National Information Strandard Organisation), un comitato di ANSI (American National Standards Institute), e mantenuto dalla Library of Congress. Lo standard ha subito un'evoluzione dalla prima versione del 1988 a quella del 1992; nel 1995 ne e' stata rilasciata una terza versione ampliata.
    La terza versione e' un sovrinsieme dello standard ISO "10163-1991 Information and Documentation - Search and Retrive application protocol specification for open systems interconnection"; il TC 46/SC4/WG4 ha quindi provveduto ad attivare una "fast track procedure" per adeguare lo standard ISO a quello ANSI. Alla data odierna il nuovo standard ISO 23959 E' nella fase draft finale.
    Nella terminologia del protocollo Z39.50, il client e' chiamato "origin" e il server e' chiamato "target".

    [2] Gli standard OSI per le Biblioteche : Dalla biblioteca-catalogo alla biblioteca-nodo di rete / Antonio Scolari. - Milano : Editrice Bibliografica, 1995

    [3] Il sito WEB dell'Agenzia di manutenzione si trova alla URL : http:// lcweb.loc.gov/z3950/agency/

    [4] La documentazione del progetto ARCA e' disponibile alla URL: http://www.pisa.intecs.it/projects/ARCA/

    [5] Tayloring Z39.50 on Existing Databases: th ARCA Project / M. Loffredo, M.B. Baldacci, O. Signore. - Proceedings 8th International Workshop on Database and Expert Systems Applications (September 1-2, 1997, Toulouse, France). IEEE Computer Society, 1997; pp.332-338.

    [6] ARCA Client User Manual / J. Favaro, A. Catoni. - Libraries Programme Project Lib-Arca2-3009, Arca/T24/UM, May 1997.

    [7] ONE (OPAC Network in Europe). ONE ha lo scopo di facilitare l'accesso ai maggiori database europei tramite il protocollo Z39.50. Le 15 istituzioni che partecipano al progetto appartengono a 8 paesi europei (Norvegia, Gran Bretagna, Danimarca, germania, Olanda, Austria, Svezia e Finlandia). che hanno messo a disposizione complessivamente quasi 40 milioni di record bibliografici distribuiti in oltre 18 basi di dati. La realizzazione del progetto OPAC SBN consente l'interoperabilita' dell'Indice con gli archivi coinvolti in ONE.

    Appendice

    Ministero per i Beni Culturali e Ambientali
    ISTITUTO CENTRALE PER IL CATALOGO UNICO DELLE BIBLIOTECHE ITALIANE
    E PER LE INFORMAZIONI BIBLIOGRAFICHE
    00185 Roma - Viale del Castro Pretorio 105 - Tel. 06/4957877 - Fax 06/4959302
    Profilo Indice SBN Z39.50
     
     
    Caratteristiche tecniche del sistema: Dati tecnici del profilo
    hardware: IBM 7013-J30 RISC 6000 RAM: 512 MB 
    disk: 40 GB
    sistema: IBM AIX 4.15 
    DBMS: BASIS Plus Versione L1G.2A 
    linea di comunicazione:TCP/IP 
    indirizzo del server Internet:
    opac.sbn.it 
    numero porta: 2100
    ore di disponibilità : 0-24
     
    versione del protocollo Z39.50: 
    2,3
    servizi: 
    Init, Search, Present, Scan, Sort, Delete, Close
    tipo di interrogazione:
    1 (RPN), 101
    insieme di attributi:
    BIB-1 e specifiche estensioni del database
    sintassi dei record: SUTRS
    insieme dei caratteri di interrogazione:
    ISO 646 + ISO8859-1
    insieme dei caratteri dei record:
    ISO 646 + ISO 8859-1
    presentazione del record: 
    Analitica (Full), Sintetica (Brief)
    I punti di accesso( Attributi di Bib1 ed estensioni del profilo SBN)

    La tabella riporta le seguenti colonne:
    uso nome del punto di accesso
    valore valore del punto di accesso indicato in Bib-1
    struttura valore di default che specifica il tipo di ricerca assegnato automaticamente
    Web indica se il punto di accesso E' attivo anche nell'interfaccia Web
    Tutti i punti di accesso sottoindicati sono attivi sull'interfaccia del client SBNZeta.
    Nel profilo SBN e in Bib-1 i valori di default relativi alla struttura hanno il significato già indicato in precedenza: 1=frase, 6=lista di parole, 4=anno, 5=data(normalizzata).
     
     

    Uso Valore Struttura Web
    nome personale 1 6
    nome di ente 2 6
    nome di congresso 3 6
    titolo 4 6 X
    titolo della collezione 5 6 X
    titolo uniforme 6 6
    ISBN 7 6 X
    ISSN 8 6 X
    classificazione Dewey 13 1 (frase) X
    classificazione locale 20 1
    soggetto 21 6 X
    soggetto locale 29 6
    data 30 4
    data di pubblicazione 31 4 X
    titolo parallelo 35 6
    variante del titolo 41 6
    titolo proprio del documento collegato 42 6
    numero bibliografia nazionale 48 6
    numero editoriale musica 51 6
    codice di lingua 54 1 X
    codice del paese di pubblicazione 55 1 X
    nome e titolo 57 6
    luogo di pubblicazione 59 6
    note 63 6
    autoreâ€"titolo 1000 6
    tipo di documento 1001 1
    nome 1002 6 X
    autore 1003 6 X
    autore-nome personale 1004 6
    autore-nome di ente 1005 6
    autore-nome di congresso 1006 6
    numeri di identificazione 1007 6 X
    data di inserimento 1011 5
    data di aggiornamento 1012 5 X
    parole chiave (Any) 1016 6 X
    editore 1018 6 X
    livello bibliografico 1021 1 X
    tonalità 1025 1 X
    periodico collegato 1026 6
    codice identificativo del record 1032 1
    contenitore (Host item) 1033 6
    tipo di contento 1034 1
    tutta la descrizione (Anywhere) 1035 6
    Autore â€" Titolo â€" Soggetto 1036 6
    Punti di accesso dell'estensione
    Uso Valore Struttura Web
    natura catalografica 3000 4
    ISMN 3004 6
    numero di catalogo tematico 3006 6
    impronta 3008 6 X
    data di composizione 3010 4 X
    luogo di pubblicazione â€" soggetto 3012 6 X
    forma musicale 3014 4 X
    organico 3016 6 X
    organico analitico 3018 6
    organico sintetico 3020 6
    organico analitico della elaborazione 3022 6
    organico sintetico della elaborazione 3024 6
    parti (lista sintetica) 3026 6
    titolo proprio 3028 6
    titolo proprio di altro autore 3030 6
    titolo uniforme 3032 6
    titolo della sezione o parte 3034 6
    titolo appellativo 3038 6
    incipit letterario 3040 6
    incipit musicale 3041 6 X
    titolo alternativo 3042 6
    titolo dell'opera letteraria desunta 3044 6
    titolo dell'opera parafrasata 3046 6
    personaggio (e interprete) 3050 6 X
    codice tipo di relazione 3056 6
    area di edizione 3072 6
    area di pubblicazione 3074 6
    area titolo e responsabilità 3086 6
    marca 3087 6 X
    codice anagrafe biblioteche 3088 4
    dati di rappresentazione musicale 3089 6 X
    presentazioni di documenti musicali 3090 6
    segnatura 3091 6 X
    classificazione Dewey â€" descrizione 4014 6 X
    editore (codice di relazione=650) 4051 6 X


    Homepage AIB-WEB | Congresso Genova 1998 | Sessione "Standard in biblioteca"
    Copyright AIB 1998-04-23, ultimo aggiornamento 1998-04-23 a cura di Antonio Scolari e Riccardo Ridi