Lo standard Z39.50 : esperienze italiane
M.B. Baldacci * e C. Parmeggiani**
*CNR-Istituto di Elaborazione dell'Informazione,
Pisa
**Istituto Centrale per il Catalogo Unico
delle Biblioteche Italiane, Roma
Introduzione
Un'offerta illimitata di fonti di informazione, di contenuto diversissimo, accessibili in forme diverse e' cio' che ci presenta la Societa' dell'Informazione. Le biblioteche dovranno aprire l'accesso, oltre che ai tradizionali cataloghi bibliografici, a cataloghi di dati museali, archivistici, banche di dati geografici, ambientali e spaziali, archivi di documenti elettronici, informazioni prodotte dalla pubblica amministrazione e da imprese private.
La possibilita' di sfruttare pienamente risorse di informazione di natura cosi' diversa dipendera' dall'adozione di regole globali, che rendano possibile l'interoperabilita' di sistemi diversi, che superino le barriere linguistiche, che affrontino i temi di natura sociale ed economica: il diritto di autore, la sicurezza, le procedure amministrative per l'accesso a pagamento.
Il protocollo ISO SR/Z39.50, e' una risposta alle esigenze del ricupero dell'informazione nella societa' dell'informazione globale. Progettato inizialmente per il ricupero dell' informazione bibliografica, ha esteso la sua applicazione al campo piu' generale dei sistemi informativi ed e' la base di numerosi progetti promossi dall'Unione Europea e dal gruppo di nazioni denominato "G7".
In questa questa comunicazione, dopo una breve introduzione alle caratteristiche che differenziano il protocollo Z39.50 dal WWW - ampiamente noto ed usato dai bibliotecari - sono descritti i contributi che allo sviluppo del protocollo e alla sua implementazione sono stati dati dal progetto ARCA e dal progetto ACCESSIBILITA'.
Le caratteristiche del protocollo Z39.50
Il protocollo Z39.50 - il nome piu' conosciuto dello standard ISO 23950 - definisce le funzioni di ricupero dell'informazione in un ambiente di sistemi distribuiti, con architettura client/server [1]. Del protocollo Z39.50 ricordiamo qui solo le funzionalita' che lo caratterizzano rispetto ad altri protocolli e che possono risultare percio' piu' interessanti per l'utente; una introduzione alle caratteristiche di base del protocollo e' data in [2]; tuttavia il protocollo e' in continua evoluzione, ed e' consigliabile consultare il sito WEB dell'Agenzia di manutenzione [3] per avere una documentazione aggiornata del suo stato.
Nel modello di funzionamento del protocollo, il client, chiamato origin, e il server, chiamato target, comunicano con un dialogo che avviene in una connessione diretta, che viene mantenuta per tutta la sessione; al client spetta il compito di attivare la comunicazione, inviare l'interrogazione e richiedere l'invio dei record di risposta ; al target, il compito di ricevere i messaggi dal client, e, interagendo col sistema informativo a cui e' interfacciato, rispondere al client con i record che corrispondono alla interrogazione o con messaggi diagnostici.
La rilevante novita' del protocollo Z39.50 e' che esso offre, a sistemi diversi per hardware, software e contenuto informativo, la possibilita' di scambiarsi dati semanticamente riconoscibili anche al di fuori del contesto, strutturale e linguistico , in cui sono stati creati; il protocollo infatti standardizza la struttura e la semantica delle interrogazioni e dei record.
Tale "interoperabilita' semantica", che e' caratteristica del protocollo Z39.50, unita alla capacita' di offrire ricerche contemporanee su una molteplicita' di basi di dati, si traduce per l'utente nella possibilita' di:
Oltre alle funzioni finalizzati alla ricerca e al ricupero, il protocollo ne definisce altre, finalizzate al controllo, da parte del target, dell'accesso all'informazione e dell'uso delle risorse informative e, di conseguenza, dei costi della ricerca.
Poiche' il protocollo e' rivolto ad un' ampia gamma di applicazioni - OPAC, basi di dati museali e archivistici, archivi di documenti elettronici, sistemi informativi della pubblica amministrazione, basi di dati geografici e spaziali - esso definisce con specifici profili quali funzionalita', fra quelle definite dal protocollo, debbano essere obbligatoriamente implementati per ciascuna applicazione. Componente importante di ciascun profilo, sono gli attributi , attraverso quali si specifica quali devono essere i punti di accesso, e le corrispondenti modalita' di accesso alle basi di dati affinche' siano soddisfatti i requisiti del profilo di quella specifica applicazione. Con il riferimento a differenti "insiemi di attributi", il protocollo Z39.50 permette di specializzare la semantica delle interrogazioni, mantenendo costanti i meccanismi di tutte le altre funzionalita'.
Il progetto ARCA
Il progetto ARCA [4] ha dato contributi originali allo sviluppo e alla implementaione del protocollo, affrontando con successo l'obiettivo di realizzare, per la parte target , un software di applicazione generale e proponendo soluzioni implementative che rendono effettiva la potenzialita' di interoperabilita' semantica fra origin e target.
Tenteremo di illustrare queste caratteristiche in modo estremamente sintetico, rimandando per i dettagli alla documentazione del progetto e a [5,6].
Generalita' di applicazione e portabilita' del sistema
La generalita' di applicazione del Target ARCA risponde principalmente alla necessita' di un software che possa essere interfacciato agli OPAC delle biblioteche con un minimo sforzo di programmazione. L'implementazione del protocollo Z39.50, anche nelle sue caratteristiche basilari, richiede infatti un impegno di programmazione che difficilmente puo' trovare risposta in una biblioteca.
La soluzione offerta dal Target ARCA riposa nella sua architettura, schematizzata in Fig. 1.
Come e' mostrato dalla figura, il Target ARCA e' composto da due sottosistemi. Uno di questi, denominato "Target core" - il nucleo del Target ARCA - esplica tutte le funzioni di comunicazione con il client, in accordo con i requisiti del protocollo. Una sua speciale funzione e' verificare se le interrogazioni ricevute dal client sono accettabili dall' OPAC; per fare questo, il nucleo confronta la struttura e gli attributi della frase di interrogazione con le caratteristiche dell'OPAC registrate nel suo DIZIONARIO. Se la verifica da' esito positivo, il nucleo interagisce con il sottosistema "OPAC, al quale passa le interrogazioni ricevute dal client e dal quale riceve i risultati, record o messaggi diagnostici, da trasmettere in risposta al client. Se la verifica da' esito negativo, il nucleo invia in modo autonomo messaggi diagnostici al client.
Il vantaggio offerto da tale soluzione architetturale e' che il Target esplica la maggior parte delle sue funzioni in modo indipendente dall'OPAC; all'OPAC infatti e' richiesto solo di eseguire le sue funzioni primitive, cioe' l'esecuzione delle interrogazioni e la resa dei risultati, interagendo con il nucleo attraverso l'interfaccia chiamata "Application Programming Interface-API" .
Fig. 1 - L'architettura del Target ARCA
Per interfacciare il Target ARCA con qualsiasi OPAC e' percio' soltanto necessario:
Il Target e' portabile sulle seguenti piattaforme: Solaris 2.5, SunOS 4.1, HP UX10.10, IBM AIX 3.2.5, DEC ALPHA OSF 3.2, Linux 2.0, Windows NT.
Implementazione dell'interoperabilita' semantica
Le caratteristiche di interoperabilita' semantica del protocollo Z39.50 hanno ricevuto pieno riconoscimento nel progetto ARCA, che ha offerto uno dei pochi esempi di implementazioni e utilizzo della base di dati EXPLAIN.
Poiche', nella prima fase del progetto, l'analisi dei problemi connessi al mapping degli attributi aveva messo in evidenza i rischi di affidare le funzioni di origin all'interfaccia-utente degli OPAC, una delle prime scelte del progetto e' stata la realizzazione di un software autonomo per le funzioni di origin Z39.50. Obiettivo principale di tale realizzazione e' stato sfruttare pienamente una delle funzionalita' opzionali del protocollo, la base di dati EXPLAIN, per affrontare la difficolta' principale della comunicazione via Z39.50: la difficolta', cioe', di impostare interrogazioni per sistemi informativi di cui non si conoscono punti di accesso e modalita' di accesso.
Il risultato di tali scelte di progetto e' il client ARCA, la cui caratteristica principale e' la capacita' di conformare il suo comportamento alle caratteristiche del target a cui si connette, autoconfigurandosi in base alle informazioni lette nella base di dati EXPLAIN dello stesso target.
Nella comunicazione fra un client e un target ARCA - cosi' come nella comunicazione fra un client ARCA e qualsiasi target che abbia implementato la base di dati EXPLAIN - l'utente non ha la necessita' di documentarsi preventivamente su cio' che il target permette; e' infatti il client a mostrargli le opzioni che il Target e' capace di soddisfare, e solo quelle.
Il progetto ACCESSIBILITA'
Come E' noto il progetto dell'ICCU denominato "Accessibilità alle basi dati residenti sul sistema Indice SBN" ha realizzato un nuovo catalogo della rete. Gli obiettivi che si volevano raggiungere erano che fosse uno strumento flessibile, orientato all'utenza, facile da usare, accessibile liberamente via Internet e interoperabile. La realizzazione E' ed E' stata interamente finanziata dal Ministero per i Beni Culturali e Ambientali e ultimata a fine 1997.
L'OPAC SBN oggi e' consultato da circa 20.000 utenti al giorno, contiene circa 3.800.000 notizie bibliografiche in formato UNIMARC che sono scaricate con cadenza settimanale da 3 delle 9 basi dati ospitate dall'Indice SBN: Libro moderno, Libro antico e Musica; le notizie si riferiscono a 7.500.000 di documenti localizzati in circa 800 biblioteche italiane. L'OPAC oltre all'accesso all'informazione consentirà anche tra breve l'attivazione delle richieste di prestito e fornitura documenti
L'OPAC E' un sistema aperto che interopera con sistemi standard in rete grazie alle nuove componenti software che comprendono: le procedure di conversione dal formato SBN a UNIMARC, la base dati IR, il server SBN Z39.50, il gateway HTTP/Z39.50, il client SBNZeta in ambiente windows, il client SBN OLUIT e il client SBN per l'accesso 3270. Le procedure realizzate dal progetto sono disponibili gratuitamente per le biblioteche SBN che ne facciano richiesta all'ICCU. Ad oggi oltre 30 biblioteche hanno già ricevuto il client SBNZeta e di recente E' stata avviata anche la distribuzione di SBNOLUIT.
L'accesso con modalità standard al target SBN E' possibile da parte di un qualsiasi client Z39.50, ma anche di un qualsiasi utente internet, grazie al modulo gateway che converte le richieste HTML in Z39.50 e viceversa. Inoltre il sistema offre un servizio particolare per gli utenti autorizzati a collegarsi al sistema gestionale dell'Indice: l'accessso all'opac senza il prerequisito dell'accesso ad internet. Questo grazie all'istallazione di un client Zeta direttamente sul sistema centrale.
L'ICCU, per alcuni aspetti dell'implementazione, si E' avvalsa del contributo scientifico delle Università di Bologna, Firenze, Padova e Torino. In particolare l'Università di Firenze ha definito una serie di opzioni relative all'applicazione dello standard Z39.50 nel contesto SBN (mapping). Su questo nucleo iniziale E' stata avviata l'analisi progettuale che ha tenuto conto dei risultati raggiunti dai progetti finanziati dalla Comunità Europea quali ARCA e ONE[7], inoltre, per il collaudo dell'interoperabilità del sistema, l'ICCU si E' avvalso anche di esperti del CNUCE e dell'IEI.
Una prima evoluzione del progetto Accessibilità E' attualmente in corso di realizzazione e consiste nella realizzazione di interventi migliorativi sulle procedure di scarico dei dati dalle basi dati gestionali Libro Moderno, Libro Antico e Musica verso il sistema OPAC; sarà inoltre integrata nel sistema OPAC la versioni evolute del gateway HTTP/Z39.50 nella versione stateful.
Per gli utenti web che si collegano all'indirizzo http://opac.sbn.it E' prevista l'attivazione di un servizio di accesso contemporaneo a più basi dati. Il medesimo servizio che oggi E' offerto dalla Library of Congress.
Entro la fine del 1998, saranno completati gli interventi innovativi che renderanno accessibili sull'OPAC anche altre due basi dati residenti sull'Indice: Anagrafe Biblioteche e Manoscritti. L'utente potrà effettuare ricerche integrate sulle basi dati dell'Indice e recuperare libri, periodici, manoscritti e stampe musicali che abbiano elementi comuni. Sono stati comunque definiti profili di ricerca specifici per ciascuna delle tipologie di materiale.
L'evoluzione dell'OPAC prevede inoltre la
realizzazione di nuove funzioni quali la visualizzazione e lo scarico in
linea delle notizie in formato standard UNIMARC, il controllo degli accessi
al fine dell'erogazione di servizi ad utenti riconosciuti, l'ordine
di un documento ad una biblioteca, il recupero dei documenti via rete,
legato alla effettiva disponibilità di documenti in formato elettronico
presso le biblioteche.
I nuovi servizi saranno attivati per gli utenti
web all'indirizzo internet: http://opac.sbn.it, ma come conseguenza dell'architettura
standard dell'OPAC potranno essere attuivati anche da generici client
Z39.50 che abbiano sviluppato le funzioni relative allo scarico dei dati
e all'ordine del documento previsti da Z39.50.
Il profilo SBN
Il profilo SBN, presentato nell' Appendice, descrive l'insieme delle funzioni, dei punti di accesso e delle modalità di ricerca (mapping) attivate sul nuovo sistema di interrogazione dell'Indice in applicazione a quanto prevede lo standard ISO 23950.
Il profilo E' stato presentato a Bruxelles il 20 novembre all'ultima riunione EFILA (European Forum for Implementors of Library Automation) e ad Orlando (USA) il 22 gennaio all'ultima riunione ZIG (Z39.50 Implementor Group).
Il profilo SBN E' sovrainsieme di quelli CENL,
ONE e ATS1 che sono stati definiti nell'ambito delle più recenti realizzazioni
europee e nordamericane.
Conoscere quale profilo E' stato applicato in
un OPAC consente di dare una prima soluzione a quella interoperabilitÃ
semantica che lo standard affida ad EXPLAIN. Il servizio EXPLAIN infatti
non E' ancora attivo sull'OPAC dell'Indice, come in moltissime realizzazioni
internazionali
L'utente che conosce il profilo dell'OPAC
può impostare ricerche compatibili con le caratteristiche della base dati
a cui si sta connettendo. A tal fine su internet sono presenti moltissimi
siti nei quali sono descritti i punti di accesso, le modali tà di ricerca,
i servizi standard attivi, etc.
L'uso del profilo consente ad un client Z39.50 generico (anche non SBN) di effettuare ricerche ed interoperare con il target dell'Indice utilizzando come punti di accesso:
Note
[1] Information Retrieval (Z39.50): Application
Service Definition and Protocol Specification (ANSI/NISO Z39.50-1995).
- Bethesda, MD : NISO Press, 1995. - ISBD 1-880124-22-X
ANSI Z39.50 e' un protocollo per il livello
di applicazione nel modello di interconnessione tra sistemi aperti sviluppato
da NISO (National Information Strandard Organisation), un comitato di ANSI
(American National Standards Institute), e mantenuto dalla Library of Congress.
Lo standard ha subito un'evoluzione dalla prima versione del 1988 a quella
del 1992; nel 1995 ne e' stata rilasciata una terza versione ampliata.
La terza versione e' un sovrinsieme dello standard
ISO "10163-1991 Information and Documentation - Search and Retrive application
protocol specification for open systems interconnection"; il TC 46/SC4/WG4
ha quindi provveduto ad attivare una "fast track procedure" per adeguare
lo standard ISO a quello ANSI. Alla data odierna il nuovo standard ISO
23959 E' nella fase draft finale.
Nella terminologia del protocollo Z39.50, il
client e' chiamato "origin" e il server e' chiamato
"target".
[2] Gli standard OSI per le Biblioteche : Dalla biblioteca-catalogo alla biblioteca-nodo di rete / Antonio Scolari. - Milano : Editrice Bibliografica, 1995
[3] Il sito WEB dell'Agenzia di manutenzione si trova alla URL : http:// lcweb.loc.gov/z3950/agency/
[4] La documentazione del progetto ARCA e' disponibile alla URL: http://www.pisa.intecs.it/projects/ARCA/
[5] Tayloring Z39.50 on Existing Databases: th ARCA Project / M. Loffredo, M.B. Baldacci, O. Signore. - Proceedings 8th International Workshop on Database and Expert Systems Applications (September 1-2, 1997, Toulouse, France). IEEE Computer Society, 1997; pp.332-338.
[6] ARCA Client User Manual / J. Favaro, A. Catoni. - Libraries Programme Project Lib-Arca2-3009, Arca/T24/UM, May 1997.
[7] ONE (OPAC Network in Europe). ONE ha lo scopo di facilitare l'accesso ai maggiori database europei tramite il protocollo Z39.50. Le 15 istituzioni che partecipano al progetto appartengono a 8 paesi europei (Norvegia, Gran Bretagna, Danimarca, germania, Olanda, Austria, Svezia e Finlandia). che hanno messo a disposizione complessivamente quasi 40 milioni di record bibliografici distribuiti in oltre 18 basi di dati. La realizzazione del progetto OPAC SBN consente l'interoperabilita' dell'Indice con gli archivi coinvolti in ONE.
Appendice
Caratteristiche tecniche del sistema: | Dati tecnici del profilo | |
hardware: IBM 7013-J30 RISC
6000 RAM: 512 MB 
disk: 40 GB sistema: IBM AIX 4.15  DBMS: BASIS Plus Versione L1G.2A  linea di comunicazione:TCP/IP  indirizzo del server Internet: opac.sbn.it  numero porta: 2100 ore di disponibilità : 0-24 |
versione del protocollo Z39.50: 
2,3 servizi:  Init, Search, Present, Scan, Sort, Delete, Close tipo di interrogazione: 1 (RPN), 101 insieme di attributi: BIB-1 e specifiche estensioni del database sintassi dei record: SUTRS insieme dei caratteri di interrogazione: ISO 646 + ISO8859-1 insieme dei caratteri dei record: ISO 646 + ISO 8859-1 presentazione del record:  Analitica (Full), Sintetica (Brief) |
La tabella riporta le seguenti colonne:
uso | nome del punto di accesso |
valore | valore del punto di accesso indicato in Bib-1 |
struttura | valore di default che specifica il tipo di ricerca assegnato automaticamente |
Web | indica se il punto di accesso E' attivo anche nell'interfaccia Web |
Uso | Valore | Struttura | Web |
nome personale | 1 | 6 | |
nome di ente | 2 | 6 | |
nome di congresso | 3 | 6 | |
titolo | 4 | 6 | X |
titolo della collezione | 5 | 6 | X |
titolo uniforme | 6 | 6 | |
ISBN | 7 | 6 | X |
ISSN | 8 | 6 | X |
classificazione Dewey | 13 | 1 (frase) | X |
classificazione locale | 20 | 1 | |
soggetto | 21 | 6 | X |
soggetto locale | 29 | 6 | |
data | 30 | 4 | |
data di pubblicazione | 31 | 4 | X |
titolo parallelo | 35 | 6 | |
variante del titolo | 41 | 6 | |
titolo proprio del documento collegato | 42 | 6 | |
numero bibliografia nazionale | 48 | 6 | |
numero editoriale musica | 51 | 6 | |
codice di lingua | 54 | 1 | X |
codice del paese di pubblicazione | 55 | 1 | X |
nome e titolo | 57 | 6 | |
luogo di pubblicazione | 59 | 6 | |
note | 63 | 6 | |
autoreâ€"titolo | 1000 | 6 | |
tipo di documento | 1001 | 1 | |
nome | 1002 | 6 | X |
autore | 1003 | 6 | X |
autore-nome personale | 1004 | 6 | |
autore-nome di ente | 1005 | 6 | |
autore-nome di congresso | 1006 | 6 | |
numeri di identificazione | 1007 | 6 | X |
data di inserimento | 1011 | 5 | |
data di aggiornamento | 1012 | 5 | X |
parole chiave (Any) | 1016 | 6 | X |
editore | 1018 | 6 | X |
livello bibliografico | 1021 | 1 | X |
tonalità | 1025 | 1 | X |
periodico collegato | 1026 | 6 | |
codice identificativo del record | 1032 | 1 | |
contenitore (Host item) | 1033 | 6 | |
tipo di contento | 1034 | 1 | |
tutta la descrizione (Anywhere) | 1035 | 6 | |
Autore â€" Titolo â€" Soggetto | 1036 | 6 |
Uso | Valore | Struttura | Web |
natura catalografica | 3000 | 4 | |
ISMN | 3004 | 6 | |
numero di catalogo tematico | 3006 | 6 | |
impronta | 3008 | 6 | X |
data di composizione | 3010 | 4 | X |
luogo di pubblicazione â€" soggetto | 3012 | 6 | X |
forma musicale | 3014 | 4 | X |
organico | 3016 | 6 | X |
organico analitico | 3018 | 6 | |
organico sintetico | 3020 | 6 | |
organico analitico della elaborazione | 3022 | 6 | |
organico sintetico della elaborazione | 3024 | 6 | |
parti (lista sintetica) | 3026 | 6 | |
titolo proprio | 3028 | 6 | |
titolo proprio di altro autore | 3030 | 6 | |
titolo uniforme | 3032 | 6 | |
titolo della sezione o parte | 3034 | 6 | |
titolo appellativo | 3038 | 6 | |
incipit letterario | 3040 | 6 | |
incipit musicale | 3041 | 6 | X |
titolo alternativo | 3042 | 6 | |
titolo dell'opera letteraria desunta | 3044 | 6 | |
titolo dell'opera parafrasata | 3046 | 6 | |
personaggio (e interprete) | 3050 | 6 | X |
codice tipo di relazione | 3056 | 6 | |
area di edizione | 3072 | 6 | |
area di pubblicazione | 3074 | 6 | |
area titolo e responsabilità | 3086 | 6 | |
marca | 3087 | 6 | X |
codice anagrafe biblioteche | 3088 | 4 | |
dati di rappresentazione musicale | 3089 | 6 | X |
presentazioni di documenti musicali | 3090 | 6 | |
segnatura | 3091 | 6 | X |
classificazione Dewey â€" descrizione | 4014 | 6 | X |
editore (codice di relazione=650) | 4051 | 6 | X |