[aiblogo3a] Associazione italiana biblioteche. Pubblicazioni
Caterina Fasella. Il recupero del pregresso: metodi e strategie

Molto si è già detto e scritto sulla conversione dei cataloghi cartacei in cataloghi elettronici, sull'opportunità dell'operazione, nonostante costi e oneri, sulle diverse tecniche utilizzabili e sull'individuazione di quella più adatta, sull'estensione dei progetti [1]. In questo intervento pertanto, a una breve introduzione, seguiranno solo alcune osservazioni di carattere tecnico relative ai progetti di recupero del pregresso, e alcune considerazioni di ordine generale circa le tendenze attuali e le previsioni per l'immediato futuro.

Perché retroconvertire?

Si tratta di consentire, o di facilitare, la consultazione del catalogo da parte degli utenti, sia dei lettori interni che non saranno più costretti a ripetere la medesima ricerca su cataloghi diversi a seconda della data di acquisizione dei documenti da parte della biblioteca, sia di chi consulta il catalogo in linea dall'esterno. Entrambe le categorie usufruiranno delle potenzialità di ricerca che un catalogo elettronico è in grado di offrire, impensabili in un catalogo cartaceo. Studi recenti hanno messo in luce come, in ambienti nei quali la diffusione dei cataloghi elettronici è tale che i lettori hanno maggiore dimestichezza con l'OPAC [2] di quanta ne abbiano con lo schedario, la presenza di una notizia nel solo catalogo cartaceo ne decreti la morte in vita.

Non va dimenticato il vantaggio rappresentato dalla possibilità di automatizzare il servizio di prestito dell'intera collezione, n‚ il fatto che l'automazione rende più agevole l'eventuale pubblicazione del catalogo, e dei suoi derivati, su diversi tipi di supporto.

Le tecniche di recupero

Catalogazione originale. Adatta soprattutto a biblioteche di piccole dimensioni, o a progetti circoscritti, richiede un notevole investimento di risorse in termini economici, professionali e di tempo. Ciò nonostante è stata praticata anche da biblioteche di grandi dimensioni, come la Bayerische Staats-bibliothek di Monaco, il cui progetto di recupero, che comportava la creazione ex novo di alcune centinaia di migliaia di notizie, ha avuto inizio nel 1981 per giungere a conclusione, dopo dodici anni, nel 1993.

Digitazione da scheda. Presuppone l'esistenza di un catalogo, o di altre fonti catalografiche, sufficientemente affidabile ed esaustivo. E' celebre il progetto della British Library che previde la doppia digitazione dei medesimi dati da parte di due distinti gruppi di persone allo scopo di individuare gli errori in modo automatico, mediante confronto.

Scansione ottica. Il metodo, decisamente innovativo, ha visto la luce negli Stati Uniti, ma ha trovato in Europa, soprattutto negli ultimi anni, un fertile terreno di sperimentazione. E' applicabile solo se le schede del catalogo, o comunque dei testi da scandire, rispondono a determinati requisiti di leggibilità e di uniformità. Il limite principale è rappresentato, almeno per ora, dalla necessità, affinché l'operazione risulti vantaggiosa, di disporre di un efficiente programma di correzione automatica degli errori e di elaborazione del testo delle notizie in un formato bibliografico leggibile dal sistema.

Derivazione da fonti esterne [3]. E' un sistema vantaggioso sotto molti punti di vista, anche se la convenienza varia considerevolmente a seconda del contesto nel quale viene applicato. Presuppone l'esistenza, e l'individuazione, di fonti elettroniche adatte, in grado di garantire una percentuale di sovrapposizione con il catalogo tale da giustificare l'impresa. Poiché difficilmente sarà possibile derivare tutti i dati di cui si ha bisogno, la tecnica comporta necessariamente il ricorso ad altri metodi. L'inevitabile articolarsi del progetto in varie fasi richiede una particolare cura nell'organizzazione del flusso di lavoro.

La scelta della tecnica

L'individuazione della tecnica che meglio risponde alle nostre esigenze è cruciale per l'esito del progetto. In molti casi sarà necessario adottare più soluzioni. La decisione dipende dalle caratteristiche della collezione, dal settore disciplinare, dalle condizioni e peculiarità del catalogo originale, dalla quantità di dati da trattare, dalle esigenze dell'utenza, dalle regole catalografiche locali, dal grado di omogeneità e di fedeltà alle normative al quale si ritiene necessario adeguarsi per garantire l'efficienza del catalogo stesso.

Una biblioteca ricca di pubblicazioni scientifiche o prevalentemente in lingua inglese potrebbe trovare vantaggioso il ricorso alla catalogazione derivata dalle grandi basi di dati statunitensi. In una piccola biblioteca storica con un catalogo poco uniforme, costituito da schede brevi e non troppo accurate, si potrebbe ragionevolmente optare per la catalogazione originale.

Cosa retroconvertire?

Decidere se il progetto debba riguardare l'intero catalogo della biblioteca o soltanto una parte, ossia definire l'estensione del recupero, dipende, tra l'altro, dalla frequenza d'uso del materiale, connessa a sua volta con il settore disciplinare di specializzazione. La letteratura scientifica, ad esempio, è caratterizzata da rapida obsolescenza, tanto che per una biblioteca specializzata nel settore della chimica o della fisica potrebbe rivelarsi opportuno limitare il recupero alle pubblicazioni più recenti (ultimi cinque anni), ai periodici correnti, e alle principali opere di base, riservando eventuali risorse in esubero alla fornitura di spogli, di abstract e di indicizzazione o ad altri servizi di informazione bibliografica.

Indipendentemente dalla frequenza d'uso, anche il valore storico e culturale di un particolare fondo può costituire un validissimo motivo per deciderne il recupero. Non va dimenticato che in alcuni casi è la mancata segnalazione in forma elettronica la causa principale della scarsa richiesta di certi documenti. Dal punto di vista del mondo dell'informazione elettronica, infatti, è come se non esistessero.

I PROGETTI DI CONVERSIONE RETROSPETTIVA

Due aspetti particolarmente delicati della preparazione e della successiva realizzazione del progetto riguardano l'organizzazione del lavoro e l'entità delle modifiche e degli interventi che sarà necessario apportare ai dati. Entrambi gli aspetti possono determinare infatti problemi piuttosto insidiosi e di non facilissima previsione.

L'organizzazione del lavoro

Nella maggioranza dei casi il progetto di recupero, indipendentemente dalla tecnica adottata, richiede una cura particolare nella definizione delle procedure, nell'attribuzione dei compiti e delle responsabilità, nella logistica e nell'allestimento degli spazi. Poiché il rischio di una cattiva organizzazione è la perdita, o la duplicazione, di una parte delle notizie, è vitale non solo programmare nel dettaglio il susseguirsi delle operazioni ma anche verificarne costantemente la corretta esecuzione.

La complessità varia in funzione della tecnica di retroconversione, della quantità di dati da trattare, della quantità di tecniche differenti utilizzate, del numero di fasi in cui si articola il lavoro, della necessità di seguire gli spostamenti di materiale di diversa natura: libri nel caso della catalogazione originale; schede o loro riproduzioni, cassetti, staderini nel caso della digitazione e della scansione; floppy disk, nastri, print-out nel caso della derivazione di dati da fonti elettroniche esterne.

Ciascuna tecnica presenta, da questo punto di vista, problemi almeno in parte differenti.

Se si catalogano i documenti di prima mano, un'attenzione particolare richiede l'organizzazione connessa allo spostamento dei libri dagli scaffali alle scrivanie dei catalogatori e viceversa, e l'organizzazione logistica nel suo insieme.

Se si ricorre alla digitazione da scheda cartacea o alla scansione ottica, merita altrettanta cura la movimentazione dei cassetti dello schedario, o degli staderini, o dei volumi, necessaria, a seconda dei casi, per l'inserimento, la fotoriproduzione o la scansione.

Nel caso della scansione ottica, in particolare, il susseguirsi delle fasi di correzione degli errori e di formattazione del testo delle notizie deve essere definito nei minimi dettagli, indipendentemente dal fatto che le due operazioni vengano effettuate in modo automatico o manuale.

Quando si derivano notizie dall'esterno può accadere di rivolgersi a più fonti, e accade senz'altro di utilizzare più tecniche. Il ricorso a fonti e tecniche disparate rende comunque complesso il succedersi delle fasi di lavoro. Le modalità stesse di derivazione incidono sulla complessità del progetto: inviare richieste di notizie catalografiche utilizzando dischetti o nastri, attendere i risultati e, una volta ricevuti, discriminare tra quelli esatti, quelli da verificare, quelli che hanno dato luogo a occorrenze multiple, quelli errati, che andranno cercati altrove o recuperati in altro modo, sono tutte operazioni che, se trascurate, determinano errori e imprevisti. Eventuali ritardi nelle risposte, ad esempio, possono provocare arresti o rallentamenti, seguiti magari da un improvviso afflusso di grandi quantità di notizie da trattare.

L'entità delle modifiche

La quantità e la complessità delle modifiche da apportare alle notizie recuperate affinché siano compatibili con quelle già presenti nel catalogo elettronico che le ospiterà deve essere valutata attentamente. Alla qualità e quindi alla funzionalità di un catalogo contribuisce in larga misura l'omogeneità delle notizie che lo compongono. Essa determina infatti il grado di certezza con il quale l'utente potrà effettuare ricerche diverse applicando criteri costanti, applicando, cioè, un metodo che deduce dalla pratica stessa della consultazione.

Un catalogo cartaceo tollera un grado di difformità maggiore rispetto a un catalogo elettronico. Differenze di secondaria importanza, come quelle dovute a errori di battitura, o all'uso di abbreviazioni, possono essere corrette manualmente al momento dell'inserimento delle schede nei cassetti, con conseguenze praticamente nulle per il lettore. In un catalogo elettronico, al contrario, la più trascurabile delle differenze può causare problemi di reperimento.

La necessità di adottare un formato leggibile dalla macchina, e quindi di applicare un insieme di norme supplementari rispetto alla catalogazione tradizionale, aumenta, sotto certi punti di vista, le possibilità di errore.

In molti casi il recupero del pregresso rappresenta un'occasione irripetibile, ed estremamente favorevole, per adeguare il catalogo esistente alle nuove normative, soprattutto per quanto concerne la scelta e la forma delle intestazioni. L'adeguamento della descrizione bibliografica alle normative correnti richiederebbe infatti, per essere correttamente eseguita, il ricorso alla catalogazione originale.

Non di rado il progetto di recupero offre l'occasione non solo per aggiornare il catalogo dal punto di vista normativo, ma anche per costruire un authority file. Si può prevedere la creazione di notizie di authority per tutte le intestazioni, o solo per alcune particolari categorie. L'automazione di un catalogo di una biblioteca archeologica, ad esempio, può rendere necessaria la contestuale creazione di un authority file per le intestazioni relative ai monumenti antichi, in modo da consentire agli studiosi della materia di utilizzare le voci comunemente adottate nei repertori specialistici, magari in contrasto con le normative catalografiche in uso. Si pensi ai monumenti antichi di Roma, i quali nei principali repertori di topografia antica della città vengono citati con il nome latino, e la cui forma accettata è invece quella italiana: Amphiteatrum Flavius vedi Anfiteatro Flavio, Templum Veneris et Romae vedi Tempio di Venere e Roma.

Nel caso della scansione ottica il lavoro di correzione e revisione delle notizie può rivelarsi particolarmente oneroso, specialmente se non si dispone di programmi in grado di trasformare il testo delle schede in un formato bibliografico interpretabile dal sistema e di correggere in modo automatico gli errori.

Nel caso della catalogazione derivata da fonte che adotti norme almeno in parte diverse o che utilizzi un'altra lingua le modifiche da apportare alle intestazioni possono essere anche molto consistenti. L'intervento richiesto dalle intestazioni per soggetto, ad esempio, sarà di considerevole portata, a meno che non si conservi la soggettazione delle notizie derivate. In una biblioteca biomedica il fatto che la lingua franca del settore sia l'inglese potrebbe rendere addirittura conveniente il ricorso a una soggettazione in quella lingua. In tutti i casi nei quali tale soluzione sia impraticabile occorre valutare se effettuare la traduzione o la conversione nel soggettario locale (operazione non facile), o se risoggettare autonomamente il documento, naturalmente di prima mano.

LA SITUAZIONE E LE TENDENZE ATTUALI

Negli Stati Uniti l'automazione dei cataloghi rappresenta la norma, la cooperazione catalografica è una tradizione ormai radicata, esistono grandi cataloghi di biblioteca e collettivi in forma elettronica consultabili da ogni parte del mondo, sono praticamente assenti barriere linguistiche e normative, gli standard, che sono spesso standard di fatto, vedono una diffusa applicazione. E' quindi naturale che si pratichi prevalentemente la catalogazione derivata e partecipata.

L'Europa, al contrario, è caratterizzata dalla frammentazione del patrimonio librario, dalla presenza di un grande numero di biblioteche storiche, ricche di documenti rari e di pregio, e dalla esistenza di barriere linguistiche e normative. L'impegno, in termini professionali, economici e di tempo, per recuperare il pregresso è rilevante. La catalogazione dei documenti è più complessa, ed è più difficile reperire notizie in forma elettronica, o perlomeno non risulta facile individuare un numero limitato di fonti alle quali attingere con risultati soddisfacenti, e se la ricerca avviene su troppe fonti la derivazione non è conveniente.

D'altra parte occorre considerare che il pregio stesso delle raccolte recuperate rappresenta un vero e proprio "valore aggiunto". Si mettono a disposizione del mondo dell'informazione elettronica notizie che prima non lo erano, relative a documenti di rilevante interesse storico e culturale e a limitata diffusione, ossia posseduti da un esiguo numero di biblioteche nel mondo. Non ci si limita a segnalare un'ulteriore localizzazione di documenti la cui esistenza è già registrata elettronicamente e che vedono comunque un'ampia diffusione. Di questo "valore aggiunto" del recupero del pregresso delle biblioteche storiche europee è bene essere consapevoli. Il maggiore costo che la conversione retrospettiva rappresenta per molte di esse potrebbe infatti essere bilanciato, e magari compensato, proprio dal "valore aggiunto" delle notizie recuperate.

La presenza di numerose biblioteche storiche da un lato, con i problemi ad esse connessi, e le barriere linguistiche e normative dall'altro, hanno probabilmente contribuito a fare dell'Europa un terreno particolarmente fertile, negli ultimi anni, per la sperimentazione della tecnica del recupero mediante scansione ottica, tecnica già sperimentata negli Stati Uniti ad opera di OCLC [4] negli anni '80. Si pensi, tra gli altri, al progetto europeo FACIT [5] (1993-1995) realizzato da danesi (Ufficio nazionale per le biblioteche, Staatbiblioteket Aarhus, Kongelige Bibliotek, Synergi I/S), italiani (Biblioteca nazionale centrale di Firenze e Biblioteca nazionale Vittorio Emanuele III di Napoli) e greci (Biblioteca nazionale) con il finanziamento della Comunità europea, per lo sviluppo di un programma di individuazione e correzione automatica degli errori e di formattazione automatica delle notizie catalografiche [6] al progetto MORE [7] dedicato al riconoscimento ottico del formato MARC nell'ambito di progetti di retroconversione, ad opera di francesi e belgi [8].

Relativamente alle barriere linguistiche e normative che ostacolano in Europa lo scambio delle informazioni bibliografiche, esse non possono e non devono essere eliminate, possono però essere superate.

Per quanto concerne la descrizione bibliografica, l'adozione, pressoché generalizzata, delle norme ISBD [9] ha consentito di superare in gran parte le differenze normative. Qualora si accetti il principio di tollerare l'uso di lingue diverse, in particolare nelle aree della descrizione fisica e delle note, e in quella specifica del materiale, perché le altre, salvo integrazioni del catalogatore, sono redatte nella lingua del documento catalogato, resta il problema, indubbiamente più grave, delle intestazioni.

Non tutte le intestazioni presentano forme accettate in quanto differiscono da un paese all'altro per motivi di lingua o di regole catalografiche. Per la maggioranza dei nomi di persone vissute in età moderna, ad esempio, purché scritti in alfabeto latino, non si riscontrano varianti di rilievo. In linea generale i criteri per stabilire la forma accettata dei nomi di persona, di ente, di congresso, ecc. sono divenuti sempre più uniformi, tanto che nella maggioranza dei casi, fatte salve alcune secondarie differenze di punteggiatura, le intestazioni variano sostanzialmente più per motivi linguistici che normativi. Occorre ricordare però che, in un catalogo elettronico, anche la più trascurabile differenza, come un diverso modo di indicare la data di nascita e di morte, o l'assenza o la presenza di un elemento, l'uso di un nome abbreviato invece che esteso, l'uso di una qualificazione diversa, dà luogo a duplicazioni che possono rivelarsi piuttosto numerose persino nella categoria dei nomi personali.

Con la realizzazione di authority files multilingue che consentano la creazione di legami tra le diverse forme accettate di una medesima intestazione, diviene possibile superare le barriere linguistiche e normative conciliando il rispetto delle esigenze locali con il bisogno di uniformità che lo scambio delle informazioni in ambito internazionale impone.

Utilizzando l'authority file multilingue in fase di importazione, o in fase di esportazione, le intestazioni possono essere modificate in modo automatico sulla base della lingua e delle norme in uso. Integrando l'authority multilingue all'interno del sistema, diviene possibile effettuare la catalogazione e la consultazione in una qualsiasi delle lingue disponibili, a scelta. Un simile strumento, quindi, non si limita ad agevolare lo scambio di notizie bibliografiche, ma rende addirittura praticabile la condivisione di un medesimo catalogo da parte di biblioteche che adottano forme diverse di una medesima intestazione.

Allo sviluppo del multilinguismo per il trattamento delle intestazioni si sta dedicando, e non solo in Europa, dal momento che anche gli Stati Uniti [10] sono interessati alla condivisione delle risorse catalografiche prodotte nel vecchio continente, particolare attenzione.

Tra gli altri, il CoBRA [11], istituito presso la British Library nel 1993 con fondi della Comunità europea, ha avviato nel 1995 due studi di fattibilità che dovrebbero concludersi intorno alla metà del 1996: AUTHOR [12] dedicato alla condivisione in rete di authority files per nome nazionali e UNIMARC dedicato all'applicazione del formato Unimarc a basi di dati multinazionali.

Un altro modo per superare, almeno in parte, i limiti imposti dalle barriere normative e linguistiche alla consultazione di archivi, catalografici e non, è rappresentato dalla possibilità di applicare il multilinguismo ai sistemi di interrogazione e recupero delle informazioni. Sempre in ambito europeo, il progetto TRANSLIB [13] per l'applicazione delle tecnologie avanzate all'interrogazione dei cataloghi, e i due progetti CANAL [14] per l'accesso multilingue in linguaggio naturale e DEMOLIT [15] per la progettazione di un OPAC multilingue [16] si propongono di integrare nell'interfaccia per l'utente strumenti linguistici, come dizionari, tabelle di conversione, lessici terminologici, thesauri intelligenti, sistemi di traduzione, strumenti di analisi linguistica, sistemi esperti, in modo da consentire l'interrogazione multilingue di cataloghi e documenti di biblioteca [17].

Note

[1] Tra gli altri, P.G. Weston e C. Fasella. Il recupero del pregresso: considerazioni tecniche e metodologiche. In Il linguaggio della biblioteca, scritti in onore di Diego Maltese, raccolti da M. Guerrini. Firenze: Regione Toscana, 1994, p. 887-900, al quale rimando anche per i riferimenti bibliografici.
[2] Online Public Access Catalogue.
[3] Si veda: La catalogazione derivata, a cura di P.G. Weston. Città del Vaticano: Biblioteca Apostolica Vaticana, 1993.
[4] Online Computer Library Center.
[5] Fast Automatic Conversion with Integrated Tools.
[6] N.E. Wille. Retroconvertire con lo scanner: un'introduzione al progetto FACIT. «Bollettino AIB», 33 (1993), n. 4, p. 467-474; Ufficio centrale per i beni librari e gli istituti culturali. L'osservatorio dei programmi internazionali per le biblioteche 1989-1994, Roma: De Luca, 1995, p. 55-56.
[7] MARC Optical Recognition.
[8] Ufficio centrale per i beni librari e gli istituti culturali. L'osservatorio dei programmi internazionali per le biblioteche 1989-1994, Roma: De Luca, 1995, p. 62-63.
[9] International Standar Bibliographic Description.
[10] S.E. Thomas, J.A. Younger. Cooperative cataloguing: a vision for the future. In Cooperative cayaloguing: past present and future, B.B. Baker ed. New York: Haworth Press, 1993, p. 246-247.
[11] Computerised Bibliographic Record Actions.
[12] R. Bourne. The virtual catalogue: practical implications and managerial aspects. «European Research Libraries Cooperation», 5 (1995), n. 4, p. 357.
[13] Advanced Tools for Accessing Library Catalogues.
[14] Catalogue Multilingual Natural Language Access.
[15] Designing a Multilingual OPAC using Linguistic Tools.
[16] Gli ultimi due, inizialmente indipendenti, si sono successivamente fusi in un unico progetto.
[17] Ufficio centrale per i beni librari e gli istituti culturali. L'osservatorio dei programmi internazionali per le biblioteche 1989-1994, Roma: De Luca, 1995, p. 89-92.


FASELLA, Caterina. Il recupero del pregresso: metodi e strategie. In Catalogazione retrospettiva: esperienze nelle biblioteche del Lazio, p. 15-26.
HomePage AIB-WEB | Pubblicazioni AIB | Indice del volume
Copyright AIB, ultimo aggiornamento 1997-12-17 a cura di Gabriele Mazzitelli