«Bibliotime», anno XX, numero 1-2-3 (novembre 2017)

Precedente Home Successiva



Elisa Zilli

Rinvii e suggerimenti fra voci del Nuovo Soggettario all'Università di Trieste



Abstract

This article analyses the procedures involved in the creation of the subject headings of Trieste pole of the national union catalogue SBN. The change-over to the SKOS RDF format of the Nuovo Soggettario thesaurus has facilitated the updating of the obsolete terms present in the authority file. The change-over has also enabled the inclusion of the terms from the New Subject Index that were not present in Trieste pole of the national union catalogue SBN until now. Moreover it has been possible to incorporate the references, the hierarchical links, the add-ons and the new terms as well as the corrected terms already present in Trieste pole of the national union catalogue SBN.

Il Polo TSA di Trieste e del Friuli Venezia Giulia, costituitosi nel 1993, è uno dei due poli del Servizio Bibliotecario Nazionale (SBN) presenti attualmente in Friuli Venezia Giulia, ed è coordinato dall'Università di Trieste.

E' un polo misto, costituito da circa 140 biblioteche, appartenenti a più di 40 enti, distribuiti su tutto il territorio regionale, di natura disomogenea. Il colloquio con l'Indice SBN è garantito grazie all'utilizzo del software SOL (Sebina Open Library) per l'ambiente di back-office; per quel che riguarda il front-office, il Polo è dotato di 2 Opac (uno tradizionale a uno di nuova generazione), per venire incontro alle esigenze della propria utenza [1].

Il nuovo Opac, denominato Biblioest, permette di accedere a funzionalità più consone a quelle attualmente offerte dal cosiddetto Web 2.0 [2] e permette di espandere le modalità di ricerca; pertanto si sono potuti proporre, a fianco dei tradizionali canali di ricerca (autore, titolo..) anche dei canali di ricerca più liberi, che permettono all'utente una ricerca legata all'argomento o alle parole chiave.

Attraverso l'attuale visualizzazione dei risultati in Biblioest, è possibile inoltre filtrare i risultati grazie a faccette descrittive e alla nuvola dei tag semantici.

Per permettere ciò, il polo ha da tempo proposto agli operatori l'inserimento di dati facoltativi, che le istituzioni possono affiancare a quelli obbligatori, arricchendo quindi i campi di ricerca relativi a un documento.

A tali accessi, di natura squisitamente semantica, aderisce ogni singola Istituzione, valutando la fattibilità e l'utilità di tale operazione in base alla mission delle proprie biblioteche. Gli accessi semantici utilizzati in Polo sono attualmente il soggetto e la classe, affiancati da altri strumenti, come keyword, abstract, ed altri codici di natura semantica (genere, genere del contenuto, tipo di pubblicazione..) [3].

Di certo l'accesso semantico più usato dalle biblioteche del nostro Polo è quello per soggetto. In SOL i soggetti confluiscono in un authority file dedicata, distinta da quella dei termini; ogni soggetto dà vita quindi a uno o più termini, che si generano automaticamente.

I soggetti presenti sui documenti di Polo a febbraio 2017 erano circa 234.000 (su un totale di circa 2 milioni e 15 mila documenti). Di questi, 20.000 erano legati ai documenti digitali provenienti dalla piattaforma di Rete Indaco; 24.000 erano afferenti al soggettario della Biblioteca del Seminario di Concordia di Pordenone, ma tenuti in un ambiente separato e inerte [4]. Ne rimanevano "solo" 190.000 circa a comporre il Soggettario comune a tutto il Polo. Questi soggetti erano collegati a 89.000 termini (82.000 forme accettate, 7.800 forme di rinvio).

Negli anni i termini inseriti, e l'elaborazione delle stringhe di soggetto, hanno seguito regole differenti e questo ha causato la creazione di un ambiente eterogeneo, difficoltoso nell'utilizzo per l'operatore.

Una gran parte dei soggetti di Polo (e quindi i termini relativi) sono stati elaborati seguendo le norme ed utilizzando i termini del Soggettario in uso nelle biblioteche italiane fin dal 1956; dal 2008 il Polo ha iniziato invece a utilizzare il Nuovo Soggettario di Firenze. Com'è noto, i termini del Vecchio Soggettario e quelli del Nuovo Soggettario sono differenti [5], molte volte vengono in contrasto tra loro, e la formazione del soggetto segue regole molto diverse.

Quindi molti soggetti del soggettario di Polo e molti termini erano sbagliati, sia per la scelta delle parole utilizzate, sia per la loro composizione all'interno della stringa di soggetto. Pertanto, a partire dal 2008, anno di adesione del Polo al Nuovo Soggettario, venne iniziata, per opera del Centro Polo, una massiccia bonifica dei termini, che seguiva le varie bonifiche portate avanti dai colleghi del gruppo di lavoro sulle Linee Guida per la catalogazione per autori e soggetti [6]. Tale bonifica doveva svecchiare il soggettario, eliminando i termini obsoleti e sostituendoli gradatamente con quelli del Nuovo Soggettario.

L'operazione, portata avanti manualmente, aveva dato negli anni risultati minimi: su 82.000 termini accettati, a febbraio 2017 solo 6.400 erano stati sistemati; e su 7.800 termini di rinvio, solo 2.800. Secondo i calcoli del Centro Polo, erano almeno 50.000 i termini ancora da controllare e bonificare; inoltre, rimaneva il problema dei legami fra termini, poiché per rendere il lavoro, già di per sé titanico, il più agile possibile, si era deciso di lavorare solo sulle forme accettate dei termini e sugli eventuali rinvii (forme scartate), e di accantonare temporaneamente tutte le eventuali relazioni gerarchiche e associative (BT, NT, RT), presenti invece sul Tesauro di Firenze.

La situazione dei termini di soggetto di polo, a febbraio 2017, risultava quindi essere la seguente:

Questa situazione, oltre a essere confondente per l'operatore di back-office, non portava a nessun giovamento all'utente, poiché negli OPAC gli era preclusa la possibilità di ricercare e di navigare all'interno di una rete di rapporti tra i termini più ampia.

A partire da marzo 2017 è stata avviata una bonifica automatica dei termini di soggetto, resa possibile da una funzionalità offerta dalla release di SOL 3.1 (attualmente in uso nel Polo TSA). Grazie a questa è stato possibile utilizzare una modalità automatica di riversamento del termini dal Nuovo Soggettario di Firenze, scaricabili attraverso l'import dei metadati, tramite il formato SKOS/RDF, direttamente nel catalogo.

L'operazione ci ha consentito di trasformare l'Archivio dei Termini di soggetto del Polo TSA nel Tesauro del Polo TSA, comprensivo di tutte le gerarchie contemplate nel Nuovo Soggettario di Firenze, e corredando i termini di tutti gli elementi contemplati dal Nuovo Soggettario. Da una parte, quindi, è stato possibile bonificare l'archivio dei Termini di soggetto del Polo TSA in modo da renderlo uniforme, coerente e corretto, e permetterne una facile consultazione all'operatore; dall'altra, si è potuto mettere a disposizione dell'utente finale un ambiente di ricerca più ricco e soddisfacente.

Al fine di testare la fattibilità del progetto, è stata effettuata una simulazione del lavoro in un ambiente fittizio. Il software SOL utilizzato dal Polo TSA è disponibile infatti anche in un ambiente di prova (SOL Trial), che offre le medesime funzionalità dell'ambiente di lavoro reale, utilizzando i dati scaricati dall'ambiente di lavoro corrente. I dati presenti attualmente in SOL Trial risalgono a circa un anno fa [7].

Sebbene i dati dei due ambienti non siano coincidenti (poiché i dati dell'ambiente reale si aggiornano ogni giorno), le funzionalità interne sono le medesime. Quindi, all'interno di SOL Trial, esiste un'authority file dei termini di soggetto, uguale nella struttura al SOL reale, che presenta gli stessi problemi di quella in ambiente reale.

Tale authority fittizia è stata utilizzata per verificare la fattibilità del progetto; al suo interno si sono compiute tutte le operazioni fondamentali per la riuscita delle operazioni: le statistiche di inizio/fine lavoro, l'import automatico, ed una bonifica parziale; tali operazioni hanno permesso di verificare il numero di termini oggetto dell'import, ed il tempo necessario allo svolgimento delle operazioni.

E' stato inoltre possibile testare l'utilità del lavoro dal punto di vista dell'utente, grazie alla presenza di un Opac di prova (relativo al SOL di prova) che ha permesso di visualizzare i dati inseriti e modificati.

Le operazioni (in ambiente di prova prima, ed in ambiente reale poi) si sono svolte secondo l'ordine seguente:

1. Esecuzione di una statistica iniziale dei termini complessivi presenti nel Soggettario di Polo.

2. Import dei Termini del Soggettario a categorie [8].

3.Terminato l'import di ogni categoria, si è provveduto alla verifica del numero di record importati, dei record problematici e bloccati, resi disponibili da programma in un elenco.

4. I record bloccati (che la procedura non ha potuto importare perché la presenza di una qualche difformità nei dati di arrivo non lo ha permesso) sono stati oggetto di una prima bonifica manuale.

5. Si sono effettuati dei test a campione per verificare la corretta generazione della struttura gerarchica dei termini, costituitasi a seguito dell'import; sia in back-office sia in front-office;

6. Terminati gli import, sono state lanciate delle statistiche complessive.

I dati finali rilevati sono riportati nella tabella seguente:

Nuovo Soggettario di Firenze

sit. Iniziale

sit. Finale

Termini Complessivi

89.000

127.000

Termini di Rinvio

7.800

26.925

Legami tra termini creati

94.265

Termini complessivi importati

38.000

Termini bonificati manualmente

2.000

Grazie a questo import, è stato inoltre possibile conoscere il numero dei Termini utilizzati in SOL ma non presenti nel Nuovo Soggettario. Si tratta di circa 68000 termini. Di questi, la gran parte riguardano nomi propri, e solo una porzione sarà soggetta a una bonifica manuale.

La comunità bibliotecaria che compone il Polo TSA ha atteso pazientemente, da innumerevoli anni, una bonifica soddisfacente dell'archivio dei termini di tesauro. Fino ad ora, l'Ufficio di centro polo aveva compiuto in questi anni solo bonifiche mirate, sulla base delle richieste specifiche degli operatori; ciò aveva permesso solo di risolvere le situazioni più problematiche o di normalizzare i termini più in uso. La realizzazione di questo lavoro ha quindi apportato di certo dei benefici al lavoro di molti bibliotecari.

Ma la realizzazione di questo progetto ha permesso anche di offrire agli utenti del catalogo un potenziamento delle modalità di ricerca.

Secondo l'indagine recentemente proposta agli utenti dalla biblioteca tecnico scientifica dell'Università di Trieste, Biblioest si piazza al secondo posto per utilità (dopo il servizio di prestito e consultazione), e al terzo posto per qualità (dopo Prestito e consultazione e Informazioni bibliografiche allo sportello) [9] tra i servizi di biblioteca offerti dall'Ateneo.

L'utenza può ora svolgere ricerche più rispondenti ai propri bisogni, potendo navigare all'interno del termine e dei legami a esso correlati; sarà inoltre possibile inoltre accedere a consigli di lettura legati all'argomento del documento cercato, grazie alla possibilità offerta dal modulo integrato in Biblioest "Forse ti può interessare".

Questa funzionalità facoltativa, prevista nel pacchetto evolutivo di Biblioest per il 2017, sarà a breve attivata; tale funzione permetterà all'utente, dopo aver effettuato una ricerca, di trovare dei consigli di lettura elaborati in base ai termini di soggetto affini o collegati a quelli del documento di partenza.

Conclusa la prima, onerosa fase di import dei termini del Nuovo Soggettario, sarà necessario continuare ad importare i nuovi termini che, con aggiornamenti semestrali, vengono messi a disposizione sul sito del Tesauro del nuovo Soggettario.

Inoltre, dovranno essere evidenziate le modalità di bonifica manuale dei termini extra Nuovo Soggettario (nomi propri di persona ed ente, luoghi geografici, opere…) onde procedere manualmente ad una bonifica di termini e di stringhe di soggetto duplicati o scorretti.

Sebbene quindi il lavoro non possa di certo dirsi concluso, questa prima fase ha già apportato dei benefici sia all'ambiente di front office che a quello di back office.

Elisa Zilli, Biblioteca Digitale - Università degli Studi di Trieste, e-mail: zilli@units.it


Bibliografia

Ultima consultazione dei siti web citati: 25/09/2017

Tutte le immagini sono di proprietà di Data Management

Note

[1] Nel 2015 sono stati registrati circa 400.000 prestiti, per un bacino complessivo di oltre 26.000 utenti.

[2] Paola Poli, Dall'opac a BiblioEst: i servizi di Front-office del Polo TSA, in: Fabrizio de Castro (a cura di), Il punto sul Servizio Bibliotecario Nazionale e le sue realizzazioni nel Friuli Venezia Giulia, Trieste, EUT Edizioni Università di Trieste, 2014, p. 289-295.

[3] Per ulteriori informazioni si veda: Fabrizio de Castro, Le keywords ed i codici bibliografici in SOL - Polo TSA per l'arricchimento del catalogo, <http://www.biblio.units.it/images/page253/codici_bibliografici_keyword_polo_TSA_decastro.pdf>.

[4] Si tratta di soggetti redatti secondo regole di soggettazione obsolete, visibili negli Opac, ma non utilizzabili nella catalogazione di Polo. Saranno oggetto nel futuro di una bonifica, non ancora programmata.

[5] Si cita, a titolo di esempio, il termine Fanciulli (Vecchio Soggettario) sostituito da Bambini (Nuovo Soggettario).

[6] Per questa e le altre bonifiche coordinate dal centro Polo, si veda Elisa Zilli, I gruppi di lavoro e le bonifiche nel polo TSA tra il 2003 e il 2013, in Fabrizio de Castro (a cura di), Il punto sul Servizio Bibliotecario Nazionale e le sue realizzazioni nel Friuli Venezia Giulia, Trieste, EUT Edizioni Università di Trieste, 2014, p. 257-264

[7] I dati dell'ambiente di prova vengono aggiornati tutte le volte in cui una nuova biblioteca entra in Polo con il proprio posseduto. L'ultimo ingresso di una biblioteca con i propri dati risale, appunto, ad un anno fa circa.

[8] Le categorie contemplate dal Nuovo Soggettario di Firenze sono: Agenti (suddivisi in Organismi, Organizzazioni, Persone e Gruppi), Azioni (Attività, Discipline, Processi), Cose (Forme, Materia, Oggetti, Spazio, Strumenti, Strutture), Tempo.

[9] Questionario dal titolo La biblioteca che vorrei. Un questionario qualitativo sui servizi offerti dalle biblioteche scientifiche e biomediche dell'Università degli Studi di Trieste, a cura di Cristina Cocever; realizzato con Google Forms, è stato somministrato online agli utenti delle biblioteche tecnico scientifiche dell'Università di Trieste nel corso di dicembre 2016.




«Bibliotime», anno XX, numero 1-2-3 (novembre 2017)

Precedente Home Successiva


URL: http://www.aib.it/aib/sezioni/emr/bibtime/num-xx-1-2-3/zilli.htm