«Bibliotime», anno XI, numero 1 (marzo 2008)

Precedente Home Successiva



Pino Buizza

Gli opac: funzionalità e limiti nel mondo del web *



Avendo personalmente bisogno di schematizzare distinguo due complessi di problemi:

a) La funzionalità degli OPAC: l'interfaccia OPAC rappresenta il catalogo, ne restituisce il valore?

b) Gli OPAC (e i cataloghi) restano isolati e scompaiono nel web, non sono via di ricerca preferita dagli utenti: va bene così (isolamento nella specificità), oppure dobbiamo, e come possiamo, riposizionarli nel mondo Web e farli interagire con gli utenti?

Mi soffermo soprattutto sul primo quesito, se le potenzialità informative del catalogo siano pienamente sfruttate e poste a disposizione degli utenti, e distinguo due diverse modalità di intervento secondo cui si cerca rimedio ai limiti e difetti riscontrati:

1. arricchimento e implementazione dell'OPAC con la visibilità per gli utenti di ciò che ora resta nascosto;

2. applicazioni software che elaborano ulteriormente e automaticamente i dati di catalogo.

1.1. C'è un catalogo occulto, non visibile agli utenti perché non è ricercabile dall'OPAC. Ne enuncio in breve gli elementi più significativi (generalizzando, naturalmente non tutti gli OPAC sono uguali).

Sul versante semantico [cfr. le indagini di OPAC semantici: <http://www-dimat.unipv.it/biblio/sem/>] sono spesso carenti o negati agli utenti:

Sul versante semiotico mancano spesso:

Dunque l'OPAC non rende pienamente giustizia a gran parte del lavoro di catalogazione.

1.2. Il catalogo tradizionale è ovviamente arricchito dall'OPAC, per tutte le nuove possibilità di ricerca, l'intertestualità, etc. che sono state aggiunte e altre che ancora ci si ingegna ad aggiungere. Esaminando solo alcune di queste "aggiunte", sicuramente positive, segnalo anche qualche criticità e aspetti suscettibili di miglioramento:

Due riflessioni dopo questo primo esame. Queste varie iniziative, realizzate o proposte, rappresentano, nella catalogazione, una linea di condotta che privilegia la fase di input, che richiede più dati e meglio codificati, non li riduce né semplifica, esige anzi che essi siano ben rappresentati nell'offerta standard dell'OPAC. Puntando a qualità, precisione e dettaglio, risulta più costosa e risponde a ricerche più sofisticate, di utenza più ristretta, rispetto alla maggioranza di utenti a cui bastano pochi dati essenziali; può sembrare inutilmente dispendiosa. Ma la ricchezza e il vantaggio maggiori credo dipendano ancora dalla differenza che corre fra dati controllati e non controllati, fra ciò che formalizziamo e acquista un valore e ciò che desumiamo così come è, e ne ha un altro, fra indici assegnati e indici derivati. E oggi la carenza maggiore della nostra catalogazione è proprio nel controllo d'autorità, a cui andrebbe dedicata maggior attenzione in fase di produzione, proprio per la funzionalità che ne deriverebbe, in positivo, e, in negativo, perché l'authority system è un ambiente dove ogni infezione porta grave rischio di epidemie.

La seconda osservazione: l'OPAC delineato, è evidente, resta molto legato al catalogo tradizionale, ma è altrettanto fondamentale abbracciare in pieno, mentalmente e operativamente, l'idea dell'indipendenza dell'OPAC dal catalogo, nel senso che quello non deve essere una replica di questo resa più amichevole, ma un'offerta ricca e modulabile, in cui sia possibile anche intraprendere percorsi di ricerca e di selezione su informazioni d'interesse del tutto soggettivo.

I dati devono essere in catalogo con le opportune codifiche, ma, da un punto di vista software, non siamo più così legati alla struttura (architettura) del catalogo da doverla usare anche per la ricerca, e conviene pensare l'OPAC indipendente, per sfruttare i dati codificati nel modo più libero, secondo le esigenze diverse: sia sistematicamente (per esempio con la "FRBR-izzazione" dei cataloghi), sia nell'approccio individuale (per esempio per ottenere in risposta insiemi di elementi e di relazioni selezionate, come con una query in un database). Gli utenti, che sono plurali non solo per numero ma per tipologia, devono proprio per questo trovare la ricchezza dei dati di catalogo secondo opzioni modulari (tipi di ricerca, di presentazione) di cui abbiano la consapevolezza, perché i criteri sono esplicitati, per poter scegliere il proprio percorso (comprese, tra l'altro, le interfacce nelle diverse lingue).

Infine, nei confronti delle softwarehouse, il ruolo del bibliotecario è quello del committente, che chiede ciò che gli serve (anche perché lo paga), non che adegua le regole o la loro applicazione a quanto gli applicativi attuali sanno fare. Ora nell'ISBD preliminary consolidated edition sono prescritte coppie di parentesi quadre per ogni elemento, quando si presentano in successione più elementi interpolati: era questo che volevamo per la descrizione, un insieme di celle isolate, semplicemente più comode da gestire?

2. L'altra modalità per arricchire e potenziare il catalogo è l'impiego di applicazioni sotfware aggiunte all'OPAC, specialmente per migliorare le ricerche in cui non si trova o, soprattutto, si trova troppo. Dato per acquisito che sono normalmente disponibili sia browsing che searching (sia per stringa che per parola/e - ma non sempre ci sono entrambi), oltre a diversi approcci (semplice, base, avanzato) e a una molteplicità di parametri e filtri per l'interrogazione, si sono affacciati e si vanno diffondendo funzionalità aggiuntive, di solito applicate sui risultati della ricerca libera, che esamino brevemente.

- Faceted browsing (scorrimento per faccette): oltre ai risultati della ricerca sono presentati, col rispettivo numero di occorrenze, i soggetti e gli autori più ricorrenti fra i record selezionati, e la distribuzione numerica dei record secondo i valori di altre "faccette" (es. disciplina, formato, lingua, anno di pubblicazione, biblioteche in cui sono disponibili ...), elementi utili per orientare i successivi passi di ricerca (euristica); un buon rimedio alla ricerca semplice, procedimento un po' strano, in realtà, perché è già disponibile la ricerca combinata, il faceted browsing interviene a correggere la ricerca semplice con i modi della ricerca combinata; già una combinata che prima del risultato presenti i dati numerici dei singoli elementi ricercati (per esempio l'OPAC del LIUC di Castellanza [<http://www.biblio.liuc.it/>]) avverte e suggerisce l'opportunità di un raffinamento o allargamento (forse un solo passaggio in più è inaccettabile per la fretta dominante!).

Un paio di attenzioni però: che le voci presentate diano davvero un raffinamento della ricerca già effettuata, mentre in alcuni sistemi, inavvertitamente per l'utente, viene lanciata una nuova esplorazione sull'elemento suggerito, indipendentemente dalla ricerca precedente (così in Evergreen che indica soggetti e autori sotto un ambiguo "My title results" [cfr. l'OPAC della Georgia Library, PINES, <http://gapines.org/opac/en-US/skin/default/xml/index.xml>]).


Inoltre è da verificare quale sia il criterio utilizzato nella ricerca di parole: parola esatta o parola troncata o sequenza di caratteri? [effetti curiosi in due siti italiani, dove il faceted browsing è più correttamente designato come "filtri": l'autore più prolifico fra quelli richiamati con la ricerca "lenti" si chiama Montalenti, ma scrisse di evoluzionismo (Istituto e museo di storia della scienza, <http://biblioteca.imss.fi.it/indice.html>), e per "fede" è il filosofo Michele Federico Sciacca nelle cui schede la parola "fede" non ricorre (Pontificia università lateranense, <http://aquabrowser.pul.it/LAT/>)]; o anche la parola corretta con leggere varianti grafiche, tipo fuzzy searching? E la combinazione di parole è in and, come ci aspetteremmo, o in or, visto che i sistemi cercano di facilitare in ogni modo il ricercante e il peggior risultato - per chi fornisce il servizio e fino al limite del ridicolo - è dover rispondere "Sorry, no document found" o "Keine Datensätze gefunden"? [per assurdo, forzando un buon sistema come Endeca con la progressiva eliminazione delle vocali, è possibile ottenere 126 documenti anziché 0 per 'brwzzn', con la semplice precisazione a posteriori "Also searched for 'brazen'", nel catalogo della North Carolina State University, <http://www2.lib.ncsu.edu/catalog/>]

- Fuzzy searching: mi sembra utile solo in caso di penuria, vuoi di documenti vuoi di informazioni. Comunque dovrebbe essere mirata e limitata, per esempio alle flessioni grammaticali, ossia dove vi è un nucleo semantico comune (a ciò già ovvia in gran parte, ma non in tutto e con rumore, il troncamento di parola); supponendo che sia il nucleo semantico ciò che interessa, ma non è sempre così (tornerò più avanti sul pasticcio fra semiotica e semantica). In ogni caso, non sarebbe meglio presentare in lista le alternative grafiche per un possibile errore o per un dato incerto (una funzione simile a quella dei suggerimenti di correzione ortografica) invece che tutti i risultati, compresi quelli non richiesti e inutili?

- Relevance ranking: l'ordinamento dei risultati secondo la rilevanza sarebbe un buon primo rimedio alla opulenza dei dati: presenta subito ciò che più è rilevante in modo da soddisfare la richiesta senza far perdere tempo. Ma quali sono i criteri di costruzione della rilevanza? Riccardo Ridi per i motori di ricerca ne enuncia ben undici: frequenza, densità, rarità, compresenza, prossimità, posizione, priorità, provenienza, età e aggiornamento, popolarità, tariffazione [<http://www.burioni.it/forum/ridi-mot.htm>]. Negli OPAC questi criteri non sono esplicitati (anzi c'è la tutela del segreto per interesse commerciale) se non nelle informazioni generali, sono comunque puramente quantitativi e statistici e non sono impostabili per gli utenti, se non eventualmente e in generale al momento dell'implementazione del dispositivo.

Nella valutazione dei sistemi di ricerca la rilevanza è considerata un valore soggettivo, relativo all'utente, ora la troviamo oggettivata, secondo la frequenza dei termini richiesti, la loro posizione, i link ricevuti... Il vantaggio del relevance ranking allora risulta aleatorio per il singolo utente, che è inconsapevole e non interagisce. Quanto più pesa nell'algoritmo l'interazione collettiva (ciò che è più offerto e che più persone cercano è più rilevante), tanto più il criterio è funzionale all'omologazione di massa (ma ciò che vale in statistica o nella sociologia dei consumi, non necessariamente vale per me o per te, qui e ora). In ogni caso non è sostitutivo di un'impostazione meglio mirata della ricerca, di cui anzi segnala l'esigenza.

- Suggerimenti imitativi: li troviamo nei siti commerciali e compaiono ora anche negli OPAC "chi legge ... legge anche ...". Suggerimento assolutamente libero e facoltativo, ma non sarebbe meglio presentare i criteri secondo cui altri documenti sono simili a questo (sullo stesso soggetto o tema, dello stesso autore, genere, ambito, opere antecedenti o successive ...)? In modo di capire se mi interessa "rileggere" secondo il suggerimento (chi, per esempio, vorrà leggere un altro manuale di biblioteconomia, dopo averne letto uno?), o ampliare la lettura evitando di seguire comportamenti disomogenei di utenti che hanno esigenze variabili.

- Word cloud, la tecnica che individua all'interno di un insieme testuale, anche complesso come un intero catalogo, i termini collegati alla parola scelta e li rappresenta visivamente come una costellazione di relazioni alla parola stessa, usata in AquaBrowser Library per la funzione discover: una mappa visuale affiancata alla lista dei risultati di ricerca che aiuta a scoprire quale è l'intorno del termine richiesto, cioè che cosa sto realmente cercando, in che direzioni posso esplorare. [<http://www.aquabrowser.com/?page=aquabrowserlibrary/overview>].

In AquaBrowser la costellazione di termini prevede e distingue con diversi colori 4 categorie di relazioni col termine centrale: Associazioni, Varianti ortografiche, Traduzioni, Thesaurus (un quinto colore per i termini già visti nel percorso di ricerca). Nelle varianti ortografiche i termini sono rappresentativi di una varietà di forme che non sono solo differenze ortografiche e flessioni o forme scorrette dello stesso termine, ma varianti abbastanza larghe della sequenza di lettere data; la ricerca peraltro ha già incluso nei risultati i troncamenti a destra e a sinistra e l'inclusione delle parole date, indipendentemente dal significato. Fra le traduzioni sono mostrati gli equivalenti di altre lingue presenti nel risultato della ricerca, comprese più traduzioni per la medesima lingua se il termine di partenza ha più significati o appartiene a più lingue. Per la ricerca i termini varianti e le traduzioni rappresentano alternative ai termini usati.

I termini della categoria Associazioni sono, di fatto, le ricorrenze più numerose risultanti nell'insieme trovato, esclusi i termini di ricerca. Sono parole di qualsiasi categoria grammaticale e semantica, associate al termine di partenza a prescindere dal suo significato o polisemia, dalla possibile omografia fra parole di lingue diverse; sono comprese vere associazioni semantiche, che tuttavia non sono marcate come tali, collocazioni linguistiche, semplici compresenze nel record e associazioni fra parole di uno stesso nome (per esempio fra cognome e nome) o fra una parola di un titolo e il nome dell'autore. Non vanno prese come un reticolo semantico, al contrario fanno capire che cos'è ciò che sto cercando, da quali parole è circondata la mia parola, compreso il richiamo ad associazioni che non avevo ipotizzato e che forse non desidero ma che il sistema mostra esistere. Il thesaurus non l'ho trovato applicato: sarebbe l'applicazione veramente utile, ma richiede un'implementazione intelligente, studiata, e, in fondo, alternativa alla word cloud, perché darebbe relazioni semantiche controllate anziché relazioni di cooccorrenza [ora il Thesaurus regionale toscano è in implementazione nella nuova interfaccia della rete CoBiRe].

Nel complesso mi sembra, senza l'uso di un thesaurus, uno strumento molto imperfetto per le funzioni di ricerca e sostanzialmente ingannevole per l'utente ingenuo, se se ne dimentica l'utilità per l'esclusione di termini e l'intento esplorativo, di scoperta attraverso il suggerimento incontrollato e illimitato a tutto campo. Ne rivaluterei piuttosto l'aspetto ludico, per lo spunto che offre al vagare per libere associazioni, secondo curiosità e sorpresa. Sarebbe ottimo anche per inventare i quiz del programma televisivo che precede il telegiornale delle 20 su Rai 1 (L'Eredità o Ghigliottina: cinque parole disparate ma linguisticamente collocate con la sesta, che è da indovinare).

Il tono critico e un po' irridente nei confronti di questa varietà di applicazioni alle ricerche in OPAC non toglie l'apprezzamento per chi tenta e realizza nuove funzionalità; in fondo è un po' un gioco anche il mio andare a cercar difetti. Mi preoccupa però lo scarto fra quanto appare all'utente, quanto in effetti avviene e quanto sarebbe possibile. Penso a quale abissale differenza corre fra sistemi di questo genere e quello del Nuovo Soggettario, che oggi si pone come punta avanzata, a livello mondiale, dell'indicizzazione controllata e consapevole. Mille volte preferibile investire su questo, secondo me.

Perché, ancor più in profondità e in silenzio, un'altra distinzione viene oggi negata in confusione: quella fra il versante semiotico e quello semantico. Il difetto fondamentale, in cui mi sembra si voglia di nuovo ricadere col catalogo globale, è la negazione della difformità degli indici e della ricerca semiotica e semantica, indotti dal dato di fatto che la ricerca libera tende ad omologare tutto.

Se non teniamo fermo che le parole dei nomi e dei titoli hanno valore e funzione di designazione di entità, di riferimento, e altro non significano (almeno in prima istanza), e non possono essere sostituite se non da altre parole pure usate per la stessa entità (come varianti grafiche, per traduzione, sostituzione), e non hanno legame interessante con parole diverse se non con le altre che compongono il nome stesso, mentre le parole usate per rappresentare i significati (in forma assegnata o derivata che sia) valgono per concetti, hanno connotazione e denotazione, relazioni semantiche di equivalenza (quindi sono fungibili da altre parole anche del tutto diverse morfologicamente), relazioni gerarchiche e associative, e stanno in contesto con altri termini significativi secondo relazioni sintattiche definibili… se non teniamo fermo tutto ciò, se non promuoviamo questa consapevolezza almeno a livello embrionale, non faremo un buon servizio ai nostri utenti, ed essi non trarranno pieno beneficio dai nostri OPAC.

Per concludere, un solo accenno alla questione dell'OPAC sommerso nel web. Con la più recente evoluzione del Web 2.0, della Library 2.0, e della biblioteca come conversazione, tornano in scena i corollari, o le amplificazioni, del criterio distintivo fra dati controllati e non controllati, secondo cui possiamo ora contrapporre, o raffrontare dialetticamente, lo stile della codificazione e quello della condivisione, dove l'autorevolezza è sostituita dalla trovabilità, dal successo di consenso, dal peso dei numeri; dove alla "meta" (ancora ignota, ma almeno presagita corrispondente a certe aspettative) si sostituisce la "ventura" (andar sospinti a destinazioni inaspettate), con i limiti e il fascino di entrambe; movimento oscillante, che se puntasse verso l'omologazione anziché verso la personalizzazione avrebbe tradito la bibliografia, che è differenza, distinzione, discontinuità del sapere [Attilio Mauro Caproni, L' inquietudine del sapere, Milano, Sylvestre Bonnard, 2007].

La fase che attraversiamo è caratterizzata, come è detto nel titolo della giornata, da "fluidità", che significa sia flessibilità fra opposti, sia regolabilità a piacere, qualità entrambe essenziali per gli strumenti che presentiamo ai nostri utenti. Ma ciò che è fluido, per stare nella metafora, tende al basso, non si regge, non si innalza come ciò che è consolidato, si disperde se non ha contenitore.

Personalmente ritengo che più controllo c'è, più il gioco funziona, purché a chi interroga siano offerte con chiarezza le opzioni che consentano di scegliere i percorsi di ricerca più consoni alle proprie esigenze: questo il nostro contributo specifico all'integrazione dei cataloghi nel web. In ogni caso, è fondamentale essere chiari, per noi prima ancora che per gli utenti, sull'aspettativa a cui il catalogo può corrispondere, se possiamo ancora considerarlo predittivo nella capacità di offrire risposte certe, oppure euristico nell'offrire passaggi successivi consapevoli, oppure ipotetico nella certezza che quel che si trova è sufficiente.

, Biblioteca Civica Queriniana - Brescia, e-mail: gbuizza@comune.brescia.it


Note

* Questo articolo riprende il testo della relazione tenuta in occasione del Seminario " Il catalogo oggi: le norme catalografiche fra consolidamento e fluidità", Modena, 13 dicembre 2007.




«Bibliotime», anno XI, numero 1 (marzo 2008)

Precedente Home Successiva


URL: http://static.aib.it/aib/sezioni/emr/bibtime/num-xi-1/buizza.htm