Associazione italiana
biblioteche. BollettinoAIB 2006 n. 1/2 p.
107-108 L'Associazione italiana per la documentazione avanzata, nata nel 1983 da un'iniziativa di Paolo Bisogno, si pone come obiettivo lo sviluppo della professione del documentalista e delle attività e dei servizî connessi; con questo volume l'AIDA vuole riassumere gli sviluppi delle teorie in merito alle tecniche di MultiMedia Information Retrieval (MMIR) e presentare una rassegna delle più importanti iniziative italiane e internazionali in corso.
Con MMIR si definiscono i sistemi di recupero delle informazioni multimediali digitali che non vengono costretti nei vincoli della lingua e che permettono a chi effettua ricerche di comunicare la propria query al sistema non attraverso modalità testuali, come soggetti o parole chiave, ma visive, sonore o audiovisive; l'obiettivo del MultiMedia Information Retrieval è la costituzione di banche dati di documenti multimediali sulle quali far agire motori di ricerca che operino tramite specifici linguaggi di interrogazione. Per fare ciò è particolarmente importante verificare quale sia la percezione umana delle somiglianze e della rilevanza, apprendendo dai comportamenti degli utenti per presentare le informazioni nella maniera più efficace.
Le tradizionali tecniche di Information Retrieval si sono sviluppate grazie all'attenzione e al confronto quasi esclusivi di professionalità come i documentalisti e i bibliotecari; nel momento in cui si sono diffusi documenti non esclusivamente testuali, la disciplina ha attirato l'attenzione di competenze diverse attinenti a settori disciplinari eterogenei, e ha iniziato ad alimentarsi grazie a contributi intellettuali di ambito umanistico, sociale o tecnologico.
Il volume voluto dall'AIDA è curato da Roberto Raieli e Perla Innocenti, che sono anche gli autori dei quattro contributi che costituiscono la prima parte del libro, nei quali vengono illustrate le tematiche del MMIR nelle sue tre articolazioni, il Visual, il Video e l'Audio Retrieval. Nelle seconda e nella terza parte del volume, in lingua inglese, vengono presentate rispettivamente alcune esperienze europee e internazionali.
Come spiega Raieli nel contributo che apre, dopo una breve introduzione di Lucia Maffei, presidente dell'AIDA, il volume, il MultiMedia Information Retrieval non vuole assolutamente contrapporsi alle più familiari tecniche di Information Retrieval; nasce però l'esigenza di specificare che le tecniche di recupero delle informazioni attuate attraverso l'utilizzo di parole costituiscono solo uno degli ambiti dell'IR: il Text Retrieval.
Questa esigenza deriva dalla crescita e dallo sviluppo sempre maggiori di banche dati il cui contenuto è costituito da immagini statiche e dinamiche e da suoni. L'Information Retrieval nella classica accezione del termine è materia per documentalisti e bibliotecari che, attraverso l'analisi delle modalità con i quali gli utenti descrivono e trattano le informazioni, hanno allestito delle modalità di descrizione per le quali i documenti di natura testuale vengono rappresentati tramite una stringa di termini che acquisisce un senso in quanto inserita in un sistema di faccette, classi e sottoclassi. Questo tipo di recupero, che si definisce term-based, agisce quindi tramite surrogati descrittivi che si rivelano però molto insoddisfacenti nel caso in cui vengano applicati a documenti non testuali.
Per agevolare le ricerche in banche dati multimediali ci si sta indirizzando verso modalità di indicizzazione multimediale; in questo modo diventa possibile effettuare una query che ricerchi su indici costituiti non solo da termini ma anche da immagini, figure, melodie, forme, suoni, ecc. In questo modo si sviluppano sistemi che si svincolano dalla ricerca esclusivamente testuale.
Tutti i sistemi di Information Retrieval si articolano nelle seguenti fasi: estrazione degli attributi che caratterizzano i dati, modellizzazione, indicizzazione e abbinamento dei dati al momento della query.
Nel caso del MMIR si preferisce il recupero content-based che non utilizza termini per l'indicizzazione e la ricerca, ma veri e propri metadati diversi per ciascuna tipologia di documento multimediale: lo sviluppo di indici, la costruzione di query efficaci e di algoritmi per il posizionamento dei risultati che permettono di gestire e consentire l'accesso a queste banche dati, sono oggetto di ricerche da parte di istituzioni di natura e con finalità differenti che mettono in campo competenze lontane dagli ambiti tradizionalmente bibliotecari.
Dopo questa premessa di carattere metodologico, Raieli affronta il Visual Retrieval: il contenuto visivo dei documenti viene trattato tramite altre immagini che possono avere rapporti di somiglianza o approssimazione in termini di misure, colori, linee ecc. Per raggiungere questo obiettivo, i file ricevono un trattamento di destrutturazione automatico attraverso algoritmi e solo successivamente avviene l'intervento da parte di un operatore. Riassumendo, Raieli illustra le cinque modalità per indicizzare, archiviare, ricercare e recuperare i documenti visivi digitali: la modalità semantica (definizione di tradizionali etichette testuali), la modalità formale (confronto tra le forme astratte presenti nell'immagine e quelle ricercate), la modalità strutturale (scomposizione delle immagini in sezioni), la modalità coloristica (rappresentazione delle immagini tramite i colori in essa contenuti) e la modalità parametrica (determinazione dei parametri che rappresentano un'immagine).
Perla Innocenti fornisce poi un'introduzione concettuale ai sistemi di Video Retrieval esistenti. La fase cruciale ai fini dell'efficacia del recupero dei documenti audio-video è quella nella quale vengono identificate le varie sequenze, gli shot, dai quali vengono estratti i keyframe. È su questi, infatti, che il sistema applica le query fatte dall'utente.
È facile comprendere quanto sia complessa questa attività di scomposizione dei filmati e come tutto il processo sia strettamente dipendente dagli algoritmi e dalle regole create per l'individuazione automatica di tali sequenze. I sistemi esistenti di Video Retrieval sono inoltre di difficile valutazione qualitativa dal momento che non sono state fatte, lamenta Perla Innocenti, delle serie procedure di comparazione.
I sistemi di Audio Retrieval possono invece essere suddivisi in due categorie: le applicazioni finalizzate al recupero di documenti sonori mirano al riconoscimento o del parlato o dei suoni, dei rumori e della musica.
I primi, chiamati sistemi di speech recognition, sono molto diffusi ma presentano ancora un elevato grado di inaccuratezza; la ricerca e il recupero di questi dati si presenta molto simile alle tecniche utilizzate per l'Information Retrieval di tipo testuale. L'utente immette una sequenza di termini e il sistema ne verifica la presenza nei file che popolano la banca dati. L'universo sonoro-musicale è invece molto più complesso; le modalità di interrogazione più comuni avvengono tramite l'immissione nella query della sequenza musicale ricercata o tramite digitazione delle note o vocalmente tramite microfono.
Dopo aver presentato nella prima parte del volume in maniera concisa, ma chiara, le tre branche nelle quali si articola il MMIR, nella seconda sezione del volume vengono presentati alcuni progetti europei, molti dei quali italiani che, dopo un lunga egemonia statunitense in questo ambito, stanno realizzando software finalizzati alla creazione di sistemi di MultiMedia Information Retrieval.
Nel panorama extraeuropeo, oltre ai già citati Stati Uniti, si stanno facendo avanti le esperienze condotte da paesi asiatici delle quali viene fatto un resoconto nella terza parte del volume: a differenza dell'ambito europeo, a occuparsi dei problemi di recupero dell'informazioni multimediali sono soprattutto figure che fanno parte del mondo del computer science.
Resta comunque la consapevolezza che molte energie sia intellettuali che economiche debbono essere impegnate in un campo di studi che vede coinvolti interessi che spaziano dai fornitori di informazioni (biblioteche, centri di documentazioni ma anche creatori di banche dati), a esperti di computer science e information technology, a imprese commerciali di natura più diversa interessate a sistemi affidabili per il recupero di documenti multimediali.
Agnese Galeffi
Università degli studi di Firenze, Biblioteca di Scienze sociali