«Bibliotime», anno VI, numero 1 (marzo 2003)

Precedente Home Successiva



Antonella De Robbio

E-LIS: un Open Archive in Library and Information Science



La filosofia di E-LIS

E-LIS, primo e-server internazionale nell'ambito della Library and Information Science (LIS), nasce come servizio innovativo al fine di diffondere la filosofia open access per i lavori del settore biblioteconomico, di scienza e tecnologia dell'informazione e campi correlati.

L'archivio è ad accesso libero, adotta i protocolli e gli standard OAI Open Archive Initiative [1], è quindi un server OAI-compatibile, in linea con il movimento FOS, Free Online Scholarship [2], di cui condivide la filosofia, e aderente al movimento Eprints [3], di cui utilizza strumenti e metodologie.

Lo scopo primario è quello di mettere a disposizione della nostra comunità LIS i documenti a testo pieno, rendendoli visibili, ricercabili, accessibili, recuperabili e fruibili ad ogni potenziale utente che ne abbia necessità, per scopi non di lucro.

Il concetto di Open Access esteso ai lavori LIS e la loro conseguente disseminazione entro la comunità dei bibliotecari e dei tecnici dell'informazione è un fattore determinante ai fini della costruzione di reti internazionali LIS e di biblioteche digitali.

Oltre alle materie tradizionali che riguardano la biblioteconomia e la bibliografia, E-LIS si occupa anche di tutte le discipline tecniche e applicative correlate al mondo della scienza dell'informazione. In tale dimensione tutti gli argomenti che riguardano la costruzione di biblioteche digitali, strumenti e ambienti, tecniche e metodologie, dai metadati descrittivi e tecnici o di conservazione, dall'archiviazione al copyright, compresi gli aspetti dell'editoria elettronica, trovano posto in E-LIS.

La sua organizzazione è a livello disciplinare, non è un server istituzionale, appunto per dar modo alle varie figure che gravitano attorno al mondo delle biblioteche e dell'informazione di poter liberamente afferire al server attraverso il processo di auto-archiviazione.

Entro l'archivio si possono creare luoghi per il deposito di materiali utili a gruppi di lavoro di progetti nazionali, europei, o internazionali, giacché è possibile ospitare eventuali linee gerarchiche parallele allo schema classificatorio principale, ove depositare i documenti organizzati in modo diverso rispetto allo schema centrale, informazioni comunque recuperabili dall'interfaccia di ricerca.

Il servizio E-LIS è accessibile alla seguente URL: <http://eprints.rclis.org>.

 

A livello italiano sicuramente non esistono esperienze simili, e nemmeno a livello internazionale, considerando le iniziative già esistenti.

In Europa il CCSD (Centre pur la Communication Scientifique Directe del CNRS francese), nell'estate del 2002 ha creato @rchiveSIC: Science de l'information et de la Communication [4], un EPrints server per il deposito dei documenti in scienza dell'informazione e scienza della comunicazione limitato all'area francese e contenente un centinaio di documenti.

In area statunitense esistono due iniziative. Il repository della Caltech Library System all'Università della California Caltech Library System Papers and Publications [5] contenente lavori di ambito LIS (attualmente una ventina) prodotti dal sistema bibliotecario di Caltech. Si tratta di un archivio dove il deposito è riservato ai soli utenti del sistema bibliotecario di Caltech, mentre l'accesso è libero a chiunque.

All'università dell'Arizona, nell'ottobre del 2002 nasce DLIST (Digital Library of Information Science and Technology) [6], creato dalla School of Information Resources and Library Science e dall'Arizona Health Sciences Library. L'obiettivo di DLIST è di offrire un deposito di risorse elettroniche, nei campi LIS (Library and Information Science) e IT (Information Technology), con una particolare enfasi sulle tematiche dell'Information Literacy e dell'Informetrics. Il deposito dei documenti in DLIST, che comprende una settantina di documenti, è libero, non è limitato geograficamente, anche se è orientato ai documenti in lingua inglese.

Il sito E-LIS è in lingua inglese, ma è possibile depositare lavori in qualsiasi lingua, è aperto a tutta la comunità internazionale, sia per l'accesso sia per il deposito, sebbene sia consigliato includere nei metadati un abstract in inglese, oltre a quello nella lingua del documento.

Tutti e quattro i depositi, E-LIS, @rchiveSCI e DLIST, Caltech, sono OAI-compatibili e utilizzano lo stesso software EPrints messo a punto dall'Università di Southampton. Questo è un dato molto positivo nell'ottica di un service provider dedicato al settore LIS entro l'architettura di Rclis.

Il contesto e gli strumenti

E-LIS si colloca entro l'infrastruttura informativa Rclis (Research in Computing, Library and Information Science) [7] coordinata da Thomas Krichel, ideatore della più grande rete di OpenArchive a modello distribuito, RePEC (Research Papers in Economics).

E-LIS è una naturale evoluzione di ReLIS/DoIS (Research in Library and Information Science and Documents in Information Science) [8], il portale per l'ambito biblioteconomico ospitato dal consorzio britannico MIMAS di Machester. Il servizio vede inoltre tra i promotori il Ministero della Cultura spagnolo e la Universidad Politécnica de Valencia.

L'archivio E-LIS è basato sul software GNU EPrints (v. 2.2.1.) [9], installato al CILEA Consorzio Interuniversitario Lombardo per l'Elaborazione Automatica, in ambiente Linux (RedHat 7.3). Tale software ha come prerequisiti esclusivamente software Open e di pubblico dominio (Perl, Apache, MySql). Il server, una macchina ad architettura Intel con due CPU Intel Xeon 2GHz, 512Mbyte di RAM e 18Gbyte dedicati al servizio, è messo a disposizione dal CILEA da sempre particolarmente sensibile al mondo bibliotecario [10], e attivo in iniziative nel campo della "Digital Library" [11]. Oltre alla fornitura dell'hardware su cui il servizio è attivo, il CILEA mette a disposizione anche il proprio supporto tecnico-sistemistico, realizzando anche il back-up dell'archivio e del software, mediante il proprio servizio di back-up centralizzato e robotizzato.

Lo strumento chiave: il software GNU EPrints

Il software GNU EPrints è nato da un'idea di Stevan Harnad, ed è stato sviluppato presso l'Electronics and Computer Science Department dell'Università di Southampton (UK) da Christopher Gutteridge, con la collaborazione di Mike Jewell, mentre la progettazione e la realizzazione della versione 1.0 sono di Robert Tansley e risalgono al 2001. GNU EPrints è software libero, cioè liberamente utilizzabile, modificabile e ridistribuibile, assieme al codice sorgente, in base alla licenza GNU (General Public License). Esso è costituito per la gran parte di script CGI in linguaggio Perl operanti su server http Apache, e utilizza come database d'appoggio il DBMS relazionale MySQL.

Un server GNU EPrints è un particolare esempio di Data Provider della Open Archive Initiative, pensato per il deposito o l'auto-archiviazione di materiale informativo in formato elettronico. Data provider e service provider, sono le due componenti tipiche utili allo scambio di metadati entro l'architettura di OAI. Le due aree si connotano per differenti peculiarità e funzioni, e precisamente:

E-LIS, essendo basato su protocolli e standard OAI, di cui è membro registrato, funziona come data provider. La registrazione nel registro ufficiale OAI ha richiesto una serie di test sull'archivio per la validazione in termini di "colloquio" tra il data provider (in questo caso E-LIS) e i server provider o fornitori di servizio preposti alla raccolta dei metadati. I metadati di E-LIS sono perciò in formato standard OAI con uscita in Dublin Core e sono raccolti da alcuni harvester in servizi internazionali come OAIster. Il progetto OAIster [12], creato dal servizio di produzione della biblioteca digitale dell'Università del Michigan, adotta l'iniziativa Metadata Harvesting della Mellon Foundation. L'obiettivo è rendere ricercabili un gran numero di repositories, liberamente accessibili e utili alla ricerca, tra cui anche E-LIS.

Personalizzazione e configurazione di E-LIS

Dopo l'installazione del software EPrints, il sito E-LIS è stato personalizzato a livello grafico in collaborazione con i colleghi spagnoli dello staff di DoIS [13]. A livello cooperativo si utilizza la lista di discussione di Rclis sul dominio openlib [14]. L'archivio E-LIS è liberamente accessibile da chiunque, e i lavori che non sono soggetti a restrizione d'accesso sono fruibili da qualsiasi utente Internet. E' possibile restringere l'accesso a determinati documenti ove siano richieste particolari condizioni di riservatezza, o nel caso la versione pubblicata sia soggetta a diritti editoriali.

Per il deposito dei documenti è comunque necessario registrarsi, anche per ragioni relative all'autenticazione delle informazioni depositate. Allo scopo è disponibile una pagina con le istruzioni per l'help in linea [15]. Le politiche per la sottomissione dei lavori sono inoltre illustrate sul sito stesso, nella pagina relativa alle policy [16].

Il server è stato configurato in modo da poter accettare tutti i formati possibili tra cui PDF, HTML, ASCII, TeX, LaTeX, PowerPoint, etc. Inoltre è possibile inserire all'occorrenza anche i soli metadati senza necessariamente depositare il testo pieno, sebbene in questo caso sia caldamente consigliato inserire nel campo apposito la URL che punta alla risorsa elettronica disponibile in rete e liberamente accessibile. Le tipologie di materiale previste da E-LIS sono oltre venti, nelle configurazioni si sono aggiunte ulteriori tipologie di materiale non previste dalla configurazione di default di EPrints.

Politiche di copyright

Per quanto riguarda il copyright è stata predisposta una apposita pagina con le politiche di copyright [17], della quale consigliamo la visione. In realtà nel momento in cui un autore crea un'opera (work) tutti i diritti sono dell'autore che l'ha creata. L'autore ha molti diritti, i quali si suddividono in due grandi aree: diritti morali e diritti economici o di fruizione. Per quanto riguarda i diritti morali, poiché nell'autoarchiviazione è lo stesso autore che deposita i propri lavori, il problema non si pone. Il funzionamento di un deposito si basa sul principio dell'autoarchiviazione, che è un'azione del tutto volontaria. Naturalmente nel caso di opera scritta da più autori è necessario che chi deposita si assicuri che anche gli altri co-autori siano d'accordo. I problemi relativi ai diritti morali si pongono solo nel caso una terza persona depositi lavori di altri senza autorizzazione. Questo problema non si pone comunque nel caso di opere di pubblico dominio o documentazione di fonte pubblica.

I diritti economici sono quelli che interessano gli editori e per tale ragione qualche autore potrebbe avere delle riserve o comunque dei timori (spesso infondati come vedremo) a depositare i propri materiali entro un Open Archive.

Se tutti i diritti sono dell'autore, le modalità di trasferimento di questi diritti agli editori o ad altre figure del mercato editoriale, dipendono solo da come l'autore decide e acconsente di cederli. Quali diritti trasferire e in che modo, e quali diritti è necessario mantenere per sé o per l'istituzione alla quale si afferisce, è una decisione che spetta solo all'autore.

Ciò che è importante è istruire gli autori, in particolare quelli accademici, che "regalano" i propri lavori alle riviste dei grandi editori; i bibliotecari avranno molto da fare in questo contesto per sensibilizzare e aprire archivi. Gli Open Archive servono a questo, a creare una cultura nuova, scardinando vecchi modelli. Gli autori dovranno imparare a negoziare i contratti di cessione dei loro diritti con gli editori in modo da:

Certamente non sarà facile, molti editori faticheranno a lasciare agli autori questi diritti, ma fin da ora molti editori acconsentono all'autoarchiviazione, anche perché hanno capito che formalmente non potrebbero negare il deposito entro un archivio del preprint, in quanto il deposito avviene "prima" della cessione dei diritti sull'opera.

Inoltre, se la rivista lavora bene, come solitamente affermano gli editori, la versione pre-print è sicuramente diversa da quella pubblicata, a seguito del processo di revisione che ha subito da parte del comitato dei pari. Molti editori acconsentono anche al deposito della versione "referata", come appare subito prima della pubblicazione.

E' pur vero che esistono ancora editori che non pubblicano nessun lavoro che sia stato reso pubblico in qualche modo, o perché presentato ad un convegno, o perché messo su web nella propria pagina, o perché depositato entro un server. Questo divieto è noto col nome di regola di Ingelfinger. Gli autori stanno boicottando le riviste che applicano tale regola in quanto ostacola una rapida diffusione dei contenuti scientifici.

Solitamente avviene questo:

1) il deposito di un pre-print è più che legittimo, in quanto l'autore non ha ancora ceduto niente a nessun editore;

2) in seguito l'autore può sottomettere ad una rivista il pre-print depositato e se il contratto esplicitamente non nega il deposito allora il pre-print resta nel deposito in tale forma, affiancato alla nuova versione riveduta;

3) il deposito della versione riveduta non può essere una scansione dell'articolo sulla rivista perché questa conterrebbe loghi, layout editoriale e quant'altro... solitamente va depositato un file in PDF;

4) se il contratto editoriale nega il deposito allora si può sempre negoziare con l'editore, oltre il 60% delle volte l'editore accetta le condizioni poste dall'autore. In certi casi di editori poco propensi ad un deposito della versione riveduta e corretta, si può proporre il deposito di un PDF apribile in sola consultazione, senza possibilità né di stampa né di salvataggio. E' molto facile ottenere, in fase di conversione di un documento da un formato qualsiasi, un PDF con opzione sicurezza, qualora gli editori fossero restii a concedere il deposito della versione definitiva. Si può anche proporre un link dal metadato alla versione sul sito dell'editore, e questo solitamente li attira in quanto è una forma di promozione. Sono ormai molti gli editori che accettano dopo una negoziazione.

5) nessun editore può obbligare l'autore a rimuovere od oscurare il pre-print depositato. E' contro la legge, appunto perché tutti i diritti sono dell'autore e il deposito è avvenuto prima della cessione. Per questa ragione, ma non solo, è importante depositare subito la propria produzione intellettuale. Va anche ricordato che solitamente, una volta depositato un lavoro entro un archivio, non è possibile rimuoverlo, questo per le politiche legate all'archiviazione adottate dai server e-prints;

6) l'editore però può rifiutare la pubblicazione del lavoro se è stato preventivamente pubblicizzato in qualche forma: è questa la regola di Ingelfinger. Non si può pubblicare in riviste che ostacolano la disseminazione e il rapido sviluppo della scienza, quindi vanno boicottate;

7) nel caso in cui gli editori impediscano di depositare la versione riveduta e definitiva, e si voglia comunque pubblicare in quelle riviste per varie ragioni, è possibile aggiungere una corrigenda accanto alla versione pre-print (il software consente il legame tra versioni successive di un paper);

8) una presentazione a un convegno si riferisce sempre ad una produzione intellettuale, quindi il file in PowerPoint lo si può benissimo caricare, prima o dopo la presentazione orale ufficiale, a seconda di come è organizzato l'evento;

9) qualsiasi cessione di diritti dall'autore all'editore o altro committente è valida solo se scritta;

10) per articoli già pubblicati e per cui esiste un contratto editoriale di cessione di diritti, laddove si era ceduto anche il copyright elettronico (difficile per lavori vecchi in quanto non esisteva), si può sempre chiedere il permesso all'editore ai fini di un deposito. Solitamente acconsentono, in quanto tale operazione ha un feedback positivo in termini promozionali.

Per E-LIS la situazione è particolare per più ragioni. La prima è che gli autori siamo noi bibliotecari, e quindi dobbiamo essere perfettamente in grado di gestire i diritti delle nostre opere, di sapere come e a chi cederli e se cederli. La seconda, ma forse viene per prima, è che dobbiamo lottare affinché situazioni che ostacolano la disseminazione dei contenuti siano rimosse: noi dobbiamo dare l'esempio a tutte le altre discipline, e sarebbe paradossale se proprio noi ci fermassimo di fronte ad un contratto editoriale di tipo vessatorio, e ancora più inconcepibile se gli ostacoli provenissero da riviste LIS. Esiste sicuramente un ampia base di e-periodici LIS di tipo open access, ma anche un fronte tradizionale tuttora presente saldamente ancorato al vecchio modello. In altri termini se un autore pubblica in una di queste riviste, mantiene i propri diritti, vale a dire non cede nulla in modo "esclusivo".

Laddove esiste già presso l'editore una copia digitale del lavoro, si può proporre il link verso il sito editoriale e comunque avere una copia nel deposito ai fini di archiviazione torna utile anche all'editore. Peraltro va sottolineato che i siti degli editori cambiano mentre nel deposito vi è una garanzia di stabilità, e per di più l'autore ha sotto controllo tutta la sua produzione intellettuale entro un unico punto.

Riassumendo:

a) I lavori nuovi, presentazioni, relazioni a convegni, articoli da sottoporre a riviste, etc. si caricano subito, prima della sottomissione se articoli, e poi si aggiunge la versione aggiornata se l'editore lo consente. Si farà attenzione ai contratti, qualora ci siano, altrimenti il problema non si pone. Si impone una negoziazione dei diritti qualora gli editori creino problemi, ma abbiamo a disposizione validissime riviste LIS open access [18].

b) Per i rapporti tecnici, report in generale, lavori non sottoposti a riviste, insomma tutta quella letteratura grigia che non trova mai posto in nessun luogo e che spesso è utilissima, E-LIS è il posto ideale. Attenzione ai lavori riservati, alla documentazione tecnica o ai materiali di gruppi di lavoro particolari che, per qualche ragione, devono rimanere riservati alle istituzioni e non possono quindi essere ad accesso pubblico. In tali contesti E-LIS può offrire una valida piattaforma per deposito di materiali e documentazione tecnica riservati, in quanto è possibile restringere l'accesso ai documenti.

c) Per i lavori passati, dipende molto dal contratto che all'epoca era stato sottoscritto, nel caso si può chiedere autorizzazione agli editori. In tutto il mondo anche gli editori più agguerriti stanno concedendo l'autorizzazione alla riproduzione digitale ad accesso pubblico oltre il cosiddetto "wall" di 3-5 anni precedente l'anno corrente.

Lo schema di classificazione per il browsing

Prima di depositare i documenti è bene consultare lo schema di classificazione di E-LIS, chiamato JITA classification schema, presente all'indirizzo <http://eprints.rclis.org/JITAschema.html>. In E-LIS si utilizza un solo livello gerarchico, ma è utile conoscere la descrizione presente per ciascuna delle dodici aree previste. Si tratta di uno schema classificatorio molto semplice, che nasce da una rielaborazione della NewsAgentTopic Classification Scheme (mantenuta da Mike Keen at Aberystwyth, UK, fino al 31 marzo 1998) e della RIS classification scheme (Review of Information Science) originariamente concepita da Dagobert Soergel dell'University of Maryland (ora cessata).

Lo schema per E-LIS presenta un solo livello gerarchico (per il momento), con una descrizione per ciascun elemento utile ai fini del deposito dei materiali. Lo schema infatti non vuole essere una classificazione di tipo astratto, ma avere uno scopo molto pragmatico, cioè quello (tipico degli ambienti OA) di presentare in visualizzazione e recupero, attraverso la modalità di browsing, i documenti presenti entro il server, suddivisi in ampie categorie, senza troppo scendere nel dettaglio.

Le funzioni di E-LIS

GNU EPrints è uno dei modelli di eprints più moderni e sofisticati, ma altrettanto facili da implementare; presenta numerose funzionalità e potenzialità e lascia ampie possibilità di configurazioni specifiche per esigenze personalizzabili. Esso offre più interfacce Web di accesso: l'interfaccia utente, l'interfaccia di staff e quella per l'amministratore del sito. Ciascuna consente numerose possibilità di ricerca offrendo una gamma di funzionalità differenziate per i tre differenti ruoli. L'auto-archiviazione secondo questo modello di Open Archive, è rapida e facile e il sistema consente di caricare a fianco della prima versione eventuali aggiornamenti con procedure automatiche. E' possibile inoltre limitare la visibilità e l'accesso nel caso di documenti "protetti" a singoli gruppi, allo staff, o ai soli utenti registrati.

Le funzioni principali in E-LIS sono sostanzialmente quattro:

All'interno dell'area utente sono possibili ulteriori funzioni diversificate, per esempio quelle di controllo, e correlate ai tre differenti profili utente: utente registrato, editor e gestore del sito. Stiamo predisponendo un quarto livello utente, e precisamente il livello "Project User", che servirà per i gruppi di progetto, particolarmente utile come supporto per il deposito dei materiali predisposti dai gruppi di lavoro che operano nell'ambito dei progetti europei.

Il funzionamento di un server EPrints si basa sulla registrazione dell'utente, come condizione necessaria per il deposito. L'editor ha la possibilità di avere a disposizione funzionalità aggiuntive in quanto valida i documenti depositati dagli utenti registrati. In questi casi esiste un sistema di controllo che si basa su una struttura di tipo 'editorial board', che in E-LIS si occupa del solo controllo formale sui metadati.

E-LIS raccoglie materiali già sottoposti a referaggio da parte di altri comitati editoriali di riviste o già presentati a congressi, seminari e conferenze, ma raccoglie anche materiali non validati, quali rapporti tecnici, pre-prints o materiale non pubblicato. In questo caso tutte le informazioni che giungono vengono opportunamente etichettate in relazione al processo di referaggio, di modo che sia possibile utilizzare i relativi filtri in ricerca per il recupero dei soli documenti referati o non referati o entrambe le condizioni.

Le funzioni a disposizione dell'amministratore del sito o manager di sistema sono numerose, tra cui la facoltà di registrare nuovi utenti, cancellarli, intervenire sui dati e metadati, agire sull'albero dei soggetti creando e modificando gli schemi per l'organizzazione del materiale. Inoltre il manager ha il controllo generale di tutta la base dati e dei file di configurazione. Una funzionalità fondamentale è quella di help, che consente di avere sempre a disposizione le informazioni utili al deposito e alla gestione della propria zona di lavoro. Un servizio supplementare è la funzione di alerting che avvisa l'utente quando un nuovo lavoro in un certo ramo specifico dello schema classificatorio è stato depositato da altri utenti registrati.

Sulla base dei tre livelli di utenza descritti sopra, vi sono parallelamente tre zone o aree dei documenti, più una quarta, relativa ai documenti cancellati che rimangono comunque accantonati a parte. La prima è la workarea user di ciascun utente registrato (user area), dove si inseriscono i metadati e vengono caricati i propri documenti in vari formati. I dati rimangono nella zona utente fino a che non vengono sottoposti al comitato editoriale (bottone richiesta submission).

La seconda area è quella di buffer, a disposizione degli editor, dove vanno a finire i dati (metadati e documenti) sottoposti a validazione. Tutte le modifiche ai metadati avvengono in questa zona da parte dei membri del comitato editoriale, che sono i soli ad esempio, a poter poter rimuovere un documento dall'archivio o modificare i metadati una volta che questi sono stati registrati definitivamente nell'archivio centrale.

L'archivio vero e proprio, o archivio principale, è il luogo dove vanno a finire i documenti a seguito di validazione da parte di un editor. A questo punto scatta il contatore, visibile peraltro dalla home, a seguito di un programma in Perl implementato come funzionalità propria di E-LIS (non presente nel file di default del software originario). Una volta inseriti definitivamente in archivio i dati non possono più essere rimossi, in quanto il deposito ha funzione di archivio stabile, dove vengono registrate informazioni che solitamente vengono linkate da altri lavori in citazioni, riferimenti, note

Quando un'informazione arriva in archivio principale gli utenti che hanno attivato la funzione di alerting, sono avvertiti del nuovo lavoro depositato a seconda delle opzioni che hanno scelto (giornaliero, settimanale, mensile) e secondo altri parametri impostati per l'alerting.

L'archivio è ricercabile (da chiunque) in due modalità:

E' possibile inoltre visualizzare gli ultimi documenti depositati. Dal metadato recuperato è possibile raggiungere la risorsa elettronica presente altrove, oppure scaricare il documento (in uno o più formati) allegato al metadato e presente nel server, sempre che non si tratti di documento ad accesso riservato, per il quale è invece necessaria una specifica autorizzazione. In coda al metadato sono solitamente presenti i riferimenti bibliografici, grazie all'applicativo ParaTool installato in E-LIS.

Reference linking

Una delle funzionalità che rendono questo archivio particolarmente innovativo è la sua integrazione con lo strumento software "ParaTools" [19], nome breve di ParaCite Toolkit, messo a punto dallo staff di Southampton. Il software, integrabile in EPrints, è una collezione di moduli Perl che consentono il reference parsing al fine di attuare il "reference linking", estraendo i riferimenti bibliografici dai documenti dopo averli analizzati nelle parti che li compongono come l'autore, l'anno, il volume e il titolo.

Reference linking è un termine generale che indica un servizio entro cui gli oggetti informativi vengono connessi l'uno all'altro. Le connessioni, o link, possono apparire in un'ampia varietà di contesti differenti che includono le citazioni a lavori scientifici pubblicati, i riferimenti da un catalogo o da una bibliografia, i riferimenti informali trasmessi via posta elettronica. Un servizio di reference linking comprende sistemi e-print server, servizi A&I (abstracting and indexing), database citazionali, OPAC, risorse web o, più in generale RER e tutte le citazioni che compaiono entro i lavori di ricerca

Solitamente un servizio di reference linking poggia su un'architettura la quale si sviluppa attorno alle risorse informative scientifiche comprendenti sia i documenti a testo pieno contenuti nei repositories accademici sia i riferimenti bibliografici.

Il toolkit giunge come risultato dalle ricerche su ParaCite, un motore di ricerca di reference il quale usa parser basati su modelli di riferimenti bibliografici per estrarre metadati dai riferimenti bibliografici, fornendo di conseguenza risultati di ricerca basati su questi metadati.

Esempi di un riferimenti bibliografici tratti da documenti depositati in E-prints:

Prasanna, T.S. and Singhal, Madhuresh (2002) Softwares for Cataloguing Digital Resources with Special Emphasis on MARCit. Information Studies 8(4):255-264.

http://www.marcit.com/

Balestri, Maria Grazia and Mangiaracina, Silvana and Nobili, Dario (2001) Bibliometric S & T Indicators to Comply with Users' Needs. Research Evaluation 10(1):5-12.

H.F.Moed (1989), The use of bibliometric indicators for the assessment of research performance in the natural and life sciences, 1989 DSWO Press, Leiden

L. Leydesdorff (1995), The challenge of scientometrics, 1995 DSWO Press, Leiden

I. Gomez et al.(2000), INDICYT Science and Technology Indicators in Spain: Development of an Application for Interactive Search in Internet, Proc. of the Sixth Intern.Conf. on Science and Technology Indicators, Leiden, 24-27 May 2000 (to be published)

McKiernan, Gerry (1999) Morning Becomes Electric: Post-Modern Scholarly Information Access, Organization, and Navigation. Technical Report.

About MathSciNet, American Mathematical Society. WWW document. Accessed: April 18, 1999 <http://ams.rice.edu/msnhtml/about_mathsci.html>

Alper, J. (1998a). Digital Libraries: Assembling the World's Biggest Library on Your Desktop. WWW document. Accessed: March 21, 1999 <http://www.canis.uiuc.edu/medspace/alper.html>

Alper, J. (1998b). Taming Medline with Concept Spaces. WWW document. Accessed: March 21, 1999 <http://www.canis.uiuc.edu/9-18-98.html>

American Physical Society. Task Force on Electronic Information Systems. Report of the APS Task Force on Electronic Information Systems. Bulletin of the American Physical Society 36 (4), 1119-1150.

Alcuni moduli di ParaTools elaborano questi riferimenti, estraendo da ognuno di essi le parti che lo compongono come l'autore, l'anno di pubblicazione, il titolo della pubblicazione o l'URL. In ultimo un altro modulo utilizza le informazioni estratte dai precedenti per creare un link OpenURL attraverso il cookie-pusher che contiene le informazioni:

In questa figura si evidenziano le informazioni nascoste entro il cookie-pusher "seek".

Le applicazioni del pacchetto ParaTools includono la conversione sia di liste di riferimenti bibliografici, sia di metadati entro OpenURL validi, la collezione di metadati dalle bibliografie per realizzare ricerche interne, l'estrazione automatica della bibliografia dai documenti, la realizzazione di ricerche usando ParaCite. Si tratta di una procedura ancora in fase di test e in via di sviluppo (siamo ancora alla versione 1.0 di ParaTools, disponibile solo dal 29 gennaio 2003) ma per il momento ci pare assai utile dotare i metadati dei riferimenti bibliografici connessi a servizi come Google, ResearchIndex e CiteBase.

ReseachIndex non è un semplice motore di ricerca, ma pur avendo al suo interno un motore per le ricerche e molti altri strumenti, è un sistema che mette a disposizione tools per la costruzione di biblioteche digitali. Il sistema ACI al suo interno consente l'indicizzazione automatica con estrazione dal testo pieno di parole significative che vengono contestualizzate e rendendo operativo il linking tra le risorse organizzate entro le sue directory. L'importanza di ResearchIndex entro un Open Archive si esplica soprattutto nel fatto di essere uno strumento per l'analisi citazionale dei documenti, alternativo al costoso SCI dell'ISI, Science Citation Index. Pur essendo ancora agli esordi il suo database sta crescendo vertiginosamente in quanto alimentato dalla comunità degli stessi ricercatori. Per tale ragione una connessione tramite ParaTool da un Open Archive verso ReseachIndex può risultare assai allettante.

Sviluppi futuri di E-LIS

Un ulteriore sviluppo di E-LIS, al momento in fase di studio, sarà quello di dotarlo di un sistema di tipo PURR (Persistent URL Resource Resolver) [20]. E' questo un sistema, basato su un modulo Apache e su un Database MySql d'appoggio, per associare un URL permanente ai metadati e documenti inseriti nell'archivio al fine di salvaguardarne l'accesso nonostante i naturali movimenti (di server, di provider) o le naturali evoluzioni dovuti a sviluppi tecnologici.

Senza dubbio bisogna guardare allo sviluppo di E-LIS non solo in termini tecnologici, ma anche organizzativi, ma prima l'archivio dovrà crescere e costruire una massa critica di documenti utile alle sue funzioni primarie di archiviazione e disseminazione. L'archiviazione offrirà una garanzia di stabilità nel tempo delle produzioni intellettuali del settore LIS, raccolte in un unico luogo. Come scrive Michele Santoro [21], la disseminazione è intesa nel significato che tale termine assume in fisica, cioè come uno "spreading out", un mescolamento di molecole [22], in un organismo che crea, cresce, si dilata nella disseminazione di un sapere collettivo. Per questa ragione è necessario promuovere l'autoarchiviazione in E-LIS. L'obiettivo primario da raggiungere, appare evidente, è quello di incrementare le collezioni di documenti entro l'archivio che diviene nucleo di riferimento di una comunità in continua espansione, momento di aggregazione entro un nuovo modello comunicativo "open".

Antonella De Robbio (E-LIS Manager), e-mail: derobbio@math.unipd.it


Note

[1] <http://www.openarchives.org/>.

[2] <http://www.earlham.edu/~peters/fos/fosblog.html>.

[3] <http://www.eprints.org/>.

[4] <http://archivesic.ccsd.cnrs.fr/>.

[5] <http://caltechlib.library.caltech.edu>.

[6] <http://dlist.sir.arizona.edu>.

[7] <http://rclis.org>.

[8] <http://dois.mimas.ac.uk>.

[9] <http://software.eprints.org/download.php>.

[10] per esempio nelle collaborazioni con l'AIB Associazione Italiana Biblioteche dove dal 1999 è stato creato il MAI MetaOPAC Azalai Italiano, e nel 2001 è nata l'iniziativa SegnaWeb per la costruzione di in VRD per biblioteche pubbliche.

[11] <http://www.cilea.it/ari/cdl/>.

[12] <http://oaister.umdl.umich.edu>.

[13] Josè Manuel Barrueco Cruz (Biblioteca di Scienze Sociali, Università di Valenza, Spagna) e Imma Subirats Coll (Governo di Catalogna, Spagna).

[14] <http://lists.openlib.org/mailman/listinfo/rclis>.

[15] <http://eprints.rclis.org/help/>.

[16] <http://eprints.rclis.org/policy.html>.

[17] <http://eprints.rclis.org/copyright.html>.

[18] Index Morganagus, <http://sunsite.berkeley.edu/%7Eemorgan/morganagus/>,
servizio di IR curato da Eric Lease Morgan che indicizza gli articoli pubblicati su 87 riviste elettroniche gratuite in rete di ambito LIS. Periodici di Biblioteconomia e Scienza dell'informazione (LIS) presenti in CaPerE (Catalogo dei periodici elettronici dell'Università degli studi di Padova) a cura di Marco Tomassini, <http://www.cab.unipd.it/capere/linkej.php#LIS>.

[19] <http://paracite.eprints.org>.

[20] <http://caltechlib.library.caltech.edu/documents/disk0/00/00/00/20/>.

[21] Michele Santoro, La biblioteca diffusa: modelli di cooperazione nelle biblioteche accademiche. In Convegno di "Biblioteche oggi" La biblioteca condivisa: strategie di rete e nuovi modelli di cooperazione, Milano 13-14 marzo 2003. Michele Santoro nella sua relazione focalizza sul nuovo modello di organizzazione bibliotecaria riferito da Donald Beagle come "Information Commons" dove per "commons si intende una risorsa comune in termini di condivisione, accesso e fruizione. L'idea di "Commons" in analogia agli ambienti comunicativi e alle produzioni intellettuali è ben descritta da Larry Lessig, noto giurista di Stanford; a riguardo vedi intervento di Antonella De Robbio, Diritto di accesso ai contenuti e diritti di proprietà intellettuale nell'infrastruttura globale dell'informazion. In Convegno internazionale "Le risorse elettroniche: Definizione, selezione e catalogazione", Roma, 26-28 novembre 2001.

[22] Wendy Pradt Lougee, Diffuse libraries: emergent roles for the research library in the digital age. Washington, Council on Library and Information Resources, 2002. Citato da Michele Santoro nel suo intervento al Convegno alle Stelline 2003, La biblioteca diffusa: modelli di cooperazione nelle biblioteche accademiche.




«Bibliotime», anno VI, numero 1 (marzo 2003)

Precedente Home Successiva


URL: http://www.spbo.unibo.it/aib/sezioni/emr/bibtime/num-vi-1/derobbio.htm