Si apre il blog della nostra casa editrice con uno degli argomenti più basilari per chi vuole fare ricerca accademica: l’archiviazione nei repository.
Di questo, come di tutti i nostri prossimi argomenti, parliamo in modo generico, perché siano chiari gli aspetti fondamentali anche per chi si sta appena affacciando a questo mondo o è semplicemente curioso.
In fondo a tutti gli articoli del blog, trovate i consigli di ascolto e degustazione abbinati alla lettura del pezzo, perché come tutti gli amanti della lettura sanno la musica e le buone bevute fanno parte da sempre delle mille facce della cultura.
Uno dei passaggi fondamentali per chi fa ricerca è la disseminazione dei risultati raggiunti: rendere pubblico il proprio studio per presentarlo agli altri studiosi e fare in modo che sia accessibile per tutta la comunità.
Quello che può essere considerato il primo passaggio indispensabile della comunicazione scientifica e della condivisione del sapere è l’archiviazione dei lavori in repository aperti e consultabili.
Indice
Le tipologie di repository
I repository sono depositi digitali che possono essere istituzionali (institutional repositories – IR), come gli archivi che sono presenti nelle università e istituti di ricerca1, o tematici (disciplinary repositories o subject repositories), cioè archivi di pubblicazioni accademiche in una particolare area disciplinare, come ad esempio arXiv.org2, SSRN3 e RePEc4 o i nuovi archivi disciplinari offerti da OSF5.
Negli ultimi anni, sono nati archivi digitali non legati a qualche disciplina in particolare, né con la finalità di diffondere le pubblicazioni di singole istituzioni, che hanno tuttavia delle caratteristiche peculiari. Tra questi sono degli esempi Zenodo6 e Figshare8, che ammettono ogni tipo di disciplina e tra i documenti accolgono diversi tipi di contenuti di ricerca, come tabelle, immagini, video e dataset.
Il panorama è molto vasto, per tutti è indispensabile sempre avere chiara la proprietà: alcuni archivi sono sostenuti da enti di ricerca o organi istituzionali, come è il caso, oltre che per gli IR, anche di Zenodo, altri da aziende private8. L’indicazione della proprietà dei repository può essere utile per avere un’opinione più consapevole sulla stabilità e la durata del servizio offerto: gli archivi istituzionali assicurano una conservazione a lungo termine, mentre le piattaforme proprietarie, che appartengono ad aziende private, sono suscettibili a elementi che riguardano il mercato e l’andamento di impresa.
La presenza dei repository nel mondo
Numero totale di repository presenti nell’aggregatore OpenDOAR 4054.
I seguenti dati sono solo indicativi della presenza per regione, perché in costante mutamento (Fonte: OpenDOAR, dati consultati il 21/03/19).
I repository e la green road
Agli inizi del XXI secolo, come ricorda Mauro Guerrini9, il concetto di deposito (archive) viene accostato alla formulazione open access che ne detta
un salto qualitativo: il nuovo modello di comunicazione scientifica assume una piena consapevolezza e si trasforma in un’iniziativa fortemente caratterizzata, tanto che si parla di “movimento OA” per definire in termini sempre più precisi il processo di creazione, gestione e disseminazione dei risultati delle ricerche accademiche finanziate con denaro pubblico e privato.
Con questo accostamento si apre la green road, i sistemi di archiviazione sono da tempo presenti, ma è grazie alla diffusione delle tecniche digitali e al consolidarsi del dibattito sull’open science che il concetto di archiviazione si allarga agli studiosi di tutte le aree disciplinari e non solo ai precursori del sistema10.
Nella prima delle tre dichiarazioni11 che hanno dato vita al movimento OA, si coniuga al concetto etico del miglioramento che può scaturire per la società dall’accesso alla letteratura scientifica peer-reviewed il passaggio fondamentale del self-archiving.
Infatti il manifesto di Budapest (BOAI) del febbraio 2002 indica come il primo strumento per raggiungere l’obiettivo dell’accesso aperto alla letteratura scientifica sia la pratica dell’auto-archiviazione:
L’accesso aperto alla letteratura prodotta da riviste peer-reviewed è l’obiettivo. I modi per ottenere tale obiettivo sono l’auto-archiviazione (I.) e una nuova generazione di riviste ad accesso aperto (II.). Si tratta di strumenti diretti ed efficaci per raggiungere lo scopo e, inoltre, sono già a disposizione dei ricercatori e pertanto non comportano l’attesa di cambiamenti prodotti dai mercati o dalla legislazione12.
La strategia del self-archiving viene definita green road13 e in riferimento agli archivi nei quali l’autore può archiviare la propria ricerca si precisa che debbano essere conformi agli standard stabiliti dalla Open Archives Initiative (OAI).
I metadati
L’OAI è un progetto nato a Santa Fe nel 1999 per accrescere la fruibilità e l’interoperabilità degli archivi in ambito scientifico-accademico, si occupa di definire le linee guida tecniche per migliorare l’accesso ai repository e ai documenti elettronici presenti (eprint), muniti di informazioni del catalogo (metadati) redatti secondo gli standard dell’interoperabilità.
L’integrazione tra archivi ad accesso aperto è garantita dal Protocollo per la raccolta dei metadati OAI-PMH (Open Archives Initiative-Protocol for Metadata Harvesting). Questo protocollo impone che i singoli archivi mappino i loro metadati nel formato Dublin Core14, un set di metadati comuni a questo scopo, che permette il riuso delle informazioni, secondo il modello:
molti archivi, molti metadati, molti servizi diversi, ma tutto accessibile in maniera semplice da parte degli utenti15.
Sulla questione dell’importanza della gestione dei metadati merita di essere menzionato il lavoro della Commissione Biblioteche, Gruppo OPEN ACCESS della CRUI – Conferenza dei rettori delle Università italiane, coordinato da Roberto Delle Donne che con la redazione delle Linee guida per la creazione e la gestione di metadati nei repository istituzionali promuove uno schema di metadati condiviso. Il documento del 2012 dà fondamentali segnalazioni sui metadati necessari e sulle buone pratiche per un corretto inserimento dei dati (abbreviazioni, uso delle maiuscole, punteggiatura, caratteri particolari…).
Il materiale depositato deve rispettare le indicazioni dei diritti posti sulla risorsa e che sono (o che dovrebbero essere) stati stabiliti durante l’accordo con l’editore (contratto di edizione), tra i metadati è fondamentale inserire quelli sulla Policy di accesso per i criteri di accesso al contributo e sulla Tipologia di licenza per scegliere la licenza di distribuzione del file. Nel caso di articolo pubblicato su una rivista presente nella banca dati SHERPA/RoMEO, su questa piattaforma è possibile verificare la politica editoriale della testata e dell’editore e capire quale versione sia preferibile pubblicare e con quali criteri.
Una delle indicazioni da rispettare è quella dell’embargo, una pratica editoriale ancora diffusa, anche tra gli editori che supportano l’accesso aperto.
Su questo Simona Turbanti, nel suo interessantissimo Strumenti di misurazione della ricerca, ricorda gli inviti costanti della Commissione Europea a scegliere la via dell’accesso aperto:
Nella Commission recommendation of 17 July 2012 on access to and preservation of scientific information (2012/417/UE), la Commissione europea ha invitato gli Stati membri a rendere pubblici i risultati della ricerca finanziata con fondi pubblici (“policies on open access to scientific research results should apply to all research that receives public funds”), in modo da ridurre sia la moltiplicazione inutile degli sforzi sia il tempo necessario alla ricerca e al recupero delle informazioni. Viene indicato anche un riferimento cronologico: “as soon as possible, preferably immediatly” e, comunque, non oltre sei mesi dalla data di pubblicazione (dodici nel caso delle scienze umane e sociali)16.
L’Autore, se ha possibilità di scelta, può rivolgersi, per la pubblicazione dei propri lavori, a editori che assicurino elevati standard di qualità e sostengano una politica dell’accesso aperto chiara e priva di compromessi17.
Cosa si può archiviare
Generalmente è possibile depositare la copia digitale (eprint) di un proprio contributo a carattere scientifico (articoli su rivista, monografie, saggi di curatele, ecc.) in una delle seguenti versioni secondo lo stadio editoriale in cui il documento si trova:
- preliminare (preprint): ovvero come il testo è presentato e sottoposto alla peer-review,
- rivisto (postprint): la versione finale referata: accettata dall’editore per la pubblicazione e identica alla versione editoriale, a parte il diverso aspetto grafico e l’assenza di loghi e marchi dell’editore (layout editoriale), corretto secondo i consigli dei revisori,
- definitivo (camera-ready): cioè la versione editoriale come viene pubblicata dalla casa editrice.
Nei documenti per il deposito dei prodotti della ricerca negli archivi vengono indicati i tipi di contributi che possono essere inseriti e quali versioni, ad esempio nelle linee guida per il deposito nell’IR dell’Università di Firenze18 le versioni ammesse sono quella editoriale, ovvero quella pubblicata dall’editore (camera-ready), o, in subordine, quella finale referata, cioè il materiale definitivo consegnato all’editore per la pubblicazione, senza gli elementi grafici di impaginazione e i marchi e loghi dell’editore (postprint).
Alcuni archivi non accettano le versioni preprint, Antonella De Robbio in un suo articolo del 2003 spiegava il valore specifico di certe tipologie di documenti di ricerca:
I preprint e i lavori intellettuali considerati tradizionalmente come letteratura grigia, rapporti tecnici, relazioni ai convegni, atti di congressi, documenti progettuali, documenti pre e post pubblicazione, sono una fonte preziosa per lo sviluppo di qualsiasi settore disciplinare. Per i settori scientifici la disponibilità immediata della letteratura prodotta è ormai una necessità non più prorogabile.
Un preprint è una tipologia di documento, distribuito in modo più o meno limitato, relativa ad un lavoro tecnico spesso in forma preliminare, precedente alla sua pubblicazione in un periodico. Molto spesso però questa tipologia di materiale non rientra per nulla nei canali della distribuzione a stampa, e rimane così “nascosta” e priva di un effettivo impatto nella comunità dei parlanti19.
I benefici degli Open Repository
I vantaggi dell’essere presenti in archivi aperti sono per l’Autore molteplici, Chawki Hajjem e Harnad20 sintetizzano 5 potenziali fattori che contribuiscono all’aumento delle citazioni (il beneficio basilare per l’Autore) nella celebre espressione per raggiungere il risultato dell’Open Access Advantage (OAA), ovvero:
OAA = EA + QA + UA + (CA) + (QB)
dove Early Advantage (EA) è il vantaggio della rapida diffusione, dato dal fatto che archiviando i preprint i documenti sono disponibili prima e quindi anche citabili prima, anche per l’archiviazione dei volumi definitivi (versione editoriale) il vantaggio di tempo rispetto all’uscita dell’edizione cartacea e alla distribuzione tradizionale rimane fortemente presente;
il Quality Advantage (QA) si riferisce al dato per cui il 10% degli articoli tende a ottenere il 90% delle citazioni, in una correlazione tra due fattori, ovvero sia al fatto che gli articoli auto-archiviati siano più facilmente citati perché sono auto-archiviati (QA) sia al fatto che gli Autori preferiscano archiviare articoli che considerano meritevoli di essere citati (vedi QB);
l’Usage Advantage (UA) (o Download Advantage, DA) è il vantaggio dato dalla presenza nei repository che aumenta i download dei contributi e la diffusione internazionale;
il Competitive Advantage (CA) è per la possibilità di accedere liberamente ad una risorsa rispetto all’accesso a pagamento, “Toll Access” (TA);
il Quality Bias (QB) infine si riferisce al fatto che gli Autori preferiscono archiviare i propri migliori articoli, attraverso una sorta di “self selection”21.
A questi benefici sostanziali si aggiungono i benefici per l’istituzione che ha la possibilità attraverso gli IR di mostrare la propria produzione scientifica, in linea anche con la terza missione delle Università, e di sintetizzare le procedure di lavoro dell’ente grazie al deposito operato dagli Autori.
Per quanto riguarda gli IR oltre alle funzioni di catalogo descrittivo e di deposito istituzionale c’è quella di alimentare direttamente la propria area personale del sito MIUR per Docenti e Ricercatori, con la scelta di invio del contributo definitivo.
Consigli pratici per una corretta disseminazione attraverso i repository aperti
Il panorama dei repository presenti attualmente in rete è estremamente vasto, per procedere al deposito su diversi archivi è quindi molto utile realizzare una tabella con l’elenco dei repository che vi interessano, partendo ovviamente dall’IR dell’ente di cui fate parte.
Nella tabella riportate oltre alle url anche i dati di accesso, questo vi permetterà di non perdere tempo prezioso ogni volta che dovrete svolgere queste procedure. Aggiungete magari una breve descrizione della tipologia del repository o delle vostre annotazioni personali, queste brevi indicazioni vi saranno utili quando dovrete in futuro ripercorrere questi passaggi per nuove pubblicazioni, considerate infatti che possono passare dei mesi da quando accederete di nuovo al repository e potrete aver dimenticato qualcosa.
Se siete ricercatori indipendenti o personale tecnico amministrativo in strutture che non consentono l’archiviazione presso i loro IR a personale non docente cercate i repository più adatti alla vostra area di studio.
Prima di procedere alla disseminazione verificate che il materiale che volete depositare sia per voi definitivo, secondo la versione editoriale che scegliete di depositare, e lo stesso vale per tutti i metadati. Fate una tabella con gli elementi necessari da inserire e utilizzate sempre quelli per evitare di avere dati “sporchi” in rete, che non possono poi essere eliminati e possono tornare talvolta nelle query. La conformità dei dati usati è un messaggio chiaro e serio sul vostro lavoro.
Se l’archivio lo permette depositate anche le immagini della copertina, o prevedetela nel file dell’interno. Per la ricerca negli archivi ogni elemento della pubblicazione ha un ruolo importante e la visualizzazione della copertina è spesso di aiuto per identificare dati del contributo e ricordarli in seguito ai fini della citazione; come nei più generali canali della comunicazione l’immagine ha un ruolo importante.
Per non appesantire inutilmente la rete fate uso di file adattati al web sia per le immagini (con una risoluzione a 72 dpi) che per gli eBook, così da rendere sempre agevole il download.
Date una linea comune al materiale che depositate, cercate quindi di avere chiari prima tutti gli elementi, per evitare che ci siano dati divergenti nei diversi archivi, considerate con attenzione anche gli aspetti del copyright secondo quanto avete già stabilito22.
Ricordate infine che academia.edu o ResearchGate non sono archivi istituzionali aperti, fanno parte di un canale di comunicazione diverso, che segue delle pratiche proprie, più vicine a quelle del mondo dei social che a quello dell’archiviazione, su questo punto si rimanda all’articolo di Maria Chiara Pievatolo dal titolo esplicativo ResearchGate e Academia.edu non sono archivi ad accesso aperto23.
Infine non tralasciate tutti i passaggi necessari per la realizzazione di edizioni scientifiche di qualità: il deposito in repository non equivale da solo alla pubblicazione.
Se si prendono in esame le note funzioni dell’editoria accademica espresse da Roosendaal e Geurts24, la presenza nei repository riesce a rispondere alle funzioni di registrazione (registration), consapevolezza (awareness) e conservazione (archive), ma non a quella della certificazione (certification). Tutte le funzioni devono essere assolte in un equilibrio reciproco.
Oppure, più semplicemente, appoggiatevi ad una casa editrice come Anthology Digital Publishing che oltre a seguire pratiche rigorose di peer-review, svolge servizi di pubblicazione di qualità e mirate attività di disseminazione:
You Research, We Disseminate!
Abbinamenti musicali e degustazioni…
Si consiglia la lettura di questo articolo col sottofondo musicale di The Musical Box dei Genesis (Nursery Crime, 1971, Charisma Records) nella versione live rimasterizzata del 1973. Non vi spaventate, il travestimento di Peter Gabriel nello spirito di Henry rapidamente invecchiato non ha niente a che vedere col fatto che seguire le pratiche di archiviazione rischia di richiedere molto tempo agli Autori. È bello pensare all’archivio come a un carillon, che suona la sua musica ogni volta: Play me my song.
Unitelo a un Moscow mule, si diceva che fosse la bevanda corroborante dei pellegrini russi, ma è una leggenda lontana dalla realtà, visto che il long drink è nato negli Stati Uniti nel 1941 per esigenze di marketing. In ogni caso all’avvio del percorso di disseminazione accademica una sferzata di zenzero può essere comunque un utile aiuto.
1 Secondo i dati raccolti nella piattaforma OpenDOAR, un aggregatore di repositories, gli archivi aperti presenti in Italia sono 138, tra questi 129 sono istituzionali (dato consultato il 21/03/2019). ⇑
2 ArXiv.org è una piattaforma digitale, nata nel 1991, per la distribuzione e archiviazione di articoli scientifici afferenti ad alcune aree disciplinari, tra cui fisica, matematica, informatica, biologia quantitativa, finanza quantitativa e statistica. ⇑
3 SSRN, precedentemente noto come Social Science Research Network, è un deposito digitale nato nel 1994, con riferimento alle aree delle scienze sociali e umanistiche, scienze della vita, scienze applicate, salute e scienze fisiche. Nel maggio 2016, l’archivio SSRN è stato acquistato da Social Science Electronic Publishing Inc. di Elsevier. ⇑
4 RePEc (Research Papers in Economics), nato nel 1993 col nome di NetEc, è uno dei più grandi archivi digitali tematici che raccoglie lavori dedicati all’economia. L’archivio è sincronizzato con gli archivi istituzionali degli enti che aderiscono all’iniziativa di raccolta e permette anche l’autoarchiviazione da parte degli autori tramite il Munich Personal RePEc Archive (MPRA). ⇑
5 OSF (Open Science Framework) è un servizio di archiviazione sostenuto da COS (Center for Open Science), una società tecnologica senza scopo di lucro fondata nel 2013, il cui obiettivo è quello di «aumentare l’apertura, l’integrità e la riproducibilità della ricerca scientifica». Gli archivi disciplinari lanciati da OSF sono PsyArXiv, SocArXiv e engrXiv; si tratta di archivi open source per l’area psicologica, sociale e delle scienze ingegneristiche. ⇑
6 Zenodo è un archivio aperto per ricercatori, comunità scientifiche e istituti di ricerca, non impone alcun requisito in termini di formato, dimensioni, restrizioni di accesso o licenza. Attivo dal 2013, è stato sviluppato dai ricercatori del CERN, in qualità di partner del progetto OpenAIRE, commissionato dalla Comunità europea. Promuove l’open science, secondo questa filosofia anche il codice del software è opensource. La piattaforma permette l’attribuzione di DOI ai materiali caricati. ⇑
7 Figshare è un repository aperto, per ricercatori, istituzioni e editori, ideato nel 2011 da Mark Hahnel e lanciato sotto la nuova proprietà di Digital Science nel 2012. Tra i materiali che possono essere caricati ci sono poster, presentazioni, dataset, fileset e codici. Anche Figshare, come Zenodo, può assegnare DOI agli oggetti depositati. ⇑
8 È il caso di Figshare che, benché nel marzo 2018 si sia annunciato come un archivio istituzionale di nuova generazione (v. articolo di Alan Hyndman, Announcing the figshare Institutional Repository… and Data Repository… and Thesis Repository… really just an all-in-one next gen repository, 22 March 2018, in «figshare’s blog», visualizzabile qui), rimane di proprietà di Digital Science, una compagnia tecnologica con sedi a Londra e in Romania. ⇑
9 Mauro Guerrini, Gli archivi istituzionali. Open access, valutazione della ricerca e diritto d’autore, a cura di Andrea Capaccioni, Milano, Editrice Bibliografica, 2010, consultabile qui e che è stato un riferimento costante nella stesura di questo articolo. ⇑
10 Per l’interessante genesi e sviluppo storico del sistema di repository si rimanda ancora al volume di Guerrini, pp. 11-22. ⇑
11 Secondo l’appellativo coniato da Peter Suber, si parla di BBB Definition per quei documenti espressi durante il manifesto di Budapest – BOAI del 2002, il Bethesda Statement del 2003 e la Dichiarazione di Berlino del 2003. Le dichiarazioni formulate in seguito a questi incontri indicati sono viste come unitarie e come tasselli fondamentali del processo OA. ⇑
12 Dichiarazione di Budapest per l’accesso aperto, traduzione di Paola Castellucci, consultabile qui. ⇑
13 Curioso ricordare come, secondo Stevan Harnad, l’accostamento al colore verde sembra sia nato dalla pratica di SHERPA/RoMEO di catalogare come verdi gli editori che autorizzano il self-archiving da parte degli autori. Il sito SHERPA/RoMEO è un database online che analizza le politiche di accesso aperto adottate dagli editori di tutto il mondo e fornisce il riepilogo sulle autorizzazioni di archiviazione concesse agli autori, i colori che contraddistinguono le policy degli editori sono dalla più aperta alla più restrittiva (in cui l’archiviazione non è ufficialmente supportata): verde, blu, giallo, bianco. ⇑
14 Dublin Core, abbreviato in DC, è il set di termini usati per la descrizione di risorse digitali, ai fini della loro ricercabilità nella rete. Prende il nome dalla città di Dublin nell’Ohio in cui il primo gruppo base dei metadati fu presentato nel 1995 in un convegno organizzato da OCLC (Online Computer Library Center) e da NCSA (National Center for Supercomputing Applications). Il set è in continuo aggiornamento e dai 15 elementi iniziali si è passati all’estensione dei termini e alla creazione di sotto-elementi, classi… consultabili qui. ⇑
16 Simona Turbanti, Strumenti di misurazione della ricerca, Milano, Editrice Bibliografica, 2018, p. p. 35. Le citazioni dalla Commission recommendation of 17 July 2012 on access to and preservation of scientific information (2012/417/UE) sono rispettivamente tratte da pp. 39 e 41; il documento è disponibile, in più lingue, qui. ⇑
17 La policy di Anthology Digital Publishing sull’OA è leggibile nella pagina Open Access del nostro sito. ⇑
18 Il documento Linee guida per il deposito e la pubblicazione dei prodotti della ricerca in FLORE, il repository istituzionale dell’Università di Firenze è scaricabile qui. ⇑
19 Antonella De Robbio, Auto-archiviazione per la ricerca: problemi aperti e sviluppi futuri, «Bibliotime», novembre, 2003, consultabile qui. ⇑
20 Chawki Hajjem, Stevan Harnad, The open access citation advantage: Quality Advantage or Quality Bias?, «Open access archivangelism», Sunday, January 21st 2007, l’articolo è disponibile qui. ⇑
21 Secondo l’analisi di Chawki Hajjem su oltre 100.000 articoli di più aree disciplinari, confrontando il self-archiving attraverso una selezione “libera” da parte degli Autori con l’auto-archiviazione obbligatoria, sia i fattori di QB e QA contribuiscono all’OAA e tra questi il contributo della QA è maggiore. ⇑
22 Tratteremo in un post futuro questo importantissimo argomento sul copyright e sulle licenze di uso. Nel frattempo oltre a rimandare alla pagina del nostro sito su questi temi, consigliamo il saggio di Antonella De Robbio e Rosa Maiello, Archivi istituzionali e diritto d’autore, nel volume già citato di Guerrini (pp. 103-124). ⇑
23 Maria Chiara Pievatolo, ResearchGate e Academia.edu non sono archivi ad accesso aperto, in «Bollettino telematico di filosofia politica», 28 gennaio 2016, disponibile qui. ⇑
24 Peter A.Th.M. Geurts, Hans Roosendaal, Forces and functions in scientific communication: an analysis of their interplay, in The first international workshop Cooperative Research Information Systems in Physics: CRISP97 Aug. 31 Sept. 4, 1997, Oldenburg, Germany, 1997, l’articolo è consultabile qui. ⇑