re3data
Dati scientifici, volume 10, numero articolo: 571 (2023) Citare questo articolo
119 accessi
4 Altmetrico
Dettagli sulle metriche
Da più di dieci anni, re3data, un registro globale di archivi di dati di ricerca (RDR), aiuta scienziati, agenzie di finanziamento, biblioteche e data center a trovare, identificare e fare riferimento agli RDR. Essendo la directory di RDR più grande al mondo, re3data descrive attualmente oltre 3.000 RDR sulla base di uno schema di metadati completo. Il servizio consente la ricerca di RDR di qualsiasi tipo e di tutte le discipline e gli utenti possono filtrare i risultati in base a un'ampia gamma di caratteristiche. Le descrizioni RDR di re3data sono disponibili come Open Data accessibili tramite API e sono utilizzate da numerosi servizi di Open Science. re3data è impegnata in varie iniziative e progetti riguardanti la gestione dei dati ed è menzionata nelle politiche di molte istituzioni scientifiche, organizzazioni finanziatrici ed editori. Questo articolo riflette sull'esperienza decennale nella gestione di re3data e discute dieci questioni chiave relative alla gestione di un servizio di scienza aperta che si rivolge agli RDR di tutto il mondo.
Negli anni 2010, rendere i dati della ricerca accessibili al pubblico ha acquisito importanza: termini come e-science1 e cyberscience2 stavano plasmando i discorsi sul lavoro scientifico nell’era digitale. Vari dibattiti all’interno della comunità scientifica3,4,5,6,7,8 hanno portato ad una maggiore consapevolezza del valore dell’accesso permanente ai dati della ricerca. Le raccomandazioni politiche dell’Organizzazione per la cooperazione e lo sviluppo economico (OCSE)9 o della Commissione europea10 riflettono questo cambiamento.
La necessità di una gestione professionale dei dati è stata sempre più sottolineata con la pubblicazione degli ormai ampiamente riconosciuti FAIR Data Principles11. Ricercatori, istituzioni accademiche e finanziatori hanno iniziato ad affrontare questo problema attraverso politiche12, iniziative e reti13,14,15 e infrastrutture16,17,18,19. Ad esempio, la National Science Foundation (NSF) negli Stati Uniti ha pubblicato una politica di condivisione dei dati nel 2011, in cui l’agenzia di finanziamento richiedeva ai beneficiari di fornire informazioni sulla gestione dei dati in un piano di gestione dei dati20. In Germania, la Fondazione tedesca per la ricerca (DFG) ha pubblicato una dichiarazione simile riguardo all’accesso ai dati della ricerca negli anni 201021,22.
La gestione dei dati di ricerca è stata discussa anche nelle comunità delle biblioteche e dei centri di calcolo: nel 2009, l'Iniziativa tedesca per l'informazione in rete (DINI), una rete di fornitori di infrastrutture informatiche, ha pubblicato un documento di sintesi sulla necessità di una gestione dei dati di ricerca (RDM) presso istituti di istruzione superiore23. Nel corso delle discussioni in seno al DINI è emersa evidente la necessità di un registro degli RDR. All’epoca, la Directory of Open Access Repositories (OpenDOAR)24 si era già affermata come una directory di repository soggettivi e istituzionali ad accesso aperto. Tuttavia, non esisteva una directory comparabile per gli RDR e non era chiaro quanti archivi dedicati ai dati di ricerca esistessero.
Nel 2011, un consorzio di istituti di ricerca in Germania ha presentato una proposta alla Fondazione tedesca per la ricerca (DFG), chiedendo un finanziamento per sviluppare "re3data – Registro degli archivi di dati di ricerca"25. I membri del consorzio erano il Karlsruhe Institute of Technology (KIT), la Humboldt-Universität zu Berlin e l'Helmholtz Open Science Office presso il Centro di ricerca tedesco per le geoscienze GFZ. La DFG approvò la proposta nello stesso anno. Il progetto mirava a sviluppare un servizio che aiutasse i ricercatori a identificare gli RDR idonei per archiviare i dati di ricerca. re3data è andato online nel 2012 e un anno dopo elencava già 400 RDR26.
Mentre lavorava al registro, il team del progetto in Germania è venuto a conoscenza di un'iniziativa simile negli Stati Uniti. Con il sostegno dell'Institute of Museum and Library Services, le biblioteche della Purdue e della Pennsylvania State University hanno sviluppato Databib, un "catalogo online globale e curato di archivi di dati di ricerca"27. Databib è andato online nello stesso anno28. All’epoca, gli RDR venivano indicizzati e curati dal personale delle biblioteche delle istituzioni partner di re3data, mentre Databib aveva istituito un comitato editoriale internazionale per curare le descrizioni degli RDR27. Databib e re3data hanno firmato un Memorandum of Understanding nel 2012 e, dopo un'eccellente collaborazione, i due servizi si sono fusi nel 201429. La fusione ha riunito idee di successo di ciascun servizio: gli schemi di metadati sono stati combinati, dando vita alla versione 2.2 dello schema di metadati re3data30, e gli insiemi di descrizioni RDR sono stati uniti. Il comitato editoriale internazionale di Databib è stato ampliato con i redattori di re3data. È proseguito lo sviluppo dell'infrastruttura IT di re3data, unendo le competenze maturate da entrambi i servizi. Per la gestione del servizio è stata insediata una coppia dirigente composta rispettivamente da un membro delle istituzioni di re3data e di Databib.