Perchè è utile farlo
Predisporre un piano di gestione dei dati richiede tempo ed impegno ma i ricercatori possono trarne molti vantaggi, tra cui
-
Un'organizzazione e dei dati strutturati permettono di ritrovare sempre i dati di cui si ha bisogno evitando che vadano perduti o di dover rifare lo stesso lavoro due o più volte.
-
Soddisfare i requisiti posti dagli enti finanziatori e dalle case editrici aumentando le chance di successo delle richieste fondi
-
Riconoscere le problematiche tecniche, legali ed etiche fin dall’inizio del progetto di ricerca
-
Aderire al Codice di Condotta per l’Integrità della ricerca
Che cos'è?
E’ un documento in fieri che per tutta la durata dell’intero ciclo del progetto di ricerca deve essere regolarmente rivisto e aggiornato. Nel dettaglio, per ogni set di dati il DPM contiene:
-
elementi di identificazione e descrizioni;
-
metodologie e gli standard utilizzati per la creazione e la gestione dei dati;
-
come, quando e dove i dati saranno condivisi e resi disponibili per il riutilizzo, fornendo motivazioni nel caso in cui parti dei dati non possano essere condivise apertamente;
-
come saranno archiviati i dati a lungo termine, dopo la fine del progetto.
Raccolta dei dati
I dati di ricerca possono essere molte cose diverse, a seconda della finalità per cui sono stati generati ed utilizzati (dati osservazionali, dati sperimentali, dati di simulazione o dati elaborati) e per la varietà di formati
- tabelle, documenti, registrazioni audio e video
- algoritmi e software, dati in tempo reale, big data, smart data etc
Alcuni dati possono anche essere sensibili o riservati e richiedono un'attenzione particolare.
- Che tipo di dati verranno raccolti?
- Come verranno raccolti?
- Quale formato di file li conterrà?
- In quale quantità si stima verranno raccolti?
- Come saranno strutturati?
- Quali limitazioni ci sono al loro uso?
- Ci sono e quali sono le questioni etiche o legali da prendere in considerazione?
Conservazione dei dati
Per la maggior parte dei progetti di ricerca, l'archiviazione e la condivisione interna dei propri dati avviene con le infrastrutture messe a disposizione dall’ateneo. Tuttavia, in alcuni casi potrebbero essere necessarie soluzioni speciali, in particolare quando la quantità di dati è molto elevata o quando è richiesta una maggiore sicurezza. Backup frequenti sono fondamentali in ogni fase della ricerca.
- Dove sono memorizzati i dati grezzi e i risultati?
- Come vengono salvati i dati?
- Come viene gestito il controllo degli accessi?
- Come vengono condivisi i dati all'interno del progetto?
- Come viene garantita la sicurezza dei dati sensibili?
Descrizione dei dati
La descrizione dei dati è spesso considerata dispendiosa in termini di tempo e denaro. Tuttavia, è un aspetto fondamentale e un prerequisito per rendere i dati della ricerca fruibili e ri-utilizzabili. Qualsiasi file o set di dati deve contenere metadati che ne descrivono l'origine, cioè quando, dove, come e da chi sono stati creati.
- Come saranno rivisti i dati?
- Esistono standard per i metadati?
- Quali metadati saranno inclusi?
- Come saranno generati i metadati?
- Come saranno documentati i dati?
- Come saranno comprensibili i dati per gli utenti secondari?
- Come sarà garantita la riproducibilità dei risultati?
Condivisione dei dati
I dati della ricerca sono altrettanto preziosi e di grande interesse per altri ricercatori alla stregua degli articoli scientifici o altri prodotti della ricerca. Quando la ricerca è finanziata con fondi pubblici, i metodi dovrebbero essere trasparenti e i risultati resi disponibili ed accessibili a tutti. La condivisione dei dati ne agevola il riutilizzo e l’avvio di nuovi progetti di ricerca. I set di dati possono essere pubblicati in riviste o archivi specifici e possono essere accreditati e citati nel medesimo modo aumentando la visibilità del ricercatore e del suo lavoro di ricerca.
- Quali dati saranno condivisi?
- Quali strumenti/software sono necessari per visualizzare/analizzare i dati?
- Quali dati non possono essere condivisi?
- Chi avrà accesso ai dati?
- Quando saranno condivisi i dati?
- Dove saranno condivisi i dati?
- Come saranno resi individuabili i dati?