Dati, dati, apertamente dati

Documenti, report, siti e alcune esperienze personali su dati e open data, nella prima Giornata europea della statistica.

Una serie di coincidenze mi portano a parlare di dati e open data in questi giorni: l’estensione  dell’Open Research Data Pilot a tutti i temi di Horizon 2020 a partire dallo scorso 25 luglio 2016, la recente pubblicazione sulla maturità nell’adozione di politiche per gli open data in Europa, e la prima Giornata europea della statistica. Come se non bastasse, in questi giorni sto lottando con la mancanza di questi famigerati open data.

Open Research Data in Horizon 2020

Open Research Data in H2020 - Infographic
Open Research Data in H2020 – Infographic

A partire dai bandi 2017, tutti i progetti Horizon 2020 dovranno aderire all’Open Research Data Pilot: questa politica si applica a tutti i dati a supporto delle pubblicazioni peer reviewed prodotte all’interno di un progetto, nonché a tutti i dati generati dal progetto anche non direttamente collegati a pubblicazioni specifiche. Sarà possibile chiedere l’esonero da tale obbligo (opt-out) solo per chiari e giustificati motivi: per dati la cui pubblicazione viola i principi di privacy, per dati la cui pubblicazione confligge con lo sfruttamento commerciale dei risultati della ricerca, oppure per dati la cui pubblicazione potrebbe mettere a repentaglio la realizzazione dello stesso progetto. Per tutti i progetti che generano dati, anche nel caso di opt-out, resta l’obbligo di definire con chiarezza quali dati saranno generati e come saranno gestiti e conservati, attraverso un Data Management Plan da definire entro il sesto mese di progetto e da aggiornare costantemente.

Per maggior informazioni, la Commissione ha realizzato una chiara infografica.

La situazione degli Open Data in Europa

Open Data Maturity in Europe 2016
La copertina del report “Open Data Maturity in Europe 2016”

Ma di open data si parla non solo nel caso della ricerca, ma anche di tutti gli enti pubblici. La Commissione europea ha pubblicato all’inizio di ottobre uno studio, condotto da Capogemini, che offre una panoramica sull’adozione di politiche per gli open data nei 28 Paesi dell’Unione Europea, nonché in Norvegia, Svizzera e Liechtenstein.

Il report intitolato “Open Data Maturity in Europe 2016: Insights into the European state of play” è scaricabile dallo European Data Portal, portale europeo dedicato agli open data. I dati del report sono anche accessibili su un dashboard dello stesso European Data Portal. Lì troverete anche i dati grezzi (raw data) se volete cimentarvi in altre analisi e applicazioni.

In breve, vale la pena non solo leggere e consultare il report per il suo contenuto, ma anche vedere cosa è possibile fare con i dati sia in termini di accessibilità e di riutilizzabilità.

E gli open data della DG Research?

Qual è la situazione circa gli open data della DG Research e delle altre agenzie (ERC, REA, EASME) coinvolte nella gestione di Horizon 2020? Ci si aspetterebbe una completa adesione alle politiche in favore degli open data, non solo in quanto istituzione pubblica, ma perché è la prima a promuovere politiche di apertura dei dati della ricerca. Eppure la situazione potrebbe essere migliore.

Molto è stato fatto circa i progetti finanziati: sul sito di CORDIS è possibile accedere ad un catalogo dei progetti finanziati, e i dati grezzi sono pubblicati sullo European Union Open Data Portal. Anche i dati dei bandi sono consultabili tramite un catalogo specifico, il ben noto Research Participant Portal, ed è anche possibile accedere ai dati grezzi attraverso delle API (Application Programming Interface) specifiche. Il sito dello European Research Council ha funzionalità analoghe con statistiche su proposte e progetti e con un catalogo dei progetti finanziati.

Resta ancora molto da fare, tuttavia. Il mancanza maggiore riguarda la disponibilità di dati sulle proposte ricevute e sui processi di valutazione. Regolarmente informazioni vengono pubblicate in Flash call info in formato PDF, in forma non dettagliata e non sempre coerente. Altri dati sono resi disponibili, elaborati in tabelle o peggio ancora in semplici grafici (immagini) nei report di monitoraggio e di valutazione dei programmi quadro.

In questi giorni sto cercando di analizzare i dati sui tassi di successo in Horizon 2020 e nei precedenti programmi quadro. Mi ritrovo a dover estrapolare i dati manualmente dai documenti in PDF e dover verificare la confrontabilità tra i dati da un report all’altro, prima ancora di poterli studiare. Un lavoro immane, che mi sarebbe risparmiato se (1) la DG Research mettesse a disposizione i dati grezzi in formati aperti e (2) adottasse dizionari e definizioni valide per tutti i programmi di finanziamento.

Perché tutta questa fatica?

Oggi si celebra la prima Giornata europea della statistica
20/10/2016: prima Giornata europea della statistica

Qualcuno potrebbe obiettare che tutta fatica non ha senso: potrei semplicemente affidarmi alle informazioni e alle analisi già fatte da altri centri studi e dagli enti pubblici. Forse sì, ma così non darei sfogo al mio lato nerd, che prova piacere nel leggere, interpretare e gestire numeri e dati.

Se questa giustificazione, che vale solo a livello personale, allora non mi resta che rimandarvi a questo video creato per celebrare la prima Giornata Europea della Statistica, un’iniziativa lanciata dallo European Statistical Advisory Committee (ESAC) con il sostegno dei membri del Sistema statistico europeo (European Statistical System, ESS) e del Sistema europeo delle banche centrali (European System of Central Banks, ESCB).

In breve: i dati migliorano ala nostra vita e la possono rendere più piacevole.