A cosa ci riferiamo esattamente quando parliamo di “dati aperti”? Proviamo a rispondere con una definizione:
Gli Open Data, o dati aperti, sono informazioni
conservate, prodotte ed aggiornate dalle Pubbliche Amministrazioni rese gratuitamente disponibili per chiunque ne abbia interesse.
La Pubblica Amministrazione raccoglie al suo interno una grande quantità di dati; renderli disponibili a tutti gli interessati contribuisce allo sviluppo economico e sociale del Paese.
Gli Open Data sono dati senza vincolo di privacy che possono essere pubblicati in formato aperto, attraverso l’attribuzione di specifiche licenze che permettano l’anteprima ed il download in diversi formati per soddisfare le diverse esigenze di utilizzo.
Un dato aperto deve essere:
Fruibile – i dati devono poter essere utilizzati da parte di chiunque e devono permettere il riutilizzo e la ridistribuzione, anche per finalità commerciali, in formato disaggregato;
Accessibile – i dati devono essere accessibili attraverso le comuni tecnologie dell'informazione e della comunicazione, in formato aperto ed adatto all'utilizzo automatico;
Disponibile – i dati devono essere disponibili nel loro complesso, gratuitamente e preferibilmente eseguendo un semplice download da Internet.
Come navigare in maniera facile e trasparente senza perdere la bussola.
IPA mette a disposizione degli utenti il suo contenuto informativo in un nuovo portale dedicato interamente agli Open Data, accessibile tramite una pagina dedicata.
Tutti i dati aggiornati e le informazioni che costituiscono l’IPA possono essere consultati in modo interattivo cliccando sulle sezioni del menu principale: Dataset, Organizzazioni o Gruppi posizionate nella parte alta della home page.
Un dataset è un insieme di dati strutturati in forma relazionale. In altre parole: un gruppo di dati raccolti in una tabella le cui colonne rappresentano le variabili e le righe rappresentano gli elementi del dataset.
Selezionando la sezione “Dataset” del menu principale, si accede ad una schermata come questa. Al centro puoi consultare la lista di tutti i dataset disponibili.
Figura 2 Sezione dataset.
La dicitura in giallo evidenzia che il dataset è disponibile in formato CSV.
La dicitura in arancione evidenzia che i metadati del dataset sono disponibili in formato JSON.
La dicitura in grigio evidenzia che il dataset è disponibile nel solo formato TXT, per compatibilità con le modalità precedenti al 31 marzo 2021 (TXT con separatore tabulatore).
Selezionando il nome del dataset o una delle diciture colorate si accede alla pagina corrispondente contenente la descrizione estesa del dataset e l’accesso ai dati.
Per una navigazione veloce ed efficace il portale mette a disposizione diverse funzioni:
ordinare l’elenco dei dataset secondo i criteri indicati nella tendina cliccando il simbolo
filtrare l’elenco dei dataset usando la lista di filtri disponibile nel menu laterale: Organizzazioni, Gruppi, Tag, Formati, Licenze . È possibile sceglierne uno o più di uno contemporaneamente ed è possibile eliminarne uno o più di uno cliccando sulla x.
Scelto il dataset da consultare si aprirà la schermata ad esso dedicata, contenente:
Titolo
Descrizione
Tipo di formato disponibile per il download tra txt, per i primi file inseriti nel database, csv, tsv, json, xml, xls per i file più recenti. Cliccando sul campo Esplora è possibile avere un’anteprima Nota bene: per i campi relativi alle date viene utilizzata una notazione internazionale del tipo YYYY-MM-DD, univocamente riconoscibile da qualsiasi utente e/o software di ogni paese europeo
Descrizione metadati ovvero un file scaricabile che contiene i metadati del dataset. Con il termine metadato si intende l’informazione che descrive un insieme di dati. I metadati contengono informazioni che corredano i dati, ne esplicitano alcune caratteristiche e ne rendono più semplice l’identificazione (es. titolo, descrizione, link, indicazione della licenza, periodo di validità, ente gestore, formato, ecc.)
Informazioni addizionali riferite al dataset, quali ad esempio l’ultimo aggiornamento e la frequenza di aggiornamento
Dalla home page è possibile accedere al filtro Organizzazioni.
Per “Organizzazioni” si intende chi ha la titolarità dei dataset, ovverosia:
AGID - L'indice dei domicili digitali delle Pubbliche Amministrazioni e dei gestori di pubblici servizi (IPA), gestito dall'Agenzia per l'Italia Digitale, è titolare della maggior parte dei dataset perché contiene i domicili digitali da utilizzare per le comunicazioni, per lo scambio di informazioni e per l'invio di documenti validi a tutti gli effetti di legge tra le Pubbliche Amministrazioni, i gestori di pubblici servizi e i privati.
ISTAT - L’Istituto Nazionale di Statistica è titolare dei dataset relativi alle tipologie di attività economiche dagli enti secondo la codifica Ateco approvata dall’ISTAT in stretta collaborazione con l'Agenzia delle Entrate, le Camere di Commercio ed altri Enti, Ministeri ed associazioni imprenditoriali interessate.
Dalla home page è possibile accedere al filtro Gruppi
Per “Gruppi” si intende la principale tipologia di informazione che viene rappresentata:
Organizzazione enti - dataset riguardanti i dati degli Enti come inseriti dai rispettivi referenti.
Indirizzi elettronici - dataset relativi ai dati di contatto elettronico degli Enti raccolti e resi pubblici secondo quanto descritto nel Codice dell’Amministrazione Digitale (CAD).
Tipologiche - dataset relativi a tabelle tipologiche utilizzate per la codifica dei dati pubblicati.
Ordini e Fatturazione - dataset relativi a tabelle tipologiche utilizzate per la codifica dei dati pubblicati.
I dataset in formato TXT possono essere scaricati con la funzione di download solo in questo formato.
I dataset in formato CSV possono essere scaricati in vari formati tramite la funzione di download.
Per i soli dataset in formato CSV è disponibile una funzione Anteprima in formato tabellare ( Esplora>Anteprima ) che consente di visualizzare l’intero dataset o parte di esso al solo scopo di esaminare il contenuto dei vari campi che potranno essere elaborati dopo averne fatto il download o accedendo direttamente tramite sparql endpoint.
Facendo clic con il mouse su Esplora > Anteprima viene visualizzata la seguente pagina.
Figura 4 Funzioni dataset
In alto a destra sono presenti due pulsanti:
-
Download per effettuare lo scarico del contenuto del dataset nel formato originario (per selezionare un formato diverso fare clic sulla relativa icona)
-
Data API per accedere allo sparql endpoint che consente di effettuare accessi, anche complessi, ai dati dei dataset, realizzabili tramite querying, codice Javascript o Python. Sono presenti alcuni esempi per facilitare la personalizzazione delle query.
Figura 5 Esempi Query
Nella selezione del formato può essere utile tenere presente che:
CSV (Comma-Separated Values) è un formato utilizzato per l'importazione ed esportazione (ad esempio da fogli elettronici o database) di una tabella di dati
TSV Tab-separated Values) è un formato di file di testo dove la matrice di dati è un elenco di valori separati dal carattere tab
JSON (JavaScript Object Notation) è un semplice formato per lo scambio di dati che si basa su un sottoinsieme del Linguaggio di Programmazione JavaScript
XML (eXtensible Markup Language) è un metalinguaggio per la definizione di linguaggi di markup, l'XML è oggi molto utilizzato come mezzo per l'esportazione di dati tra diversi DBMS1
XLSX è un tipo di file di Microsoft Excel ed è quindi adatto per fogli di calcolo
Nella pagina sono inoltre presenti:
- Anteprima dei DATI descritta nel paragrafo successivo
- Data Dictionary ovvero l’elenco dei campi contenuti nel dataset con informazioni relative alla tipologia del campo (es. testo), una descrizione e indicazioni sulla lunghezza del campo..
La finestra di anteprima dei dati può essere personalizzata utilizzando i “Filtri”.
Facendo clic su Aggiungi Filtro comparirà un menu a tendina in cui è possibile scegliere uno o più campi del dataset su cui effettuare il filtro. In ciascun filtro selezionando uno dei valori proposti vengono visualizzati i corrispondenti record del dataset. Per cancellare il filtro applicato è possibile eliminarlo facendo clic sulla X corrispondente al valore selezionato.
Figura 6 Ricerca avanzata
È infine possibile modificare l’ordine delle colonne con un semplice “drag and drop” (facendo clic con il mouse sulla prima riga di una colonna e spostandola nel punto ritenuto opportuno), cambiare le dimensioni della colonna agendo sulla relativa finestra, o l’ordine dei dati nella colonna facendo clic con il mouse sull’intestazione.
Cittadini, studenti ed imprese possono trarre notevoli vantaggi dagli Open Data, sfruttando al meglio la conoscenza resa accessibile dalla Pubbliche Amministrazione.
L’apertura dei dataset di IPA consente ai cittadini un accesso immediato ad informazioni quali, ad esempio:
Elenco dei domicili digitali
Elenco degli indirizzi di PEC
Nominativi dei Responsabili della Transizione al Digitale
elementi utili per chi sia interessato ad un dato specifico (es. PEC del comune di Albano),
ma anche per chi abbia necessità di compiere ricerche più approfondite per finalità di studio o statistiche.
Se preferisci consultare il manuale in formato pdf o cartaceo puoi farlo utilizzando le funzioni di stampa del browser. Basta accedere alle impostazioni, indicate dal simbolo con i tre puntini nei principali browser, e selezionare “Stampa”.
Guida a Open Data IPA
Guida all'utilizzo delle funzionalità Open Data di IPA.