Manuale Open Data

apriamoci a un modo nuovo di vedere le cose - Open Data Ipa

1. Cosa sono gli Open Data?

1.1. Open Data

A cosa ci riferiamo esattamente quando parliamo di “dati aperti”? Proviamo a rispondere con una definizione:

Gli Open Data, o dati aperti, sono informazioni conservate, prodotte ed aggiornate dalle Pubbliche Amministrazioni rese gratuitamente disponibili per chiunque ne abbia interesse.

La Pubblica Amministrazione raccoglie al suo interno una grande quantità di dati; renderli disponibili a tutti gli interessati contribuisce allo sviluppo economico e sociale del Paese.

Gli Open Data sono dati senza vincolo di privacy che possono essere pubblicati in formato aperto, attraverso l’attribuzione di specifiche licenze che permettano l’anteprima ed il download in diversi formati per soddisfare le diverse esigenze di utilizzo.

Un dato aperto deve essere:

  • Fruibile – i dati devono poter essere utilizzati da parte di chiunque e devono permettere il riutilizzo e la ridistribuzione, anche per finalità commerciali, in formato disaggregato;
  • Accessibile – i dati devono essere accessibili attraverso le comuni tecnologie dell'informazione e della comunicazione, in formato aperto ed adatto all'utilizzo automatico;
  • Disponibile – i dati devono essere disponibili nel loro complesso, gratuitamente e preferibilmente eseguendo un semplice download da Internet.

2. Guida alla navigazione

Come navigare in maniera facile e trasparente senza perdere la bussola.

IPA mette a disposizione degli utenti il suo contenuto informativo in un nuovo portale dedicato interamente agli Open Data, accessibile tramite una pagina dedicata.

Tutti i dati aggiornati e le informazioni che costituiscono l’IPA possono essere consultati in modo interattivo cliccando sulle sezioni del menu principale: Dataset, Organizzazioni o Gruppi posizionate nella parte alta della home page.

guida alla navigazione portale Open Data

Figura 1 Menu Principale portale Open Data.

2.1. Dataset

2.1.1 Cos’è un dataset?

Un dataset è un insieme di dati strutturati in forma relazionale. In altre parole: un gruppo di dati raccolti in una tabella le cui colonne rappresentano le variabili e le righe rappresentano gli elementi del dataset.

2.1.2 Sezione dataset

Selezionando la sezione “Dataset” del menu principale, si accede ad una schermata come questa. Al centro puoi consultare la lista di tutti i dataset disponibili.

sezione dataset

Figura 2 Sezione dataset.

La dicitura in giallo evidenzia che il dataset è disponibile in formato CSV.

La dicitura in arancione evidenzia che i metadati del dataset sono disponibili in formato JSON.

La dicitura in grigio evidenzia che il dataset è disponibile nel solo formato TXT, per compatibilità con le modalità precedenti al 31 marzo 2021 (TXT con separatore tabulatore).

Selezionando il nome del dataset o una delle diciture colorate si accede alla pagina corrispondente contenente la descrizione estesa del dataset e l’accesso ai dati.

Per una navigazione veloce ed efficace il portale mette a disposizione diverse funzioni:

  1. ordinare l’elenco dei dataset secondo i criteri indicati nella tendina cliccando il simbolo
  2. filtrare l’elenco dei dataset usando la lista di filtri disponibile nel menu laterale: Organizzazioni, Gruppi, Tag, Formati, Licenze . È possibile sceglierne uno o più di uno contemporaneamente ed è possibile eliminarne uno o più di uno cliccando sulla x.

Scelto il dataset da consultare si aprirà la schermata ad esso dedicata, contenente:

  1. Titolo
  2. Descrizione
  3. Tipo di formato disponibile per il download tra txt, per i primi file inseriti nel database, csv, tsv, json, xml, xls per i file più recenti. Cliccando sul campo Esplora è possibile avere un’anteprima
    Nota bene: per i campi relativi alle date viene utilizzata una notazione internazionale del tipo YYYY-MM-DD, univocamente riconoscibile da qualsiasi utente e/o software di ogni paese europeo
  4. Descrizione metadati ovvero un file scaricabile che contiene i metadati del dataset. Con il termine metadato si intende l’informazione che descrive un insieme di dati. I metadati contengono informazioni che corredano i dati, ne esplicitano alcune caratteristiche e ne rendono più semplice l’identificazione (es. titolo, descrizione, link, indicazione della licenza, periodo di validità, ente gestore, formato, ecc.)
  5. Informazioni addizionali riferite al dataset, quali ad esempio l’ultimo aggiornamento e la frequenza di aggiornamento
Scheda organizzazioni - dataset

Figura 3 Scheda organizzazioni - dataset

2.2. Organizzazioni

Dalla home page è possibile accedere al filtro Organizzazioni.

sezione organizzazioni

Per “Organizzazioni” si intende chi ha la titolarità dei dataset, ovverosia:

agid

AGID - L'indice dei domicili digitali delle Pubbliche Amministrazioni e dei gestori di pubblici servizi (IPA), gestito dall'Agenzia per l'Italia Digitale, è titolare della maggior parte dei dataset perché contiene i domicili digitali da utilizzare per le comunicazioni, per lo scambio di informazioni e per l'invio di documenti validi a tutti gli effetti di legge tra le Pubbliche Amministrazioni, i gestori di pubblici servizi e i privati.

istat

ISTAT - L’Istituto Nazionale di Statistica è titolare dei dataset relativi alle tipologie di attività economiche dagli enti secondo la codifica Ateco approvata dall’ISTAT in stretta collaborazione con l'Agenzia delle Entrate, le Camere di Commercio ed altri Enti, Ministeri ed associazioni imprenditoriali interessate.

2.3. Gruppi

Dalla home page è possibile accedere al filtro Gruppi

sezione gruppi

Per “Gruppi” si intende la principale tipologia di informazione che viene rappresentata:

dati enti

Organizzazione enti - dataset riguardanti i dati degli Enti come inseriti dai rispettivi referenti.

Indirizzi elettronici degli enti

Indirizzi elettronici - dataset relativi ai dati di contatto elettronico degli Enti raccolti e resi pubblici secondo quanto descritto nel Codice dell’Amministrazione Digitale (CAD).

Tipologiche

Tipologiche - dataset relativi a tabelle tipologiche utilizzate per la codifica dei dati pubblicati.

Tipologiche

Ordini e Fatturazione - dataset relativi a tabelle tipologiche utilizzate per la codifica dei dati pubblicati.

2.4. Visualizzazione e download dei dati

I dataset in formato TXT possono essere scaricati con la funzione di download solo in questo formato.

I dataset in formato CSV possono essere scaricati in vari formati tramite la funzione di download.

Per i soli dataset in formato CSV è disponibile una funzione Anteprima in formato tabellare ( Esplora>Anteprima ) che consente di visualizzare l’intero dataset o parte di esso al solo scopo di esaminare il contenuto dei vari campi che potranno essere elaborati dopo averne fatto il download o accedendo direttamente tramite sparql endpoint.

Esolora-Anteprima

Facendo clic con il mouse su Esplora > Anteprima viene visualizzata la seguente pagina.

Funzioni dataset

Figura 4 Funzioni dataset

In alto a destra sono presenti due pulsanti:

-

Download per effettuare lo scarico del contenuto del dataset nel formato originario (per selezionare un formato diverso fare clic sulla relativa icona)

-

Data API per accedere allo sparql endpoint che consente di effettuare accessi, anche complessi, ai dati dei dataset, realizzabili tramite querying, codice Javascript o Python. Sono presenti alcuni esempi per facilitare la personalizzazione delle query.

Pulsanti Download & Data API Esempi Query

Figura 5 Esempi Query

Nella selezione del formato può essere utile tenere presente che:

CSV (Comma-Separated Values) è un formato utilizzato per l'importazione ed esportazione (ad esempio da fogli elettronici o database) di una tabella di dati

TSV Tab-separated Values) è un formato di file di testo dove la matrice di dati è un elenco di valori separati dal carattere tab

JSON (JavaScript Object Notation) è un semplice formato per lo scambio di dati che si basa su un sottoinsieme del Linguaggio di Programmazione JavaScript

XML (eXtensible Markup Language) è un metalinguaggio per la definizione di linguaggi di markup, l'XML è oggi molto utilizzato come mezzo per l'esportazione di dati tra diversi DBMS1

XLSX è un tipo di file di Microsoft Excel ed è quindi adatto per fogli di calcolo

Nella pagina sono inoltre presenti:

- Anteprima dei DATI descritta nel paragrafo successivo

- Data Dictionary ovvero l’elenco dei campi contenuti nel dataset con informazioni relative alla tipologia del campo (es. testo), una descrizione e indicazioni sulla lunghezza del campo..

2.5. Funzioni di anteprima

La finestra di anteprima dei dati può essere personalizzata utilizzando i “Filtri”.

Facendo clic su Aggiungi Filtro comparirà un menu a tendina in cui è possibile scegliere uno o più campi del dataset su cui effettuare il filtro. In ciascun filtro selezionando uno dei valori proposti vengono visualizzati i corrispondenti record del dataset. Per cancellare il filtro applicato è possibile eliminarlo facendo clic sulla X corrispondente al valore selezionato.

tabella Funzioni di Ricerca Avanzata

Figura 6 Ricerca avanzata

È infine possibile modificare l’ordine delle colonne con un semplice “drag and drop” (facendo clic con il mouse sulla prima riga di una colonna e spostandola nel punto ritenuto opportuno), cambiare le dimensioni della colonna agendo sulla relativa finestra, o l’ordine dei dati nella colonna facendo clic con il mouse sull’intestazione.

3. Cosa si può fare con gli Open Data?

3.1. Ricerca, informazione, trasparenza

Cittadini, studenti ed imprese possono trarre notevoli vantaggi dagli Open Data, sfruttando al meglio la conoscenza resa accessibile dalla Pubbliche Amministrazione.

L’apertura dei dataset di IPA consente ai cittadini un accesso immediato ad informazioni quali, ad esempio:

  • Elenco dei domicili digitali
  • Elenco degli indirizzi di PEC
  • Nominativi dei Responsabili della Transizione al Digitale

elementi utili per chi sia interessato ad un dato specifico (es. PEC del comune di Albano), ma anche per chi abbia necessità di compiere ricerche più approfondite per finalità di studio o statistiche.

4. Stampa il manuale

Se preferisci consultare il manuale in formato pdf o cartaceo puoi farlo utilizzando le funzioni di stampa del browser. Basta accedere alle impostazioni, indicate dal simbolo con i tre puntini nei principali browser, e selezionare “Stampa”.