Data Catalog

Data Documentation

Ogni dato pubblicato in un portale StatPortal OpenData ha una scheda informativa (metadata) che ne descrive le principali caratteristiche ed permette di comprenderne il contenuto, la provenienza, la qualità, l’aggiornamento ed eventuali informazioni specifiche relative agli open data come la licenza di riuso del dato. Le schede includono l’insieme minimo dei campi descrittivi specificati dallo standard ISO 15836:2009 “Dublin Core”.

Le schede supportano allegati e sono visualizzabili come pagine HTML nel portale ed integrate con i visualizzatori. Il modulo è integrato con i moduli “Data Search”, per la ricerca di dati nel portale sia dal modulo ,“SEO” per l’indicizzazione sui principali motori di ricerca e “Social Network Integration” per la condivisione dei contenuti nei social e per la valutazione della scheda.

Principali funzionalità

  • Pagine web HTML descriventi tutti i dati catalogati nel portale.
  • Campi descrittivi conformi allo standard ISO 15836:2009 “Dublin Core”.
  • Campi descrittivi specifici per il riuso degli Open Data.
  • Integrazione nativa con il modulo “Data Viewer”: dalla scheda è possibile accedere direttamente a tabelle, grafici e mappe.
  • Integrazione nativa con il modulo “Data Access”: dalla scheda è possibile eseguire il download del dato in tutti i formati supportati ed ottenere i link per l’accesso via HTTP.
  • Possibilità di documentare non solo dataset, ma anche applicazioni od altre risorse.
  • Gestione specifica dei link associati alla scheda.
  • Funzionalità per gestire allegati alla scheda mediante upload di file (es. Pdf).
  • Integrazione nativa con i moduli “Data Search”, “SEO” e “Social Network Integration”.
  • “Dati simili”: analizzando la metainformazione del il sistema propone all’utente link a dati simili quindi di potenziale interesse per l’utente.

Data Search

Il modulo “Data Search” accede alle informazioni descrittive (metadata) presenti nel modulo “Data Information” per fornire funzionalità di ricerca ed individuazione dei dati di interesse in base a determinati criteri. Il modulo utilizza algoritmi tipici dei motori di ricerca, e consente di proporre all’utente dati ritenuti correlati a delle parole chiave (keywords) immesse dagli utenti, sullo stile di Google e dei principali motori di ricerca.

Oltre che per mezzo della ricerca testuale con parole chiave, il modulo fornisce inoltre un’interfaccia utente, realizzata come pagina web interna al portale, per mezzo della quale l’utente può esplorare l’intero catalogo dei dati presenti nel sistema combinando con pochi click filtri e criteri di ricerca sugli attributi dei dati.

Principali funzionalità

  • Ricerca di dati per mezzo di parole chiave (keywords).
  • Ricerca su tutti gli attributi della scheda dato.
  • Ricerca sui contenuti e struttura ( colonne) del dato.
  • Visualizzazione intuitiva dei risultati con schede di sintesi del dato.
  • Pagina web per ricerca ed esplorazione dati con possibilità di combinare filtri e criteri di ricerca (es. temi, formati, licenze di riuso, ecc.).
  • Generazione di link http per ottenere l’elenco dei dati che soddisfano un singolo criterio (es. tutti i dati inerenti uno specifico tema, provenienti da una fonte o pubblicati da uno specifico utente, ecc.).

E.T.L.

Il modulo E.T.L. (Extract, Transform e Loading) consente agli utenti autorizzati di pubblicare in totale autonomia nuovi dati nel sistema.

Per mezzo di un semplice percorso guidato (wizard)  accessibile per mezzo di pagine web incluse nel portale, in pochi passi l’utente può eseguire l’upload del dato e documentarne attributi, struttura e contenuto. E’ inoltre attivabile un meccanismo di moderazione che consente di delegare a particolari utenze l’effettiva pubblicazione del dato on-line previa loro verifica ed approvazione finale.

Principali funzionalità

  • Percorso guidato (wizard) via web che consente in pochi passi di pubblicare nuovi dati sul portale.
  • Possibilità di profilare la funzionalità in modo da decidere quali utenze caricano i dati e quali sono responsabili di verifica e pubblicazione finale.
  • Integrazione nativa con il modulo “Data Documentation” per inserire e modificare la metainformazione del dato.
  • Upload di file in diversi formati (csv, .txt, .xls, .xlsx, .dbf, .mdb ,.shp e .kml).
  • Integrazione con il modulo “Data Documentation” per la documentazione degli attributi descrittivi del dato.
  • Funzionalità per descrivere la struttura del dato, indicando il tipo di informazione contenuta in ogni colonna (anno, biennio, comune, provincia, indirizzo, misura, ecc.).

Data Federation

Il modulo “Data Federation” permette di realizzare un sistema di “federazione”, inteso come un modo volontario di mettere a comune il patrimonio informativo sotto una unica interfaccia omogenea e standardizzata.

Con la federazione ogni portale realizzato con “StatPortal OpenData” può decidere autonomamente ed in modo selettivo di “agganciarsi” ad un altro portale realizzato con la medesima tecnologia ed esporre i dati pubblicati su tale sito come se fossero nel proprio; in questo modo anche se “fisicamente” i dati risiedono su un altro portale, l’utente li accede e li visualizza come se fossero presenti nel suo sito preferito.

Impostata la federazione con uno o più portali, appositi servizi si occupano di interrogare ad intervalli di tempo configurabili tali portali (harvesting) ed acquisire eventuali nuove schede o relativi aggiornamenti. Le schede di metainformazione saranno importate nel portale, mentre le tabelle contenenti i dati risiederanno unicamente nel rispettivo database di origine e saranno accedute via web (con il protocollo HTTP OData) in modo del tutto trasparente per l’utente.

Questo meccanismo consente la realizzazione di reti di portali collegati tra loro anche in modo gerarchico. Un esempio potrebbe essere un portale di una Regione che federa i vari portali delle proprie Provincie, piuttosto che quello di un generico ente con i propri vari dipartimenti.

Principali funzionalità

  • Possibilità di creare una rete di portali federati che condividono schede e dati.
  • La ricerca effettuata su un nodo (singolo portale) della rete federata restituisce come risultati anche quelli provenienti dagli altri nodi.
  • L’utente non percepisce la federazione: accede ad un portale e visualizza i dati federati come se fossero presenti nel portale di accesso.
  • Servizio di aggiunta ed aggiornamento dati federati (harvesting): per ogni portale federato è possibile impostare l’intervallo di tempo nel quale cercare aggiornamenti.
  • Gestione del mapping di temi e keyword tra portali.
LOGIN