-
Matteo Santoro: Decisioni data-driven, la risposta alle reali esigenze del cittadino
di Redazione Open Innovation
Il CEO di Camelot Biomedical System, Matteo Santoro, coordinerà in occasione dell’evento #Lombardiaèricerca il workshop “Data Driven Innovation”.
Matteo Santoro propone e lancia alcuni spunti di riflessione come punto di partenza per la riflessione che continuerà nel corso del workshop del 6 aprile.
Quali sono le vostre idee e suggestioni rispetto ai temi sollevati? Potete lasciare un vostro commento alla discussione; le riflessioni verranno riprese nel corso del workshop.
La riflessione del CEO di Camelot Biomedical System Matteo Santoro (fonte: Prospettiva Aperta di Open Innovation):
I dati sono diventati una delle risorse strategiche per lo sviluppo economico della nostra società. Le fonti che generano dati sono sempre più numerose ed interconnesse grazie anche alla diffusione esponenziale della cosiddetta “Internet of Things” ovvero la rete dei dispositivi “intelligenti” che oggi ci circondano e che a volte addirittura portiamo addosso.
Regione Lombardia ha preso atto da tempo di queste tendenze e del potenziale valore rappresentato dai dati creati, raccolti o gestiti dagli enti pubblici che rappresenta. Con la piattaforma di Open Data, varata nel marzo 2012, ha inteso fornire uno strumento standard con cui tutti gli operatori interessati possono accedere ad un ampio catalogo di dati messi a disposizione dalla pubblica amministrazione.
Grazie anche a questa azione di avanguardia nel panorama Italiano, si è riusciti a dare un importante impulso alla creazione di valore da tali dati. Tuttavia, si è anche compreso che la pura accumulazione dei dati non genera innovazione e non crea direttamente valore aggiunto. I dati sono “risorse grezze” che vanno elaborati ed analizzati per poter estrarre da essi le informazioni e la conoscenza necessari a prendere decisioni efficaci.
La branca della Scienza che può abilitare questo tipo di processo è nota con il nome di “machine learning” (o “apprendimento automatico” o più suggestivamente “intelligenza artificiale”). Da alcuni anni gli algoritmi di machine learning stanno colonizzando i settori e le applicazioni più diverse: rendono le automobili in grado di guidarsi da sole, generano consigli personalizzati per i consumatori, individuano tentativi di infiltrazione informatica, forniscono previsioni sugli andamenti della domanda e dell’offerta, e molto altro ancora.
La visione strategica che Regione Lombardia oggi vuole far propria è che gli algoritmi, unitamente ai dati, sono diventati la nuova infrastruttura critica dell’economia digitale, la componente essenziale senza la quale il nostro Paese perderà l’ennesima opportunità di crescita.
Pertanto, si stanno avviando iniziative atte a favorire l’accesso aperto ad una tale infrastruttura da parte di tutti gli attori che possono contribuire al suo sviluppo, a beneficio del mondo della ricerca, dell’innovazione del sistema produttivo regionale e a favore di un processo di decisione e deliberazione basato sui dati e quindi centrato davvero sulle esigenze dei cittadini.
Il workshop del 6 aprile “Data Driven Innovation”, che modererò e che si terrà presso Palazzo Lombardia all’interno dell’evento #Lombardiaèricerca, ha lo scopo di sollecitare tutti i partecipanti a riflettere sulle modalità più opportune con cui Regione Lombardia potrebbe raggiungere questo obiettivo e sull’impatto che questo potrebbe avere nell’operatività della propria organizzazione e rispetto alle proprie esigenze.
In tal senso verranno raccolti tutti gli spunti utili a individuare degli scenari applicativi e dei casi d’uso rilevanti per la filiera della ricerca, dell’innovazione e del trasferimento tecnologico in Lombardia, che dimostrino le potenzialità concrete di una infrastruttura «open analytics», ovvero un laboratorio virtuale e pubblico per creare valore dai dati e guidare le decisioni strategiche.
Ultimi 3 contributi di 10 totali
Enrico Fagnoni
12/04/2017 alle 11:21
Nel worksop sono state fatte tre affermazioni che, a mio parere, sono profondamente errate e richiedono una precisazione:
- Tim Bern non ha detto "row data now" ma "....piuttosto che nulla, row data now!". La piattaforma che Tim Bern ha definito per il web sono i Linked Open Data e RDF. I dati in formato tabellare sono meglio che nulla, ma lungi dall'ottimo.
- E' stato detto che in America i Linked Data non li usa nessuno... Faccio osservare che solo dbpedia e wikidata (tutti basati in USA), da soli pubblicano più dati di quanti ne pubblica l'intera PA Italiana. E non ci sono solo loro: schema.org è utilizzato da quasi tutti i siti di commercio elettronico, non solo in america ma ovunque; Facebook e tutti i social hanno la loro ontologia pubblica con cui espongono i loro dati, etc. etc. Diciamo quindi che i dati tabellari li pubblicano solo le PA che sono obbligati a pubblicarli per ottemperare a qualche norma o per convenienza mediatica. Chi pubblica dati per usarli davvero lo fa in RDF.
- I Linked Data non sono dati aggregati, sono dati atomici con una semantica e relazioni.
Perchè la regione dovrebbe pubblicare Linked Open Data con una semantica bene definita? Ecco alcuni buoni motivi:
- Perchè abiliterebbe le macchine ad analizzare i suoi dati, ad easempio oggi ci sono centinaia di dataset con un campo "indirizzo" espresso nei modi più vari, se la semantica del dato è la stessa non ci vorrebbe molto ad utilizzarla (le ontologie ci sono già, es. schema.org)
- Perchè le best practices del web e dell'AgID lo consigliano
- Perchè la piattaforma Socrata che la regione a acquistato dagli americani lo supporta.
- Perchè si avrebbe un meccanismo omogeneo tra dati e indice (DCAT-APP-IT), che comunque andrà implementato
- Perchè si avrebbe un modo standard di esprimere i metadati, rendendo il portale navigabile dagli algoritmi.
- Perchè i dati del portale sarebbero immediatamente interoperabile con i portali maggiormente usati della PA (Istat e Indice PDA)
- Una ontologia fatta da Regione Lombardia diventerebbe facilmente il riferimento per tutti gli altri (data marketing) consolidando la leadership della nostra regione.
Con mia sorpresa la partecipazione al workshop di aziende è stata moto modesta; per gran parte è intervenuta Lombardia Informatica che temo abbia interesse a costruire nuove piattaforme piuttosto che rendere maggiormente fruibili i tanti dati che già ci sono.
In sintesi: con il portale open data la Regione ha iniziato un percorso virtuoso che è lungi dall'essere concluso. Prima di pensare agli algoritmi, mettiamo gli algorititmi in condizioni di lavorare. Come sovente avviene si è fatto il 20% del lavoro che permette di ottenere l'80% del risultato. Peccato che l'innovazione è tutta nel 20% che non vuole fare mai nessuno mai nessuno perchè costa tanto, serve intelligenza e non solo ore uomo e da poca visibilità.
Luca Balsamo
07/04/2017 alle 08:43
Nel WorkShop di ieri uno dei punti evidenziati era la mancaza di conoscenza degli opendata disponibili nella PA .
Vorrei segnalare alcuni link ,
sito degli opendata Italiani : http://www.dati.gov.it/
un piccolo contributo anche in merito alla lista degli opendata della Regione Lombardia : https://dati.lombardia.it/
e per ultimo vorrei segnalare che proprio ieri sono state pubblicate le nuove le linee guida per l’alimentazione e gestione di cataloghi dati secondo il profilo nazionale di metadatazione DCAT-AP_IT.
http://linee-guida-cataloghi-dati-profilo-dcat-ap-it.readthedocs.io/it/latest/index.html
Vuoi essere sempre aggiornato?
Partecipa attivamente, accedi a Open Innovation
Luca Balsamo
19/04/2017 alle 10:12
segnalo il link della UE
Consultazione pubblica sul tema Costruire l'economia europea di dati
https://ec.europa.eu/digital-single-market/en/news/public-consultation-building-european-data-economy