Infrastrutture critiche, la sicurezza passa dai Big Data

926

Si chiama Obserbot il software, sviluppato da Enea, in grado di analizzare lo stato delle infrastrutture critiche per prevenire guasti, interruzioni ed attentati

La sicurezza di servizi essenziali come trasporti, elettricità e acqua passa anche attraverso l’analisi dei big data. È questo l’obiettivo del software Obserbot – dall’unione delle parole ‘Observer’ e ‘Robot’ – che renderà possibile acquisire ed elaborare tutte le informazioni che circolano nel web sui danni subiti dalle infrastrutture critiche a causa di guasti, eventi naturali ma anche attentati terroristici.

Realizzato da un team di ricercatori dell’ENEA, Obserbot è in grado di osservare in maniera totalmente automatizzata la rete grazie alla potenza dell'infrastruttura di calcolo ENEAGRID/CRESCO e alla rete nazionale a banda ultralarga GARR.

In particolare, come Vittorio Rosato, responsabile del Laboratorio ENEA di Analisi e protezione delle infrastrutture critiche, “tra le novità si aggiunge la possibilità di acquisire i dati anche da social network, agenzie di stampa e blog. L’analisi di queste informazioni è molto delicata, perché queste fonti richiedono una verifica approfondita del contenuto ma restituiscono una conoscenza diretta dello stato delle infrastrutture grazie alle informazioni messe in rete dagli utenti stessi, il cosiddetto fenomeno del crowdsourcing. Inauguriamo così un nuovo modo di ascoltare i cittadini e di renderli proattivi nel favorire la sicurezza e la protezione della collettività e dei servizi essenziali”.
 

Chi sono gli “influencer”

Gregorio D’Agostino, team leader dello sviluppo del software, focalizza invece l'attenzione sul fatto che “Obserbot permette di individuare gli influencer, ossia quelle persone che più di altre contribuiscono alla formazione delle opinioni e degli interessi generali, e di misurare la tendenza dei navigatori virtuali ad essere influenzati”. Un elemento rilevante per questi studi, sviluppati in collaborazione con la Boston University, è stato il concetto di “temperatura della lingua” basato sulla frequenza di ripetizione delle parole nei testi, che consente di avvicinare l’analisi automatica di un messaggio a criteri più “umani” nel processo di individuazione delle informazioni d’interesse.

Il risultato ottenuto dal team ENEA è stato la realizzazione di una piattaforma in continua espansione e capace di arricchirsi, in modo del tutto automatizzato, con le informazioni su incidenti e blackout alle infrastrutture critiche pubblicate online dagli internauti. Dati che il software ENEA classifica in modo molto accurato secondo criteri elaborati a livello europeo insieme al centro di ricerca olandese TNO in base alla tipologia di evento (ad esempio calamità naturale, malfunzionamento, attacco o cattiva manutenzione) e di infrastruttura coinvolta, di località interessata, tempistica e danni conseguenti.

 

Due milioni di mail al secondo

Attualmente la Rete costituisce un’enorme fonte di informazioni su quanto avviene nel mondo, ma anche sulle persone, su ciò che pensano e le emozioni che provano. La dimensione del web è sconfinata: si stima che ci siano 1 miliardo di siti e 5 miliardi di pagine web. I social network contribuiscono costantemente all’aumento di queste dimensioni, visto che ogni secondo nel mondo vengono pubblicati 6.000 tweet e spediti oltre 2 milioni di messaggi di posta elettronica. In questo senso, l’analisi dei dati della rete costituisce un’incredibile sorgente di conoscenza e poter accedere a queste informazioni può risultare strategico anche per il progresso della ricerca scientifica.