Cosa può scoprire un governo con i “metadati”

credits: Milan Industries
Un gruppo di ricercatori della Stanford University ha scoperto grazie ad un esperimento condotto su 800 volontari quanto è semplice ricavare informazioni personali dalla raccolta dei “metadati” anonimi.

Negli ultimi anni si è discusso molto in ambito mediatico, politico e accademico dell’utilizzo e della raccolta di “metadati”. Nonostante queste discussioni, non sembra essere ancora chiaro al vasto pubblico – che ne è direttamente interessato – quale siano le potenzialità che questi “metadati” contengono, e il loro eventuale fine di utilizzo per i più diversi scopi, leciti o illeciti.

Cosa sono i “metadati”

Come è noto, la nostra permanenza sulle reti tecnologiche globali lascia dietro di sé molte tracce, dati, posizioni e interazioni, che possono essere facilmente raccolte da enti, aziende e governi. I metadati, più che informazioni complete e descrittive, contengono informazioni specifiche che, se prese da sole, hanno scarso valore. Ad esempio: i metadati di una telefonata non possono rivelarne il contenuto, bensì solo ed esclusivamente alcune informazioni specifiche quali la durata, l’orario in cui è stata fatta, talvolta il numero ricevente e quello chiamante – numeri che solo in un secondo momento, con un’ulteriore analisi o una richiesta ai provider telefonici, possono essere associati ad un nominativo.

Questi “dati sui dati” – da cui il nome metadati – in partenza sono anonimi, e sono spesso utilizzati in ambito statistico, di ricerca e per servizi (si pensi al fenomeno big data, che può comprendere anche l’utilizzo di metadati, e che sta rivoluzionando positivamente l’approccio alle politiche pubbliche di molte amministrazioni sparse per il mondo).

La diffusione capillare di dispositivi e piattaforme internet su cui le persone caricano volontariamente le proprie informazioni personali – talvolta in maniera incauta – ha aumentato esponenzialmente il potenziale dei metadati. Alcune aziende, come Google e Facebook, sulla raccolta di queste meta-informazioni hanno potuto costruire imperi economici senza praticamente dover chiedere soldi agli utilizzatori dei loro servizi.

Leggi anche Modernità e diritto alla privacy

La facilità con cui aziende e governi possono raccogliere informazioni sparse e indefinite su decine di milioni di persone ha creato nel tempo una sensazione diffusa riguardo la perdita costante di privacy da parte dei cittadini, sensazione che è esplosa mediaticamente da quando Edward Snowden, ex-analista statunitense della National Security Agency (NSA), ha rivelato l’esistenza di alcuni programmi governativi statunitensi e britannici incentrati sulla raccolta e l’incrocio di un’enorme quantitativo di metadati. Nelle seguenti schede prodotte da vox.com potete avere una panoramica del dibattito che ne è generato.

La ricerca della Stanford University

A seguito dello scandalo dell’NSA, il governo americano si è affrettato ad assicurare che tutti i dati raccolti dall’agenzia governativa sono anonimi, cosa peraltro vera. Obama ha dichiarato che questi dati sono utilizzati esclusivamente per trovare le informazioni che le persone tentano di nascondere. I metadati sarebbero utili solo se già si conosce il “cosa” ci interessa di una determinata ricerca. Pur avendo un fondo di verità – sapere che un da un indirizzo IP o da un numero di telefono c’è stata una telefonata di 3 minuti e mezzo, in sé, non contiene nessuna informazione rilevante – questa difesa regge poco se pensiamo a come questi dati potrebbero essere utilizzati e alla relativa facilità con cui si può violare l’anonimato incrociando i giusti dati anonimi ottenuti.

Ed è proprio questo l’obiettivo che si erano prefissati alcuni ricercatori della Stanford University, che in un loro recente studio hanno dimostrato attraverso un esperimento con volontari come nell’80% dei casi presi in analisi sia stato possibile individuare, grazie a metadati anonimi, molte informazioni personali dei partecipanti e risalire alle loro identità.

Topologia dei “nodi” sui servizi utilizzati dai partecipanti alla ricerca / Fig. S8 “Evaluating the privacy properties of telephone metadata”, Mayer, Mutchler, Mitchell (Stanford University) in PNAS, 17 maggio 2016, vol.113, N.20

Gli 823 volontari hanno dovuto installare sul proprio smartphone un’applicazione che ha registrato l’utilizzo del dispositivo. Attraverso quest’app sono stati raccolti metadati di circa 250.000 chiamate e di 1,2 milioni di messaggi di testo. Quando questi metadati sono stati incrociati con le informazioni pubbliche dei partecipanti (facilmente reperibili sui vari social network), i ricercatori non solo hanno associato ai dati i nomi delle persone, ma hanno anche individuato i loro partner, alcune loro abitudini e il loro stato di salute.

Ad esempio: grazie a delle chiamate fatte in sequenza ad un centro cardiologico, ad un medico, ad una farmacia ed infine ad un numero verde per il monitoraggio della frequenza cardiaca, i ricercatori hanno capito che quella persona, identificata poi con nome e cognome, era affetta da una malattia cardiaca che causava battiti irregolari. Cosa risultata poi effettivamente corretta, come sono risultate corrette altre “intuizioni” dei ricercatori: un partecipante all’esperimento era in gravidanza, un altro era malato di sclerosi multipla, un altro ancora stava progettando di coltivare della cannabis. Tutte informazioni apparentemente innocue, ma che potrebbero tornare molto utili in ambito di intelligence e/o indagini. Tutte informazioni ricavabili senza l’intervento di un giudice.

Leggi anche Perché ci si spia da sempre tra alleati

La raccolta di metadati anonimi renderebbe quindi molto semplice – per chi ne avesse capacità tecniche e la volontà, come i governi e le multinazionali – estrapolare informazioni sensibili che si celano dietro il muro della privacy per così dire “classica”, muro che fin qui era stato eretto a protezione legale della riservatezza dei cittadini. Il livello della privacy si è, di fatto, scomposto in due livelli: le informazioni contenute nei metadati sono inizialmente anonime, ma possono rivelare moltissimo ad una seconda analisi di approfondimento. Le informazioni che si possono ottenere infrangendo la privacy potrebbero non valere nulla in un dato momento, ma tornare estremamente utili in un ipotetico futuro, se correttamente immagazzinate in qualche server: conoscere i problemi economici di qualcuno, o sapere dei suoi tradimenti amorosi, dell’ideologia politica di appartenenza o, come visto, entrare a conoscenza di problemi di salute di una qualsiasi persona, potrebbe regalare un forte potere di costrizione e condizionamento sull’individuo target.

Sarà difficile per i legislatori trovare un punto di incontro tra le capacità sempre più pervasive della tecnica, il bisogno di sicurezza delle istituzioni governative e il diritto dei cittadini ad avere riservatezza nei riguardi della propria vita privata. Oggi la legge protegge solo la privacy “dei contenuti delle comunicazioni, ma non dei metadati che queste comunicazioni posseggono. Per non parlare di come l’utilizzo ormai planetario delle comunicazioni online, e quindi dei relativi metadati, possa essere sfruttato dai diversi governi autoritari sparsi per il mondo per aumentare il controllo sulla società e restringere ancora di più le libertà dei propri cittadini, destinati a diventare prigionieri inconsapevoli di un fluido panopticon globale.

di Lorenzo Carota