Chi sfrutta i dati internet?

TROPPIDATI OTROPPO POCHI?
MAURIZIO RICCI
Più o meno, la maggior parte di noi è riuscita a farsi una ragione dei mega (intesi come megabyte, si intende). Abbiamo, ad esempio, capito che, sotto i 7 mega, non avremmo una connessione internet decente. I più svegli si sono fatti una ragione anche dei giga, i mille mega: più giga in pancia, più potente e veloce il pc che ci accingiamo a comprare. Sopra, francamente, fra tera, peta ed exabyte, per la stragrande maggioranza è come muoversi nell’universo favolistico e inafferrabile dei fantastilioni di zio Paperone. Ma è quello l’universo di “Big Data”, Tanti Dati, la cui era, ci assicurano, sta nascendo, proprio perché ci troviamo a che fare con un diluvio inarrestabile di dati.
Le ricerche su Google equivalgono a 24 milioni di petabyte al giorno, cioè migliaia di volte, ogni giorno, l’equivalente della più grande biblioteca al mondo, la Biblioteca del Congresso Usa, visto che una lettera dell’alfabeto vale un byte. Su Facebook, ogni giorno, si caricano 10 milioni di foto l’ora e si registrano 3 miliardi di I like.

Ogni secondo, su YouTube, 800 milioni di persone scaricano l’equivalente di un’ora di video. Il contatweet di Twitter è arrivano a 400 milioni ogni 24 ore.
Anche se, ogni giorno che passa, l’umanità vive un po’ di più online, tuttavia, non è questa la rivoluzione di Big Data. La rivoluzione viene dagli altri dati, fuori dal grande recinto di Internet: le ore e ore di video di una telecamera di sicurezza, il traffico dei telefonini, il peregrinare dei Gps sulle automobili, le transazioni delle carte di credito e quasi ogni altra cosa vi venga in mente. Questi dati esistevano anche prima. La novità — e la rivoluzione di Big Data — è che, oggi, l’informatica consente di equipararli ai dati online, di trasformarli, cioè in byte, e permette così ai computer, come per i download di YouTube, di solcarli, navigarli, gestirli, ricostruirli, catalogarli, interpretarli. Il risultato complessivo è una mole enorme di dati, i fantastilioni di zio Paperone.
Un film di un’ora equivale a un giga. Un exabyte è un miliardo di giga. Nel 2007, i dati di tutti i tipi (dalle e-mail ai videogiochi) ammontavano a 300 exabyte. Nel 2013, siamo arrivati a 1.200: l’equivalente di 1.200 miliardi di copie (digitali) del primo tempo di Via col vento. Se fossero riversati su cd, avremmo 5 torri di cd alte fino alla Luna. Che continuano a crescere, dice una grande società di consulenza come McKinsey, a velocità mozzafiato: questa mole enorme di dati raddoppia ogni 18 mesi. Naturalmente, i dati, in sé, anche se tanti, non parlano. Ma, grazie alla loro digitalizzazione, spiegano Viktor Mayer-Schoenberger e Kenneth Cukier in un libro ( Big Data) appena uscito negli Stati Uniti, diventa possibile applicare la matematica – i famosi algoritmi – a grandi quantità di dati, per rintracciare, in modo relativamente semplice e facile, probabilità. Ad esempio, si può disegnare una mappa, in tempo reale, dell’influenza, senza guardare neanche un termometro. Lo ha fatto Google nel 2009 con l’aviaria. Ha preso episodi precedenti di influenza e poi ha iniziato a scavare nel suo archivio sterminato per vedere quali erano le chiavi di ricerca più richieste nelle zone in cui era più diffusa l’influenza. Ha rapidamente testato 450 milioni di diversi modelli matematici e ne ha individuato uno che collegava 45 termini di ricerca all’insorgere dell’influenza.
Il punto chiave qui è che i termini di ricerca non dovevano essere necessariamente del genere «perché mi cola il naso?». Bastava che coincidessero con la diffusione dell’influenza. È una svolta cruciale per i parametri su cui, oggi, basiamo scienza e conoscenza. Più esattamente, è l’emarginazione – almeno operativa – del principio di causalità. Nel mondo di Big Data, è irrilevante sapere perché una cosa avviene. Sappiamo che avverrà perché è, statisticamente, sistematicamente, anche se non logicamente, collegata ad altre. Sotto, sotto, noi possiamo essere convinti che la causalità sia tuttora all’opera, anche se non siamo in grado di rintracciarla. Tuttavia, poco importa: grazie a Big Data siamo in grado di fare predizioni efficaci,che non siamo in grado di spiegare. Non è lontano il momento in cui il nostro medico ci convocherà per dirci che, visto che i mandorli in città fioriscono in ritardo, noi stiamo per avere un’infezione al rene, anche se lui non sa perché.
Un’altra vittima della rivoluzione di Big Data sono le tecniche di campionamento e di sondaggio. Perché affannarsi a individuare e interrogare un campione di clienti del supermercato, quando, grazie alle telecamere di sorveglianza, si è in grado di esaminare e verificare il comportamento dell’intero universo dei clienti? Poco importa sapere perché, dopo aver comprato i peperoni, il grosso dei clienti cerca un detersivo. Tanto vale spostare lo scaffale dei detersivi non lontano dai peperoni. Conqueste tecniche, dice McKinsey, grandi catene al dettaglio sono arrivate a risparmiare fino al 17 per cento sullo stoccaggio dei prodotti.
Ci sono modi più creativi di fare soldi con Big Data, anche se per ora largamente confinati all’analisi – con i problemi etici e di privacy che comporta – del comportamento e della psicologia dei consumatori. Soprattutto, dicono Mayer-Schoenberger e Cukier, per chi sarà capace di riutilizzare, in modo nuovo, dati raccolti da altri, per scopi diversi. Per ora, però, il potere dei dati è nelle mani di chi li ha. E qualcuno comincia anche a chiedersi se non sia in grado di dare un valore, anche in bilancio, a questi dati. Quanto valgono, insomma, i dati? Si può fare il caso diFacebook. Al momento della quotazione era stata valutata 104 miliardi di dollari. Un anno prima, l’ultima stima contabile parlava però di soli 6,3 miliardi, il corrispettivo degli investimenti in macchinari, server, computer eccetera. Insomma, gli attivi materiali. Il resto, quasi 100 miliardi di dollari non contabilizzati, possiamo dire che erano dati, il business effettivo di Facebook. Cento miliardi, a fronte di un po’ più di duemila miliardi di pezzi di “contenuto monetizzabile”, messi insieme fra il 2009 e il 2011 nelle sue bacheche. Sono i like, i commenti, i post. Vale a dire che, nel mondo di Big Data, ogni I like che io clicco vale 5 centesimi di dollaro. Per Mark Zuckerberg, naturalmente.
© RIPRODUZIONE RISERVATA

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *