I Big Data

Tempo di lettura: 1 minuto.

Fino a qualche anno fa era impossibile non trovare un panel sui Big Data nella maggior parte delle conferenze di tecnologia. Al giorno d’oggi si parla più di algoritmi e intelligenza artificiale, ma alla base restano, in ogni caso, i Big Data.

Con questa locuzione si intende l’accumulo di una grande mole di dati (fino all’ordine di miliardi di terabyte, dove 1 TB = 1 miliardo di byte), che per essere utilizzabili necessitano di tecnologie specifiche o particolari metodi analitici. In altre parole, questi dati sono di per sé inutilizzabili senza un mezzo con cui analizzarli nel modo opportuno. Tale mezzi sono per esempio algoritmi di intelligenza artificiale.

Cosa manca ai Big Data?

Gli ingegneri e gli scienziati sostengono la validità del loro campione solo perché costituito da milioni di dati. Ma grandezza del campione non significa completezza, né tantomeno autorevolezza.

Secondo Kate Crawford della University of Southern California, i Big Data soffrono di una serie di problemi:

  • Bias (distorsione o errore di valutazione): è necessario verificare da dove vengono i dati e quale sia il contesto perché essi abbiano un valore;
  • Rappresentanza (signal): nella rappresentazione dei Big Data mancano sempre delle categorie,  che si ripercuotono nell’utilizzo dei dati;
  • Scala: nell’enorme quantità dei dati i fenomeni piccoli non emergono.

Per capire come utilizzare i Big Data, è necessario aver in mente uno scopo perché, di per sé, i dati non parlano, ma è necessario porre loro le giuste domande per ottenere delle risposte.

Ma non tutti i sistemi sono quantificabili allo stesso modo. Una rete elettrica o un genoma lo sono, ma, com’è intuibile, tutta la sfera del comportamento umano non è soggetta a precise regole matematiche.

Per fare un esempio, Netflix ha sempre usato i Big Data che rivelano informazioni sugli spettacoli e le preferenze degli spettatori, ma dicono poco sul comportamento dello spettatore. Per questo decise di aggiungere i dati qualitativi, quelli che sono noti come Thick Data. Netflix ha iniziato a fornire intere stagioni di episodi tutti insieme, piuttosto che rilasciare un episodio alla settimana. In questo modo, ha capitalizzato la consapevolezza che i suoi abbonati preferiscono guardare più episodi di una serie in un breve lasso di tempo. Una scelta premiata dai consumatori e dagli investitori.

Quindi, per concludere, se i Big Data dicono dove e quando gli utenti utilizzano un certo prodotto i Thick Data rispondo a domande come “cosa fanno di quel prodotto gli utenti?”. I Big Data sono un potente strumento per dedurre le correlazioni tra eventi ma non certo un modo per capire la causalità.

Lorenzo Niccoli

Pubblicità

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...