Big Data - Spiegato facile
Artwork by Spencer Levine

Big Data - Spiegato facile

Tempo di lettura: meno di 4 minuti

Quello dei Big Data è uno concetti più abusati e allo stesso tempo incompresi della storia, spesso spiegato da persone che non ne hanno mai compreso veramente il significato.

L’esperto: “Sono grandi quantità di dati”.

Si, certo. Stringete la mano all'esperto. Avete 4 minuti, non tempo da perdere.

Partire con i piedi per terra

Prendiamo invece, per esempio, un singolo dato: la pressione che esercita il piede contro la scarpa in un dato istante e in un dato momento nel “ciclo del passo". Questo dato, estremamente puntuale e facilmente misurabile, da solo, non ci comunica molto.

Ma se noi potessimo studiare un insieme di queste informazioni, per esempio l’insieme delle misurazioni della pressione dentro la scarpa, ripetuta in ogni secondo, potremmo arrivare a stabilire tempo, lunghezza e frequenza media del passo durante la vita di una persona.

Potremmo, senza osservare questa persona con i nostri occhi, arrivare a comprendere se vi siano problemi di deambulazione (impossibile con il singolo dato), e correlare questa informazione ad altre patologie non strettamente legate al camminare (deambulazione modificata a seguito di infortunio, ma anche infarto, ictus, …)

Il dato - cioè la singola pressione sulla scarpa - in questo esempio, portava sì informazione ma molto limitata. Il valore di questa informazione è però esploso nel momento in cui abbiamo unito più “dati” tra di loro.

In casi come questo il valore è dato dall’unione di dati simili, mentre, in altri casi, dati diversi ma legati tra loro da un contesto comune.

Big Data: come riassumerlo

Big Data è quindi la possibilità di comprendere informazioni che sarebbero altrimenti invisibili, osservando i dati non singolarmente ma nel loro insieme. Queste informazioni sono rese visibili solo leggendo i dati con una chiave di lettura sistemica, considerando dunque non solo il contenuto, ma per esempio modalità, velocità, e quantità con cui essi sono raggruppati.

Prendiamo Google Maps, che conosce sempre non solo la strada per arrivare a destinazione, ma sa indicare anche il traffico che incontreremo. Vi siete mai chiesti quali e quante variabili Google prenda in considerazione per stimare una macro-informazione di questo tipo?

Come dice anche Wikipedia, Big Data rappresenta anche l'interrelazione di dati provenienti potenzialmente da fonti eterogenee, quindi non soltanto i dati strutturati, come i database, ma anche non strutturati, come immagini, email, dati GPS, informazioni prese dai social network.

Alcuni esempi: l'analisi per sondare gli "umori" dei mercati e del commercio, e quindi del trend complessivo della società e del fiume di informazioni che viaggiano e transitano attraverso Internet. Se entrassimo in una fabbrica, ci sarebbe un universo di informazioni che si potrebbero estrarre dalle persone, dalle macchine, dai prodotti e dai processi che li contengono.

Il motivo del "Big"

Dopo averne capito il significato, arriviamo invece al perchè si chiamano Big Data. Quanto più sono diverse le informazioni, quanto più è grande la mole di dati da gestire e quanto più è veloce la generazione di nuovi dati, tanto più è fuori di dubbio che siano necessarie delle macchine per gestire e analizzare il tutto. Computer diversi da quelli con cui teniamo la contabilità aziendale.

Big Data: dove sta il business

Big Data rappresenta dati strutturati e non, che vengono generati - non sempre consapevolmente - dal business e dai suoi stakeholder ogni giorno.

Molte aziende sono brave nel saper utilizzare i dati conosciuti, direttamente collegati al business.

Le aziende eccellenti sono quelle che sanno riconoscere l’esistenza e il valore dei dati non strutturati e hanno la visione di saperli mettere a sistema.

Non è dunque la quantità di dati che conta, ma è quello che l’azienda decide di farne, soprattutto se vengono utilizzati per decisioni strategiche di business.

E la parte “non strutturata” è molto, molto importante: Big Data non sono solo i dati aziendali che si utilizzano ogni giorno per gestire l'impresa. Sono tutti i dati, spesso non misurati, che (oggi) ancora non sono controllati.

Alcune aziende riescono a studiare il comportamento online - anche anonimo - delle persone per arrivare a concludere se per esempio ci si trovi di fronte a una donna, o magari di una donna in gravidanza. A volte anche prima che ne sia a conoscenza la futura mamma.

Utilizzi B2C

lo shampoo Sunsilk promuove certi prodotti sulla base delle condizioni meteo

Se vi sono giornate di aria molto secca, si noteranno più pubblicità degli shampoo per capelli secchi e danneggiati. In questo caso ci pensa Facebook offrendo possibilità di targeting molto spinte (tra cui il meteo), che il marketing di Sunsilk usa a proprio beneficio. E come loro, sono tantissimi i brand che pianificano le proprie campagne promozionali attorno ai parametri più disparati.

I brand (come anche i politici) utilizzano strumenti per comprendere le emozioni del pubblico riguardo i prodotti sui social media: si parla di “sentiment analysis”, non a caso, di dati sia strutturati (per esempio il numero di like), sia non strutturati (per esempio l’analisi testuale che dice “oggi ho i capelli molto secchi”), eseguita in modo sistematico su milioni di persone per volta. 

Utilizzi B2B

Ci sono cause sistemiche nel ritardo di alcuni ordini? Perchè di una batteria di macchinari identici alcuni tendono a rompersi più frequentemente? E’ possibile studiare come viene utilizzato il proprio prodotto per offrire modalità di assistenza personalizzate?

Intel effettua 19.000 diversi test su ogni singolo processore che produce. Iniziando ad analizzare i parametri di processo durante la produzione è riuscita a ridurre il numero di test, risparmiando milioni di dollari.

Le case farmaceutiche hanno produzioni continue estremamente complesse, dove qualunque spreco di materia prima, variazione di umidità nell’aria e altre variabili ambientali e produttive, possono far variare la rendita produttiva anche del 100%. Utilizzano i dati per prevenire possibili cause di spreco e inefficienza.

Parlando di estremi, GE è arrivata a generare 4.000 miliardi di record/anno (152.000 al giorno) differenti per singolo macchinario per la produzione di un singolo prodotto, al solo scopo creare modelli di prevenzione. E' un po' come dire: prevenire i problemi è sempre meglio per curarli, anche in fabbrica. (per saperne di più sul caso GE, http://bit.ly/2rFba3U)

Medicina e agricoltura sono i due settori in cui i big data si stanno già dimostrando un agente di cambiamento così importante da parlare di pre e post-Big Data.

Come applicarli alla nostra realtà? Servono sicuramente competenze specifiche, a partire da una conoscenza profonda dei processi e dei dati che si possono analizzare. Dopo, e solamente dopo tutto questo, si può iniziare a parlare di sistemi informativi, business analytics e tecnologie che qualche fornitore sarà già pronto a offrire.

Per concludere, una lettura consigliata:

Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà (2013)

di Viktor Mayer-Schönberger (Autore), Kenneth N. Cukier (Autore), R. Merlini (Traduttore)







Con l'esperienza di aver utilizzato i Big Data e averci lavorato per qualche qualche anno, ho capito che, a volte, serve una spiegazione concreta alla realtà, opportunamente contestualizzata.

Dubbi o precisazioni ulteriori? Scrivimi o commenta.

Sara Santorelli

Business developer e training consultant

5 anni

grazie, finalmente ho capito :-)

Per visualizzare o aggiungere un commento, accedi

Altre pagine consultate