Non cercare Big Data, saranno loro a trovare te.
A un alto livello di astrazione, vi sarà facile intuitivamente sapere quando abbiamo un requisito da Big Data, perché avremo sorgenti di dati con queste caratteristiche:
• di dimensioni molto grandi (per alcuni questo potrebbe essere delle dimensioni del terabyte di dati ma più spesso è vicino al petabyte di dati)
• contenenti dati non strutturati, non tabulari e molto complessi
• prodotti in tempi relativamente brevi e riguardano un breve periodo
• non trattabili in modo soddisfacente con piattaforme ETL tradizionale.
C'è una pletora di tecnologie a supporto dello storage, dell’interrogazione e del conteggio di Big Data. La scelta della tecnologia deve rispondere a solo tre fondamentali requisiti: funzionalità, qualità e soddisfacente rapporto costo-efficacia.
Tutto ciò non dovrebbe costituire un grosso problema e non è certo un fattore determinante in un progetto di Big Data.
Ma allora, cosa occorre tenere sempre a mente?
1) Se non si dispone di una domanda cui si può dare risposta solo attraverso i Big Data, allora non c'è bisogno di fare Big Data.
2) Trovata la domanda, bisogna capirne il significato e le implicazioni, identificare le azioni da compiere per rispondere alla domanda, dare la priorità alle azioni in base alle nostre esigenze e risorse.
3) Non chiedetevi come fare a usare i Big Data ma solo di che dati avete bisogno;
4) Smettere di cercare problemi di Big Data se non li avete, perché poi dovrete utilizzare una tecnologia Big Data di cui non avete alcun bisogno.
5) Non c’è bisogno di trovare Big Data: se ne avete bisogno, li avete a disposizione e li trovate adeguati alle vostre esigenze, allora loro troveranno voi.
L'utilizzo di Big Data, come tutti gli altri dati, dovrebbe essere il risultato di porre domande di business che non possono essere soddisfatte in modo adeguato con ciò che abbiamo a disposizione.
(dal Vangelo secondo Luigi - Seconda Lettera ai Data Scientists)