Il Datascientist è una professione IT?
La recente classifica di Experis Italia sulla #RAL media italiana IT, per profilo di media seniority, vede il #dataScientist al 14° posto
Questo profilo è "in crescita in tutti i settori, in particolare insurance, telco e banking"
Il ruolo del data scientist combina competenze sia nell'ambito IT che statistico, ma non si può classificare rigidamente né come un puro tecnico IT né come uno statistico tradizionale.
Si tratta in sostanza di una figura ibrida che unisce capacità di analisi statistica con competenze tecniche avanzate
Competenze tecniche
deve padroneggiare strumenti e linguaggi di programmazione come #Python, #R, #SQL, e tecnologie per la gestione dei dati come database relazionali e non relazionali. Inoltre, deve avere familiarità con il cloud computing, l'analisi di big data, e gli strumenti di #MachineLearning e #IA
Competenze statistiche
deve avere solide basi in statistica e matematica. Deve comprendere modelli statistici, tecniche di regressione, analisi delle serie temporali, e altre metodologie che aiutano a estrarre informazioni dai dati.
Quale delle due competenze deve prevalere?
Consigliati da LinkedIn
1. Contesto aziendale o industriale (pratico)
Prevalenza di competenze tecniche IT: In molti settori, le competenze tecniche sono più richieste, perché lavorare con big data, cloud computing, e algoritmi di machine learning spesso richiede conoscenze avanzate di programmazione, gestione di database, e tecnologie di elaborazione dati distribuita (come Hadoop o Spark).
La capacità di implementare soluzioni scalabili e integrabili con sistemi esistenti è essenziale.
2. Contesto accademico o di ricerca (teorico)
Prevalenza di competenze statistiche: In ambienti di ricerca o in ruoli più orientati all'analisi di modelli complessi, le competenze statistiche possono essere più cruciali.
L'abilità di applicare metodologie avanzate di inferenza statistica, costruire modelli predittivi sofisticati e condurre analisi rigorose può avere un peso maggiore.
3. Ruoli bilanciati (misto)
In molte aziende, un data scientist deve avere una buona combinazione di entrambe le competenze, con un'enfasi su:
Programmazione: Sapere come gestire dati, fare pulizia dei dati (data wrangling) e creare pipeline automatizzate.
Modellazione statistica: Applicare modelli appropriati e sapere interpretare correttamente i risultati.
Personalmente tendo per il 2)
#datadriven