O que é, o que faz e onde encontrar um Cientista de Dados?
Muito tem se falado sobre os Cientistas de Dados, seus salários e a quantidade de palavras buscadas pelo Linkedin que estão relacionadas a este perfil. Os RHs de grandes empresas dizem que procuram, mas não encontram. Parecem até unicórnios que só existem em contos de fadas.
Será que é isso mesmo o que ocorre? Vamos tentar analisar alguns aspectos...
Será que é necessário ser graduado em Matemática/Estatística ou ter um doutorado para ser um Cientista de Dados? Uma formação acadêmica de quatro anos a mais supera a experiência adquirida de quem vai direto para um ambiente empresarial? Existe uma diferença de mentalidade ou abordagem de alguém que tenha um mestrado/doutorado para alguém que não tem? A verdade é: poucos profissionais e pesquisadores têm a oportunidade de conhecer e aplicar profundamente todas as técnicas de Machine Learning/Data Science/modelagem estatística disponíveis no mercado. E essa complexidade aumenta considerando a variedade de serviços, plataformas, produtos, linguagens e ferramentas relacionadas ao assunto. Dessa maneira, o que diferencia o profissional é a facilidade de aprendizado e a habilidade para se utilizar novas soluções para novos problemas.
O Cientista de Dados trabalha somente com dados não-estruturados? Ao contrário do que se diz por aí um Cientista de Dados não trabalha apenas com dados não-estruturados. Aliás, as melhores fontes de informações para negócios ainda são as estruturadas. O Cientista de Dados vai onde o dado está. Se os dados estiverem em 1 planilha, ele utiliza a planilha. Seria da mesma maneira se os dados estivessem em 200 planilhas ou em quaisquer outras fontes como arquivos texto, bancos SQL/NoSQL, serviços, páginas na Internet, etc. Ele primeiramente extrai, valida, prepara, filtra, analisa, integra e agrega os dados, para só depois aplicar os modelos estatísticos. É sabido que, em geral, 80% do tempo de trabalho de um Cientista de Dados está na preparação dos dados e somente 20% na aplicação/comparação/evolução dos modelos.
Onde encontrar um Cientista de Dados? Na verdade, este é um problema recorrente quando se trata de contratação de mão-de-obra altamente qualificada no Brasil. As empresas oferecem valores abaixo de mercado e não encontram profissionais que correspondam às suas propostas. Depois alegam que o profissional não existe. Será que estão procurando no lugar certo ou da maneira correta?
Finalmente, existem poucos profissionais que conhecem profundamente os processos, métricas e KPIs das área de negócios em que estão envolvidos. E no final isso é o que importa para se ser um bom Cientista de Dados. Trata-se de usar a Estatística como meio e não como fim, ou seja, como ferramenta para resolução de problemas. Outra solução para essa "escassez" seria facilitar a formação de equipes multidisciplinares integrando pessoas que entendam os objetivos de negócios e pessoas com habilidades para manipular grandes quantidades de dados.
Seja como for, as empresas estão começando a entrar em uma nova Revolução Industrial, a qual desta vez é baseada em Informações. Para ela o Cientista de Dados será indispensável.
Alguns artigos como referência:
Do you need a PhD to be a Data Scientist?
Miriam Leitão comenta falta de mão de obra qualificada no Brasil (obs: o comentário é de 2011 e mostra dados desse período, quando a economia do Brasil ainda possuía índices bons de empregabilidade. Entretanto, a análise continua relevante.)
___________
A Prime atua com tecnologias de última geração garantindo o melhor custo-benefício e agilidade na entrega de seu projeto de Big Data & Analytics. Conheça nosso blog e nossos serviços.
Para mais informações, entre em contato.
Senior SAP Program & Project Manager | SAP Implementation Expert | SAP AMS Services Manager | Agile Leader | Leadership Mentor | @mentor.tec | Pai do Matteo
8 aExcelente artigo, André.