Cientista de Dados ou Engenheiro de Dados?
Há poucos dias me deparei com a pergunta "Qual é a habilidade mais difícil de ensinar em ciência de dados?" no Quora.
E gostei da resposta do Anderson Chaves, que estabelece uma analogia do cientista de dados com um detetive, capaz de perceber detalhes aonde os outros em geral não percebem. E além disso, saber tirar proveito desses detalhes.
Ele enfatiza por exemplo que o cientista deve saber "como melhor organizar e conduzir uma linha de investigação dentro do projeto" e isso pressupõe um grande conhecimento do domínio do problema, ou seja, ser um especialista na área ou estar bem próximo disso. O que o Anderson diz é que o cientista deve estar muito bem assessorado por tal especialista, mas eu vou além.
É realmente muito difícil encontrar uma pessoa que seja esse expert no domínio da aplicação e que ao mesmo tempo domine com maestria as ferramentas para desenvolver boas soluções.
Por isso existe a tendência crescente de separar os papéis de CIENTISTA de dados e de ENGENHEIRO de dados.
O cientista, conforme descrito pelo Anderson Chaves, é uma espécie de detetive, repito, capaz de inspecionar os dados e capturar detalhes essenciais que são praticamente imperceptíveis aos outros. E também sabe como aproveitá-los para obter com eficiência a melhor solução para o problema.
Já o engenheiro é aquele profissional com formação mais profunda em computação, matemática e estatística, fluente nas ferramentas mais avançadas de BigData, Machine Learning e Deep Learning.
Uma equipe ideal do ponto de vista de eficiência é aquela que possui um bom engenheiro de dados que é capaz de atender as demandas de mais de um cientista de dados.
Em suma, a tendência é que ambos, Cientista de Dados e Engenheiro de Dados coexistam e trabalhem de forma complementar, cada um no seu domínio de especialidades.