Amara Law e a realidade dos dados para a Inteligência Artificial (IA)
"Nós tendemos a superestimar o efeito de uma tecnologia a curto prazo e subestimar o efeito a longo prazo."
Há alguns anos venho me dedicando aos estudos da inovação, tecnologia, futurismo, mercado e comportamentos e sempre falo do mundo data-driven (guiado por dados), bem como da importância (e função) deles na Era da Cibernética, com todas as transformações da 4ª Revolução Industrial. Sou mais um entusiasta das disrupções tecnológicas.
No entanto, é importante não deixarmos que a "empolgação" nos impeça de ver as dificuldades reais enfrentadas por quem tem de fato tentado implementar algumas tecnologias.
Abordarei aqui, especificamente, os dados, a Inteligência Artificial (IA), uma pesquisa global na área desta tecnologia e a Amara Law.
O fato é que para a Inteligência Artificial (IA) os dados são os verdadeiros combustíveis....mas quaisquer dados?
Na verdade, são necessários dados bons e limpos para alimentar algoritmos de aprendizado de máquina e creio que nisso não há grandes surpresas.
Porém, a realidade é que 96% das empresas que já estão usando Inteligência Artificial estão passando por grandes dificuldades com a qualidade dos dados necessários para o treinamento dos modelos de Machine Learning.
O que a pesquisa global da Alegion e Dimensional Research revela é que 8 em cada 10 das empresas ouvidas não conseguem escalar seus projetos na área.
Então, isso quer dizer que a Inteligência Artificial é uma "porcaria" e que talvez seja mais marketing do que realidade?
Não é bem assim. É aqui que entra a Amara Law, que diz que "Nós tendemos a superestimar o efeito de uma tecnologia a curto prazo e subestimar o efeito a longo prazo."
Vemos então que o crescimento maciço de dados também está sujeito à Amara Law, em um contexto no qual a qualidade dos dados confiáveis desempenhará um papel central na forma como essa mencionada Lei funcionará para a tecnologia de Inteligência Artificial.
Neste ponto, é importante mencionar que quando se fala em Inteligência Artificial, temos essa expressão como uma tecnologia ampla, da qual fazem parte o Machine Learning e o Deep Learning.
Pensando de uma forma básica, de fácil entendimento, Inteligência artificial é a inteligência humana exibida por máquinas; Machine Learning - aprendizado de máquinas - é a prática de usar algoritmos para coletar dados, aprender com eles, e então fazer uma determinação ou predição sobre alguma coisa no mundo; e Deep Learning - aprendizagem profunda - trata as oportunidades de aprendizagem (de máquina) profundas com o uso de redes neurais, para melhorar inúmeras questões no meio computacional, como reconhecimento de fala, visão e o processamento de linguagem natural.
Neste contexto, os dados só têm valor quando recebem a limpeza adequada para que tenham integridade. Sem isso, mesmo as empresas mais inteligentes que desenvolvem IA e todas as empresas que dependem de dados provavelmente falharão se seus dados estiverem cheios de imprecisões, duplicações e outras corrupções.
Como uma notável manifestação da Amara Law, as expectativas exageradas em torno dos dados, enquanto tecnologia, quase certamente serão seguidas por um ponto baixo de desilusão, e esse ponto baixo será causado simplesmente porque os dados não são de alta qualidade suficiente para o desenvolvimento desejável da Inteligência Artificial.
Os cientistas de dados normalmente precisam gastar entre 60% e 90% de seu tempo de trabalho limpando os dados disponíveis, isso em um mundo cada vez mais orientado por dados.
No entanto, apesar dos vários pontos baixos de desilusão em relação aos dados, sobretudo no desenvolvimento da Inteligência Artificial, sua importância a longo prazo permanecerá central para o sucesso da maioria das empresas. Você precisa continuar o desenvolvimento do seu pensamento data-driven e se atentar às oportunidades envolvidas.
Assim como o Google, Yahoo, PayPal, eBay, Amazon - e algumas outras diversas startups da Internet - sobreviveram à bolha das empresas pontocom ("Bolha da Internet") e, posteriormente, se tornaram bem-sucedidas, as empresas que limpam agora seus dados com sucesso para produzir dados de qualidade (nos quais você pode confiar) serão as que se tornarão as mais bem sucedidas, em um mundo cada vez mais dominado por dados.
---------------------
Leia mais: Proteção de dados além do Óbvio.