IA Generativa não é calculadora
Resolvi experimentar a nova IA Generativa da Google, o Gemini Pro, para análise e resumo de dados e os resultados me deixaram bem entusiasmado com a riqueza de possibilidades de análise, mas....
Acredite, encontrei um erro básico de soma.
Confesso que o deslumbre virou desilusão. Como um modelo treinado com bilhões de dados comete um erro em uma simples soma de 4 numeros ?
Mas afinal o que foi que deu errado ?
A partir de um conjunto de dados fornecido como uma tabela, pedi para que me mostrasse a soma de despesas de um departamento.
Então escrevi o prompt abaixo e vejam a resposta
Como esses valores eu havia extraído de um painel de análise que desenvolvi no Qlik Sense, eu sabia que a soma não era essa. O valor correto é 228.462.
Repeti o prompt e recebi a mesma resposta. Achei que era alguma alucinação, mas o parâmetro de temperatura estava com valor 0 o que indica que a resposta deve ser mais assertiva
Temperatura: "A temperatura controla o grau de aleatoriedade na seleção do token. Temperaturas mais baixas são boas para solicitações que esperam uma resposta verdadeira ou correta, e as mais altas podem gerar resultados mais diversos ou inesperados. Com uma temperatura de 0, o token de probabilidade mais alta é sempre selecionado. Na maioria dos casos de uso, é melhor começar com a temperatura 0,2."
Repeti o mesmo Prompt e a resposta foi a mesma.
Confesso que refiz o cálculo na calculadora, mostrei para colegas e ninguém entendeu de onde saiu esse número.
Escrevi um prompt com uma soma mais simples de 3 números e a soma deu certo
Enfim depois disso escrevi um prompt dizendo que a resposta estava incorreta. E aí que "milagrosamente" ele refez a conta e agora ele veio correta.
Nesse momento eu estava mostrando o resultado dos prompt para colegas e então alguém diz: Pergunta ai por que o cálculo estava errado ? Bom Foi o que fiz:
A resposta até tentou explicar como ele faz o cálculo errado e depois da forma certa, mas nenhuma delas explica de fato qual o modelo matemático que ele usou para fazer cálculos.
Bom depois, disso a soma ficou correta quando perguntei no prompt qual a soma das despesa do departamento C-Level.
Este é o conteúdo da tabela de dados para o departamento C-Level
Achei muito bem descritas as Observações sobre os dados e também as recomendações com base somente nos dados disponíveis. Parecem obvias, mas para uma máquina chegar nessas conclusões achei bem razoável.
Recomendados pelo LinkedIn
Enfim, depois do meu feedback do cálculo errado, o somatório se mostrou correto dali pra frente.
Para comparação , fiz o mesmo teste com o Bard que é baseado no modelo palM2 e a resposta foi correta de primeira.
Ainda não fui a fundo para entender por que do motivo do erro, talvez por que Gemini Pro ainda esteja em beta e ainda "aprendendo" agora com os desenvolvedores que o estão testando.
Por outro lado, fui buscar na internet algum artigo que falasse sobre GenAI e calculos matemáticas e achei este bem interessante que explica como os modelos generativos funcionam.
A principal diferença é que calculadoras seguem regras pré-determinadas , já os modelos de IA generativa não.
Pra fechar fui perguntar pro Bard como ele aprendeu a calcular e esta é a resposta:
"Aprendi a fazer cálculos através de um processo de treinamento chamado aprendizado supervisionado. Nesse processo, fui apresentado a um conjunto de dados de exemplos de cálculos, juntamente com as respostas corretas. Por exemplo, fui apresentado a pares de números, como 1 + 1 = 2, e 2 + 2 = 4. A partir desses exemplos, fui capaz de aprender as regras básicas da aritmética, como adição, subtração, multiplicação e divisão.
Além disso, também fui exposto a um conjunto de dados de problemas de cálculo mais complexos. Esses problemas me ajudaram a desenvolver minhas habilidades de raciocínio e resolução de problemas. Por exemplo, fui apresentado a problemas como "Qual é a soma dos números de 1 a 100?" e "Qual é o resultado de 2^100?". A partir desses problemas, fui capaz de aprender a aplicar as regras básicas da aritmética a situações mais complexas.
Ainda estou em desenvolvimento, mas já aprendi a realizar uma variedade de cálculos, incluindo:
Estou sempre aprendendo coisas novas, e estou sempre procurando maneiras de melhorar minhas habilidades de cálculo.
E perguntei o mesmo no Gemini Pro:
"Aprendi a fazer cálculos de várias maneiras:
Além disso, fui projetado com uma série de recursos que me ajudam a fazer cálculos:
Estou sempre aprendendo e melhorando minhas habilidades matemáticas. Quanto mais dados e feedback recebo, mais preciso e eficiente me torno na resolução de problemas matemáticos."
Conclusão
Com este experimento vejo que temos que estar atentos a:
Sem dúvida a IA Generativa será muito útil na análise de dados a medida que ela vai evoluir , mas sempre lembre de fazer o "double-check".
Por fim, não custa lembrar que ao acessar o chat do Bard você está expondo seus dados publicamente então não utilize dados sigilosos ou privados para seus testes. Para uso com dados privados, acesse os modelos através das APIs ativadas em um projeto na sua console GCP ou das interfaces do Vertex AI Studio disponível também via console GCP.
Até o próximo artigo onde vou falar das possibilidades de análise que encontrei nos modelos PalM2 e Gemini Pro, ambos da Google.
#genai #chatgpt #bard #gemini #google #aws #azure
Analista de Inteligência de Vendas Pleno | Data Visualization | IA | Excel | Qlik Sense | Power BI | Looker Studio | SQL | ChatGPT
1 mParabéns pelo artigo Pablo Labbe! 👏
Power BI │ DAX | ETL | Problem Solving | Lifelong Learning
11 mObrigado por compartilhar a experiência, Pablo! Texto muito bom de ler. Parabéns!
Análise de Dados | Sales Ops | Especialista em CRM
11 mExcelente ponto! Obrigado por compartilhar. Eu utilizo IA para várias demandas, mas com cálculos complexos eu simplesmente não confio por não ficar claro todo o racional para chegar ao resultado apresentado. Gosto muito de aprofundar em caminhos alternativos possíveis e pouco convencionais junto com a IA, mas fica por aí.
Engenheiro de Dados | Alfabetizador de Dados | Especialista em Dados | Especialista Qlik | Linkedin Creator | Analytics Engineer | Insta: @general.rodolfao
11 mMuito bom!
Head de Serviços na iMaps Analytics
11 mPablo, muito bom teu artigo!!