Como a IA Aprende?

Como a IA Aprende?

Já usamos soluções de IA há muitos anos, e prova disso é o nosso uso de redes sociais, tradutores, e outros diversos serviços das big techs. Mas nos últimos meses temos visto uma corrida para entender como aplicar a Inteligência Artificial em praticamente todos as indústrias e profissões. Entender como a IA aprende é importante para mapear os seus usos.

Antes de prosseguirmos, vamos recuperar a definição de IA dada por Arthur Samuel.

O campo de estudo que permite aos computadores terem a habilidade de aprender sem serem explicitamente programados. Arthur Samuel, 1959.

Mas como a IA aprende?

Neste artigo farei um resumo das abordagens de aprendizado em IA. Contamos com três principais estratégias:

  1. Aprendizado Supervisionado
  2. Aprendizado Não Supervisionado
  3. Aprendizado por Reforço 

1. APRENDIZADO SUPERVISIONADO

Nesta abordagem, o modelo aprende recebendo como entrada um conjunto de dados com características definidas. Para cada entrada, um rótulo é fornecido e define a saída esperada.

O modelo deve aprender a mapear as entradas para as saídas esperadas.

Durante o treinamento, o modelo ajusta seus parâmetros internos para minimizar a diferença entre suas previsões e os rótulos que identificam as saídas esperadas.

Após o treinamento, o modelo pode ser usado para fazer previsões em novos dados não rotulados.

Vamos a um exemplo clássico: identificação de imagens de gatos.

Neste exemplo, os dados para treinar o modelo estão em um conjunto de imagens. Para cada imagem, temos um rótulo previamente associados para a saída esperada, que pode ser "É Gato" ou "Não é Gato".

As características de cada imagem de entrada são os pixels da imagem (números em uma matriz).

O modelo, considerando parâmetros internos que inicialmente podem ser aleatórios, aplica funções matemáticas que traduzem o conjunto de pixels em uma saída: "Não é Gato" ou "É Gato".

No processo de treinamento, sempre que o modelo erra a classificação (por exemplo concluindo que "Não é Gato" em uma imagem rotulada como "É Gato"), os parâmetros internos do modelo (pesos e outros valores aplicados nas funções matemáticas) são ligeiramente modificados para que o mapeamento se aproxime da resposta esperada.

Os parâmetros são ajustados a cada passo do treinamento e, após um grande número de interações, o modelo passa a ter assertividade e classificar corretamente a imagem.

Ou seja, as funções matemáticas têm seus parâmetros ajustados de tal forma que dada uma entrada, a saída está de acordo com o rótulo de saída esperada.

Uma vez que o modelo está ajustado (treinado), pode ser usado para que reconheça e classifique novas imagens, não utilizadas no treinamento. Ou seja, temos uma IA que aprendeu a reconhecer imagens de gatos.

Vejam que o treinamento é feito com informações rotuladas, ou seja, fornecemos o resultado que esperamos para cada entrada. E daí o nome Aprendizado Supervisionado.

Uma IA treinada com um número suficientemente grande de dados pode superar a capacidade humana em uma determinada tarefa, como já aconteceu para a capacidade de reconhecimento de imagens.

Exemplos de aplicações:

  • Reconhecimento de padrões em imagens.
  • Identificar se o perfil de tráfego na rede configura um ataque hacker.
  • Decidir se dado um perfil de cliente deve ter crédito autorizado.
  • Concluir, com base nas últimas ações, um cliente está prestes a deixar a empresa (churn).
  • Concluir, com base nos comentários do cliente no site da empresa, se ele está satisfeito.

2. APRENDIZADO NÃO SUPERVISIONADO

A IA também pode nos ajudar a entender a informação através de insights, nos ajudando a entender padrões nos dados que ainda não entendemos, e podem nos ajudar a tomar decisões.

Aqui entra o aprendizado não supervisionado.

O modelo é treinado com dados de entrada não rotulados, ou seja, não informamos ao modelo o que esperamos da avaliação.

Por exemplo, digamos que queremos descobrir perfis de consumo de clientes, e temos dados do comportamento de compra de milhares de clientes em diversos canais. Ao passar estes dados para um modelo de aprendizado não supervisionado, as interações podem encontrar padrões estatísticos tais como grupos de clientes (clusters) com base em características similares e outras relações entre suas características.

Podemos descobrir que clientes compram fraldas, também costumam comprar cerveja. Através de aplicações estatísticas sobre os dados, a IA aprendeu que esta é uma relação objetiva.

Cabe ao usuário, ou processos automatizados, tomar decisões sobre os insights gerados.

3. APRENDIZADO POR REFORÇO 

Aqui a chave para o treinamento e aprendizagem está no mecanismo de retorno (feedback) negativo ou positivo para uma determinada decisão do modelo. Para entender, vamos a um exemplo de treinamento de robô autônomo.

Em um cenário em que um robô autônomo precisa navegar em um ambiente desconhecido, evitando obstáculos e alcançando um destino específico podemos usar o aprendizado por reforço.

O robô pode ser treinado para aprender a executar ações de movimento e receber recompensas positivas quando chegar ao destino, e recompensas negativas quando colidir com obstáculos. Com o tempo, o robô aprende a navegar de forma mais eficiente e segura no ambiente.

Nesse tipo de abordagem, o modelo aprende a tomar decisões sequenciais em um ambiente dinâmico com o objetivo de maximizar uma recompensa acumulada ao longo do tempo. O robô interage com o ambiente, observando estados e realizando ações, recebendo feedback positivo ou negativo em resposta a suas ações. O aprendizado por reforço requer um sistema de recompensas para indicar o desempenho em uma tarefa.

Conclusão

A IA tem formas distintas para aprender, que estão associadas a diferentes perfis de casos de uso. Um modelo treinado pode ser utilizado desde a automação de processos operacionais, passando pela avaliação de cenários e indo até as decisões estratégicas orientadas a dados.

A qualidade da IA está associada à qualidade e quantidade de dados disponíveis. Não é sem razão que já se fala há muito tempo que os dados são novo petróleo.

Bem, esta é uma visão básica das abordagens de aprendizagem de máquina.

Tratarei de outras perspectivas da IA em futuros artigos.

Francisco Moreira

IT Digital Leader @ SKY | Ajudo líderes de TI a transformarem seus resultados enquanto se tornam mais estratégicos | Agilista Pragmático | Consultor | Mentor

1 a

Ótimo texto Rodrigo. Visto que aprender não necessariamente significa melhorar nesse caso, como você mesmo mencionou nos seus parágrafos finais, a qualidade dos dados é findamental para evitar as alucinações.

Entre para ver ou adicionar um comentário

Outros artigos de Rodrigo Carvalho dos Santos

  • Comece pelo Time.

    Comece pelo Time.

    Há força na união. - Lieutenant Uhura.

    10 comentários
  • Alta Performance!

    Alta Performance!

    O século XX forjou a investigação consciente de práticas organizacionais, desde Taylor e sua administração científica…

    7 comentários
  • O Caminho Startup

    O Caminho Startup

    O sucesso das startups unicórnios, aquelas que ultrapassam o valor de mercado de US$ 1 bilhão, acendeu sinal de alerta…

    11 comentários
  • Abordagem Ágil para Condução de Iniciativas

    Abordagem Ágil para Condução de Iniciativas

    Algumas Palavras sobre Agilidade Um Boeing 747 voa a 900 Km/h, e um pequeno Embraer “Tucano” usado para acrobacias da…

    15 comentários
  • Bitcoin, Blockchain e a revolução da confiança

    Bitcoin, Blockchain e a revolução da confiança

    O surgimento do Bitcoin inaugurou uma revolução. Pela primeira vez contamos com um ativo digital, com característica de…

Outras pessoas também visualizaram

Conferir tópicos