Afinal, o que é machine learning?
Essa forma abrangente e poderosa de inteligência artificial está mudando todos os setores. Hoje vamos falar o que você precisa saber sobre o potencial e as limitações atuais do aprendizado de máquina e como ela está sendo usada.
O machine learning está por trás dos chatbots, análises preditivas, aplicativos de tradução, as séries que a Netflix sugere para você e como as postagens são apresentadas no seu feed. Ele está no centro dos veículos autônomos e até de programas que podem diagnosticar condições médicas com base em imagens.
Quando as empresas hoje implantam programas de inteligência artificial, é mais provável que usem o aprendizado de máquina — tanto que os termos costumam ser confundidos e, às vezes, de forma ambígua. O aprendizado de máquina (machine learning) é um subcampo da inteligência artificial que dá aos computadores a capacidade de aprender sem serem programados explicitamente.
Com o crescimento do machine learning, a tendência é que no curto prazo todos os profissionais irão ter que interagir em certo nível com ele e precisarão de algum conhecimento prático sobre esse campo. Uma pesquisa da Deloitte em 2020 descobriu que 67% das empresas estão usando o aprendizado de máquina e 97% estão usando ou planejando usá-lo no próximo ano.
Da manufatura ao varejo e de bancos a padarias, até mesmo empresas mais tradicionais já consolidadas no mercado estão usando o aprendizado de máquina para desbravar novas possibilidades ou aumentar a eficiência.
Embora nem todos precisem saber os detalhes técnicos, eles devem entender o que a tecnologia faz e o que pode e não pode fazer, o que não pode acontecer é você não ter ciência do que está acontecendo. Isso inclui estar ciente das implicações sociais e éticas do machine learning. É muito importante se envolver e começar a entender quais as ferramentas da sua área profissional e, então, pensar em como você vai usá-las.
O que é aprendizado de máquina?
O aprendizado de máquina é um subcampo da inteligência artificial, que pode ser definido, de forma simples, como a capacidade de uma máquina de imitar o comportamento humano de aprendizado. Os sistemas de inteligência artificial são usados para realizar tarefas complexas de maneira semelhante à maneira como os humanos resolvem problemas, porém com uma capacidade de processamento e uma velocidade muito maior.
O objetivo da IA é criar modelos computacionais que exibam “comportamentos inteligentes”. Isso significa máquinas que podem reconhecer uma cena, entender um texto escrito ou realizar uma ação no mundo físico.
O aprendizado de máquina é uma maneira de usar IA que foi definido na década de 1950 pelo pioneiro da IA, Arthur Samuel, como “o campo de estudo que dá aos computadores a capacidade de aprender sem serem explicitamente programados”.
Em alguns casos, escrever um programa para ser seguido pela máquina é demorado ou impossível. Por exemplo: treinar um computador para reconhecer fotos de pessoas diferentes. Embora os humanos possam fazer essa tarefa facilmente, é difícil dizer a um computador como fazê-lo. O aprendizado de máquina usa a abordagem de permitir que os computadores aprendam a se programar por meio da experiência.
O aprendizado de máquina começa com dados — números, fotos ou texto, como transações bancárias, imagens de pessoas ou até mesmo itens de padaria, ordens de serviços, dados de séries temporais ou relatórios de vendas. Os dados são coletados e preparados para serem usados como dados de treinamento ou as informações nas quais o modelo de aprendizado de máquina será treinado. Quanto mais dados, melhor é o programa.
A partir daí, os programadores escolhem um modelo de aprendizado de máquina para usar, fornecem os dados e permitem que o computador se treine para encontrar padrões ou fazer previsões. Com o tempo, o programador humano também pode ajustar o modelo, incluindo a alteração de seus parâmetros, para ajudar a levá-lo a resultados mais precisos.
Alguns dados são retirados dos dados de treinamento para serem usados como dados de avaliação, atestando a precisão do modelo de aprendizado de máquina quando novos dados são mostrados. O resultado é um modelo que pode ser usado no futuro com diferentes conjuntos de dados.
Atualmente, o machine learning tem três funções básicas:
- descritiva: o sistema usa os dados para explicar o que aconteceu;
- preditivo: o sistema usa os dados para prever o que acontecerá; ou
- prescritivo: o sistema usará os dados para fazer sugestões sobre quais ações tomar.
Ainda existem três subcategorias de aprendizado de máquina:
- Os modelos de aprendizado de máquina supervisionados são treinados com conjuntos de dados rotulados, o que permite que os modelos aprendam e se tornem mais precisos ao longo do tempo. Por exemplo: um algoritmo seria treinado com imagens de cães e outras coisas, todas marcadas por humanos, e a máquina aprenderia maneiras de identificar imagens de cães por conta própria. O aprendizado de máquina supervisionado é o tipo mais comum usado atualmente.
- No aprendizado de máquina não supervisionado, um programa procura padrões em dados não rotulados. O aprendizado de máquina não supervisionado pode encontrar padrões ou tendências que as pessoas não procurariam explicitamente. Por exemplo, um programa de aprendizado de máquina não supervisionado pode examinar os dados de vendas online e identificar diferentes tipos de clientes e padrões de compra que não tão óbvias nem para o desenvolvedor e nem para a empresa.
- O aprendizado de máquina por reforço treina as máquinas por meio de tentativa e erro para realizar a melhor ação, estabelecendo um sistema de recompensa. O aprendizado por reforço pode treinar modelos para jogar ou treinar veículos autônomos para dirigir, informando à máquina quando ela tomou as decisões certas, o que a ajuda a aprender com o tempo quais ações devem ser executadas.
Em alguns casos, o aprendizado de máquina pode obter insights ou automatizar a tomada de decisões em casos em que os humanos não seriam capazes. Pode não apenas ser mais eficiente e menos caro ter um algoritmo para fazer isso, mas às vezes os humanos literalmente não são capazes de fazer isso.
A busca do Google é um exemplo de algo que os humanos podem fazer, mas nunca na escala e velocidade com que os modelos do Google são capazes de mostrar respostas potenciais toda vez que uma pessoa digita uma consulta. A questão aqui não é de computadores que assumindo trabalhos humanos. São computadores fazendo coisas que não seriam viáveis se tivessem que ser feitas por humanos.
Gostou do assunto? Então vamos nos aprofundar mais um pouco. O machine learning também está associado a vários outros subcampos de inteligência artificial:
Processamento de Linguagem Natural
O processamento de linguagem natural é um campo de aprendizado de máquina no qual as máquinas aprendem a entender a linguagem natural falada e escrita por humanos, em vez dos dados e números normalmente usados na programação. Isso permite que as máquinas reconheçam, entendam e respondam a linguagem, bem como criem novos textos e traduzam entre as línguas. O processamento de linguagem natural permitiu tecnologias que com certeza você conhece, como: chatbots, Google Assistente, Siri ou Alexa.
Redes Neurais
As redes neurais são uma classe específica de algoritmos de aprendizado de máquina comumente usada. As redes neurais artificiais são modeladas com base no cérebro humano, no qual milhões de nós de processamento estão interconectados e organizados em camadas.
Em uma rede neural artificial, células ou nós são conectados, onde cada célula processa as entradas (inputs) e produz uma saída (output) que é enviada a outros neurônios. Os dados rotulados se movem pelos nós, ou células, com cada célula executando uma função diferente.
Por exemplo, em uma rede neural treinada para identificar se uma imagem contém um gato ou não, os diferentes nós avaliam as informações: um nó checa se tem focinho de gato, outra se tem orelha de gato, outra se tem calda de gato, outra se tem o porte de um gato, e assim por diante, até chegam a uma saída final que indica se uma imagem apresenta um gato.
Deep Learning
As redes de aprendizagem profunda (deep learning) são redes neurais com muitas camadas. A rede em camadas pode processar grandes quantidades de dados e determinar o “peso” de cada conexão na rede — vamos manter o exemplo anterior, um sistema de reconhecimento de imagem, algumas camadas da rede neural podem detectar características individuais de um gato, como olhos, focinho, ou orelhas, enquanto outra camada seria capaz de dizer se essas características aparecem de uma forma que indica um gato.
Como as redes neurais, o aprendizado profundo é modelado na forma como o cérebro humano funciona e aciona muitos usos de aprendizado de máquina, como veículos autônomos, chatbots e diagnósticos médicos.
O deep learning requer muito poder computacional, o que levanta preocupações sobre sua sustentabilidade.
Como as empresas estão usando o aprendizado de machine learning
O machine learning é o núcleo dos modelos de negócios de algumas empresas, como no caso do algoritmo de sugestões da Netflix ou do mecanismo de pesquisa do Google. Outras empresas estão se envolvendo profundamente com o aprendizado de máquina, embora não seja sua principal proposta de negócio.
Outros ainda estão tentando determinar como usar o machine learning antes dos seus concorrentes. Essa é, na minha opinião, um dos problemas mais difíceis no machine learning: descobrir quais problemas posso resolver com o aprendizado de máquina.
Nenhuma ocupação deixará de ser afetada pelo machine learning, algumas mais, outras menos, mas é provável que nenhuma ocupação seja completamente assumida por ele. O sucesso do aprendizado de máquina é reorganizar as tarefas em subtarefas, algumas que podem ser feitas por inteligência artificial e outras que requerem um ser humano.
As empresas já estão usando o aprendizado de máquina de várias maneiras, incluindo:
- Algoritmos de recomendação. Os mecanismos de recomendação por trás das sugestões do Netflix e do YouTube, quais informações aparecem no feed do Facebook e as recomendações de produtos da Amazon são alimentados pelo machine learning. Os algoritmos estão aprendendo sobre nossas preferências. Eles aprendem, como no Instagram, quais postagens queremos que eles nos mostrem, quais anúncios exibir ou conteúdo quem mais nos interessa.
- Análise de imagens e detecção de objetos. O machine learning pode analisar imagens em busca de informações diferentes, como aprender a identificar as pessoas e diferenciá-las . Os usos comerciais variam. Por exemplo, usar o machine learning para analisar placas de carros nos estacionamentos, seja para sistemas de segurança, ou entender padrões comportamentais de indivíduos.
- Detecção de fraude. As máquinas podem analisar padrões, como: como alguém normalmente gasta ou onde normalmente compra, para identificar transações de cartão de crédito potencialmente fraudulentas, tentativas de login ou e-mails de spam.
- Helplines automáticos ou chatbots. Muitas empresas ja possuem chatbots online, nos quais os clientes não falam com humanos, mas sim interagem com uma máquina. Esses algoritmos usam machine learning e processamento de linguagem natural, com os bots aprendendo a partir de registros de conversas anteriores para chegar às respostas adequadas.
- Carros autônomos. Grande parte da tecnologia por trás dos carros autônomos é baseada no aprendizado de máquina, em particular no deep learning.
- Imagens e diagnósticos médicos. Os programas de aprendizado de máquina podem ser treinados para examinar imagens médicas ou outras informações e procurar determinados marcadores de doenças, como uma ferramenta que pode prever o risco de câncer com base em uma mamografia.
Principais desafios do machine learning
Embora o machine learning já esteja transformando a tecnologia que pode revolucionar os processos ou abrir novas possibilidades para as empresas, há várias coisas que os empresários devem saber sobre o aprendizado de máquina e seus limites.
Explicabilidade
Uma preocupação, e também a mais óbvia, é a “explicabilidade”, ou a capacidade de ser claro sobre o que os modelos de machine learning estão fazendo e como tomam decisões. Se qualquer processo de mudança já é difícil, imagine quando os colaboradores não entendem nada sobre a tecnologia que está sendo empregada e começam a sabotar os processos. Entender por que um modelo faz o que faz é uma questão muito difícil mas é necessário. Até porque os sistemas podem ser enganados e prejudicados, ou simplesmente falhar em certas tarefas, mesmo aqueles que humanos podem executar facilmente. Por exemplo, alterar os metadados em imagens pode confundir os computadores — com ajustes errados, uma máquina identifica a imagem de um cachorro como um passarinho.
Outro exemplo: um algoritmo de diagnóstico por imagens de raios X parecia ter desempenho superior ao dos médicos. Mas descobriu-se que o algoritmo estava correlacionando os resultados com as máquinas que capturaram a imagem, não necessariamente a imagem em si. A tuberculose é mais comum em países em desenvolvimento, que tendem a ter máquinas mais antigas. O programa correlacionou que, se o raio-X fosse feito em uma máquina mais antiga, o paciente teria maior probabilidade de ter tuberculose. Ele realizou a tarefa, mas não da maneira útil.
Viés e resultados não intencionais
As máquinas são treinadas por humanos e os preconceitos humanos podem ser incorporados a algoritmos — se informações tendenciosas, ou dados que refletem as desigualdades existentes, forem alimentados em um programa, ele aprenderá a replicá-lo e perpetuar as formas de discriminação. Os chatbots treinados em como as pessoas conversam no Twitter podem aprender uma linguagem ofensiva e racista, por exemplo.
Em alguns casos, os modelos de machine learning criam ou intensificam problemas sociais. Por exemplo, o Facebook, no grande escandalo da Cambridge Analytica usou o machine learning como uma ferramenta para mostrar aos usuários de forma intensiva anúncios e conteúdos que os interessavam politicamente — o que levou à polarização e à disseminação de teorias da conspiração principalmente sobre aquelas pessoas que tendem a ser massa de manobra.
Implementando o machine learning
Os executivos tendem a ter dificuldade para entender onde o machine learning pode realmente agregar valor à empresa. O que é enigmático para uma empresa é fundamental para outra, e as empresas devem evitar tendências e encontrar o que realmente funcione para elas.
A forma como o machine learning funciona para a Amazon provavelmente não vai se traduzir em uma empresa de automóveis. Embora a Amazon tenha obtido sucesso com assistentes de voz e alto-falantes operados por voz, isso não significa que as montadoras devam priorizar a adição de alto-falantes aos carros. É mais provável, que a montadora encontre uma maneira de usar o machine learning na linha de produção das fabricas para reduzir custos.
Também é melhor evitar usa o machine learning como uma solução para um problema que não existe. Em vez de começar com o foco na tecnologia, as empresas devem começar com o foco em um problema de negócios ou necessidade do cliente que pode ser atendido com aprendizado de máquina.
Uma compreensão básica do aprendizado de máquina é importante, mas encontrar o uso correto depende de pessoas com diferentes conhecimentos trabalhando juntas.