A Evolução dos LLMs: O Futuro, Desafios e Oportunidades no Ecossistema de IA

A Evolução dos LLMs: O Futuro, Desafios e Oportunidades no Ecossistema de IA

A evolução dos LLMs nos próximos anos - A tecnologia se tornará uma commodity? 🤔

Não passa um único dia sem que alguém anuncie um novo LLM e modelos de base sejam substituídos por modelos de próxima geração em questão de meses.

Então, qual é o futuro dessa tecnologia e como o espaço provavelmente evoluirá?

Vantagem de Dados e Consultas de Informações

Para começar, os LLMs logo se tornarão limitados por dados. Mesmo com um grande número de GPUs, a maioria das empresas não tem acesso a novas e únicas fontes de dados.

Google e Meta Facebook têm uma enorme vantagem aqui em comparação com qualquer outra pessoa. O Google, devido ao seu domínio nas buscas, pode rastrear todos os sites que desejam seu tráfego de busca e usar dados do YouTube e potencialmente do Gmail para treinar seus LLMs. Meta desfruta da mesma vantagem em termos de poder usar dados do Facebook e Instagram.

Isso se traduzirá em LLMs do Google e Meta sendo capazes de atender e responder a consultas de informações gerais melhor do que LLMs da OpenAI ou outras startups.

Já o Bard supera o GPT-4 quando se trata de consultas sobre dados recentes, e o GPT-4 se sai muito melhor em consultas sobre dados disponíveis antes de setembro de 2021 (sua data de corte de treinamento).

LLMs para Tarefas de Propósito Geral

Então a próxima pergunta é: teremos LLMs especializados para algumas tarefas de propósito geral, como codificação, raciocínio, resumo ou escrita? 🤔

Por exemplo, o GPT-4 se sai muito bem em código em comparação com os LLMs do Google, então haverá vários LLMs construídos para um propósito específico?

Isso é improvável para tarefas de propósito geral. Grandes LLMs de última geração superam LLMs especializados na maioria das tarefas. Novamente, o GPT-4 supera LLMs especializados em praticamente tudo, desde a geração de código até tarefas de escrita e raciocínio.

Aqui é importante fazer a distinção entre tarefas de propósito geral, como geração de código Python, versus uma tarefa muito especializada, como ter conhecimento das APIs da Salesforce e programar a plataforma Abacus. O primeiro normalmente NÃO requer ajuste fino ou RAG (geração aumentada por recuperação), enquanto o último requer algum trabalho personalizado.

Tudo isso significa que acabaremos com Google, Meta e potencialmente OpenAI sendo os principais players no mundo dos LLMs voltados para o consumidor (por exemplo, ChatGPT, Bard, etc.).

É extremamente improvável que tenhamos mais de 2-3 desses serviços. Esses serviços, como o ChatGPT, terão um nível gratuito e um nível de assinatura paga. Assinantes pagantes desfrutarão de recursos premium, como respostas personalizadas e acesso a recursos multimodais, etc.

IA Empresarial e APIs de LLM

A outra grande categoria de casos de uso de LLM são empresas usando esses LLMs em seus produtos, serviços e processos de negócios principais.

Existem 2 classes de casos de uso nesse espaço:

  1. Casos de uso de propósito geral incorporados em um produto ou serviço - por exemplo, resumir meu canal Slack ou reunião Zoom. Para esses casos de uso, uma simples chamada de API para um LLM de última geração é suficiente. O preço será a principal consideração nesses casos de uso e, enquanto os grandes provedores de LLM tiverem preços muito competitivos, basta fazer chamadas simples para suas APIs.
  2. Casos de uso especializados em grande escala em bases de conhecimento personalizadas. Esta é a categoria de casos de uso empresariais personalizados, onde você pode ter várias milhares de chamadas por dia e o LLM precisa ter um entendimento de uma base de conhecimento ou tarefa personalizada.

Suspeito que LLMs menores e mais eficientes, que tenham capacidades de raciocínio razoavelmente boas, possam ser ajustados ou complementados com RAG e incorporados ao fluxo de trabalho para automatizar esses casos de uso. Usar o GPT-4 ou algum outro LLM muito grande se tornará proibitivo em termos de custo nesses casos.

As empresas usarão plataformas de operações de LLM como o Abacus para automatizar um fluxo de trabalho de ponta a ponta e essas plataformas oferecerão uma combinação de LLMs de código aberto e APIs de código fechado. As empresas devem ser livres para escolher um LLM com base em custo, desempenho e tempo de mercado.        

Em alguns casos muito específicos, também veremos alguns LLMs muito especializados surgirem - por exemplo, financeLLM ou LegalLLM. Esses LLMs específicos do domínio podem exigir muito treinamento personalizado, RLHF e ajuste fino. Por exemplo, a Bloomberg criou um BloombergGPT, um modelo de linguagem grande de 50 bilhões de parâmetros que foi construído do zero para finanças.

Dito isso, o BloombergGPT provavelmente já está desatualizado, pois esses modelos personalizados carecem de boas habilidades de raciocínio que os LLMs de propósito geral possuem e é muito melhor simplesmente ajustar ou usar RAG em um LLM de última geração em comparação com o treinamento de um modelo personalizado para sua tarefa especial.

Resumindo, estamos vendo o que você esperaria ver em um espaço novo e empolgante - um grande número de empresas está sendo iniciado nesse espaço e, com o tempo, veremos muita consolidação e um punhado de players-chave surgir.

Assim como com outras infraestruturas principais, como sistemas operacionais ou bancos de dados, é provável que haja um ecossistema de código aberto saudável que complemente os serviços dos gigantes.


Qual a sua opnião sobre o futuro dos LLMs? 🤔

Entre para ver ou adicionar um comentário

Outras pessoas também visualizaram

Conferir tópicos