A Evolução dos LLMs: O Futuro, Desafios e Oportunidades no Ecossistema de IA
A evolução dos LLMs nos próximos anos - A tecnologia se tornará uma commodity? 🤔
Não passa um único dia sem que alguém anuncie um novo LLM e modelos de base sejam substituídos por modelos de próxima geração em questão de meses.
Então, qual é o futuro dessa tecnologia e como o espaço provavelmente evoluirá?
Vantagem de Dados e Consultas de Informações
Para começar, os LLMs logo se tornarão limitados por dados. Mesmo com um grande número de GPUs, a maioria das empresas não tem acesso a novas e únicas fontes de dados.
Google e Meta Facebook têm uma enorme vantagem aqui em comparação com qualquer outra pessoa. O Google, devido ao seu domínio nas buscas, pode rastrear todos os sites que desejam seu tráfego de busca e usar dados do YouTube e potencialmente do Gmail para treinar seus LLMs. Meta desfruta da mesma vantagem em termos de poder usar dados do Facebook e Instagram.
Isso se traduzirá em LLMs do Google e Meta sendo capazes de atender e responder a consultas de informações gerais melhor do que LLMs da OpenAI ou outras startups.
Já o Bard supera o GPT-4 quando se trata de consultas sobre dados recentes, e o GPT-4 se sai muito melhor em consultas sobre dados disponíveis antes de setembro de 2021 (sua data de corte de treinamento).
LLMs para Tarefas de Propósito Geral
Então a próxima pergunta é: teremos LLMs especializados para algumas tarefas de propósito geral, como codificação, raciocínio, resumo ou escrita? 🤔
Por exemplo, o GPT-4 se sai muito bem em código em comparação com os LLMs do Google, então haverá vários LLMs construídos para um propósito específico?
Isso é improvável para tarefas de propósito geral. Grandes LLMs de última geração superam LLMs especializados na maioria das tarefas. Novamente, o GPT-4 supera LLMs especializados em praticamente tudo, desde a geração de código até tarefas de escrita e raciocínio.
Aqui é importante fazer a distinção entre tarefas de propósito geral, como geração de código Python, versus uma tarefa muito especializada, como ter conhecimento das APIs da Salesforce e programar a plataforma Abacus. O primeiro normalmente NÃO requer ajuste fino ou RAG (geração aumentada por recuperação), enquanto o último requer algum trabalho personalizado.
Tudo isso significa que acabaremos com Google, Meta e potencialmente OpenAI sendo os principais players no mundo dos LLMs voltados para o consumidor (por exemplo, ChatGPT, Bard, etc.).
Recomendados pelo LinkedIn
É extremamente improvável que tenhamos mais de 2-3 desses serviços. Esses serviços, como o ChatGPT, terão um nível gratuito e um nível de assinatura paga. Assinantes pagantes desfrutarão de recursos premium, como respostas personalizadas e acesso a recursos multimodais, etc.
IA Empresarial e APIs de LLM
A outra grande categoria de casos de uso de LLM são empresas usando esses LLMs em seus produtos, serviços e processos de negócios principais.
Existem 2 classes de casos de uso nesse espaço:
Suspeito que LLMs menores e mais eficientes, que tenham capacidades de raciocínio razoavelmente boas, possam ser ajustados ou complementados com RAG e incorporados ao fluxo de trabalho para automatizar esses casos de uso. Usar o GPT-4 ou algum outro LLM muito grande se tornará proibitivo em termos de custo nesses casos.
As empresas usarão plataformas de operações de LLM como o Abacus para automatizar um fluxo de trabalho de ponta a ponta e essas plataformas oferecerão uma combinação de LLMs de código aberto e APIs de código fechado. As empresas devem ser livres para escolher um LLM com base em custo, desempenho e tempo de mercado.
Em alguns casos muito específicos, também veremos alguns LLMs muito especializados surgirem - por exemplo, financeLLM ou LegalLLM. Esses LLMs específicos do domínio podem exigir muito treinamento personalizado, RLHF e ajuste fino. Por exemplo, a Bloomberg criou um BloombergGPT, um modelo de linguagem grande de 50 bilhões de parâmetros que foi construído do zero para finanças.
Dito isso, o BloombergGPT provavelmente já está desatualizado, pois esses modelos personalizados carecem de boas habilidades de raciocínio que os LLMs de propósito geral possuem e é muito melhor simplesmente ajustar ou usar RAG em um LLM de última geração em comparação com o treinamento de um modelo personalizado para sua tarefa especial.
Resumindo, estamos vendo o que você esperaria ver em um espaço novo e empolgante - um grande número de empresas está sendo iniciado nesse espaço e, com o tempo, veremos muita consolidação e um punhado de players-chave surgir.
Assim como com outras infraestruturas principais, como sistemas operacionais ou bancos de dados, é provável que haja um ecossistema de código aberto saudável que complemente os serviços dos gigantes.
Qual a sua opnião sobre o futuro dos LLMs? 🤔