📚 Continue Lendo
Mais artigos do nosso blog

A indústria da inteligência artificial (IA) tem focado intensamente no desenvolvimento de agentes de IA. Estes sistemas visam ir além dos chatbots, executando tarefas de forma confiável no mundo real. No entanto, a confiabilidade ainda é um desafio significativo para os agentes atuais.
Grandes esforços estão sendo feitos para superar essa limitação. David Luan, chefe do laboratório de pesquisa de IAG (Inteligência Artificial Geral) da Amazon, lidera uma dessas iniciativas. Luan possui uma trajetória notável na IA, tendo sido um dos primeiros líderes de pesquisa na OpenAI, onde contribuiu para o desenvolvimento de modelos como GPT-2, GPT-3 e DALL-E.
Após sua passagem pela OpenAI, Luan cofundou a Adept, um laboratório de pesquisa de IA focado em agentes. No verão passado, ele se juntou à Amazon para liderar o laboratório de IAG da empresa em São Francisco. O trabalho de sua equipe é uma prioridade para a Amazon.
A decisão de Luan de deixar a Adept para a Amazon foi um dos primeiros exemplos de um modelo de acordo que se tornou comum no setor de tecnologia, onde grandes empresas de tecnologia contratam equipes técnicas de startups de IA. Luan afirmou que sua mudança para a Amazon se deu por sua percepção sobre a direção da corrida da IA.
A Trajetória em IA de David Luan
David Luan descreve sua experiência no campo da IA como relativamente longa, considerando a juventude do setor. Ele começou a trabalhar com IA há cerca de 15 anos, motivado pela oportunidade de construir sistemas capazes de pensar como humanos e, idealmente, superar o desempenho humano.
De 2017 a meados de 2020, Luan liderou as equipes de pesquisa e engenharia na OpenAI. Durante esse período, foram desenvolvidos modelos como GPT-2, GPT-3, CLIP e DALL-E. Ele descreve essa fase como um período de experimentação e diversão, sem a pressão atual do mercado.
Posteriormente, Luan liderou o esforço de LLM (Modelo de Linguagem Grande) no Google, onde a equipe treinou o modelo PaLM. Pouco depois, ele e sua equipe fundaram a Adept, a primeira startup focada em agentes de IA. A Adept foi pioneira na criação de agentes de uso de computador, desenvolvendo o primeiro agente pronto para produção. A Amazon, então, integrou a equipe da Adept para trabalhar em agentes há aproximadamente um ano.
A Evolução dos Modelos de IA e a Hipótese da Representação Platônica
Luan comentou sobre o lançamento do GPT-5 da OpenAI, destacando a maturidade alcançada pelos laboratórios de ponta. Ele enfatiza que o objetivo de um laboratório de modelos de fronteira não é apenas treinar modelos, mas construir uma “fábrica” que produza repetidamente modelos cada vez melhores.
Um ponto de interesse para Luan é a convergência de capacidades entre os modelos de ponta. Ele cita a “hipótese da representação platônica”, proposta por Phillip Isola, um ex-colega da OpenAI. Essa hipótese sugere que, assim como na alegoria da caverna de Platão, existe uma única realidade, e os LLMs, ao serem treinados com mais e mais dados, convergem para representar esse modelo de mundo compartilhado.
Luan observa que os benchmarks tradicionais estão perdendo relevância, pois os modelos estão se tornando cada vez mais semelhantes em suas capacidades. Ele compara a situação à “guerra dos megapixels” da era das câmeras digitais, onde números altos não garantiam a qualidade real da foto. Para Luan, a falta de criatividade no campo da IA reside na fixação em chatbots e código, quando a IAG abrange muito mais.
Ele argumenta que o foco deveria estar em aplicações mais úteis e capacidades de modelos base que ainda não foram bem medidas. A questão central, para ele, é: “O que devo realmente buscar? Por que estou gastando mais tempo para tornar este modelo ligeiramente melhor em escrita criativa ou em olimpíadas de matemática, quando há muito mais a ser feito?”
A Visão da Amazon para IAG e Agentes
A definição de IAG de Luan evoluiu. Na OpenAI, a IAG era vista como um sistema capaz de superar humanos em tarefas economicamente valiosas. Atualmente, sua visão é construir um “companheiro universal para cada trabalhador do conhecimento”.
Para Luan, o objetivo é criar sistemas de IA que possam assumir uma grande parte da execução das tarefas diárias, liberando o tempo dos humanos. Sua definição de IAG, que ele considera mais prática, é um modelo que pode ajudar um humano a fazer qualquer coisa que deseje em um computador. Ele contrasta isso com a ideia de IAG como um modelo que pode se autoaprimorar, argumentando que a utilidade para o usuário é o que realmente importa.
Para a Amazon, a IAG e os agentes são fundamentais para o futuro da computação. Luan explica que os blocos de construção da computação estão mudando: o código é escrito por IA, e a inteligência e a tomada de decisões serão feitas por IA. Nesse cenário, os agentes se tornarão os blocos de construção atômicos da computação, desbloqueando um valor econômico significativo e alinhando-se com as forças existentes da Amazon em nuvem e infraestrutura.
O Desafio e o Treinamento de Agentes
Luan reconhece que a maioria das pessoas ainda não usou um agente de IA ou teve uma experiência insatisfatória. Ele diferencia a promessa real dos agentes da percepção atual, que muitas vezes os vê como “apenas um chatbot com etapas extras”.
Ele exemplifica a promessa de um agente com uma tarefa de descoberta de medicamentos. Enquanto um chatbot pode fornecer pesquisa científica, um agente real seria capaz de se conectar a um laboratório, usar equipamentos científicos, propor e executar experimentos, analisar resultados e iterar até atingir o objetivo. Esse nível de alavancagem é muito superior ao que o campo oferece atualmente.
A limitação inerente dos LLMs, como a alucinação e a “mentira confiante”, levanta preocupações sobre sua aplicação em tarefas do mundo real, como interagir com contas bancárias ou operar em um laboratório. Luan afirma que os LLMs, treinados principalmente por previsão de próximo token (clonagem comportamental), aprendem o “o quê”, mas não o “porquê” das ações.
Para que os agentes se tornem tomadores de decisão eficazes, eles precisam aprender o mecanismo causal real: “se eu faço X, a consequência é Y”. A solução, segundo Luan, não é mais clonagem comportamental, mas sim tentativa e erro no mundo real. A equipe de Luan na Amazon está focada em autoaprendizagem em larga escala, uma técnica popularizada pela DeepMind ao vencer humanos no Go.
Nesse método, o modelo joga contra si mesmo em ambientes simulados, recebendo recompensas por estratégias que superam versões anteriores. A Amazon está criando um vasto conjunto de “ginásios” de aprendizagem por reforço (AR), cada um simulando um ambiente de trabalho do conhecimento (como Salesforce, programas de CAD, sistemas de prontuários médicos eletrônicos, softwares de contabilidade). Nesses simuladores, o modelo propõe e tenta resolver problemas, aprendendo as consequências de suas ações. Luan acredita que essa é uma das grandes peças que faltam para a IAG real.
A Aplicação Interna e Externa de Agentes na Amazon
A abordagem da Amazon para o treinamento de agentes é considerada única na indústria. Luan afirma que, embora outros laboratórios possam estar explorando caminhos semelhantes, a Amazon, com sua origem na Adept, tem um foco mais intenso e progresso significativo nesse problema. A escassez de dados abertos úteis para treinar agentes reforça a necessidade de ambientes controlados e dados privados.
O objetivo final é um modelo e sistema que seja 99% confiável em todos os tipos de tarefas valiosas de trabalho do conhecimento realizadas em um computador. Isso será oferecido como um serviço na AWS, servindo de base para inúmeras aplicações futuras.
Luan também aborda a questão da interface. Ele considera os chatbots atuais como uma interface de baixa largura de banda para a execução de ações. A visão é uma “interação paralela”, onde o usuário e a IA compartilham uma “tela colaborativa” para trabalhar juntos, como um companheiro universal ou assistente pessoal.
A equipe de Luan opera com considerável independência dentro da Amazon, o que permite agilidade. No entanto, a tecnologia desenvolvida é contribuída para o modelo fundamental Nova da Amazon. Um exemplo de aplicação é o Alexa Plus, que utiliza a tecnologia da equipe de Luan para tarefas como encontrar um encanador, operando um navegador remoto como um humano faria. Embora o Alexa Plus ainda esteja em fase inicial e com momentos de fragilidade, ele serve como um “ginásio em escala” para o sistema aprender e se tornar mais confiável, dada a vasta base de usuários da Alexa.
Além do Alexa Plus, a Amazon utiliza agentes internamente em diversas operações. A empresa possui equipes internas que representam quase todos os domínios úteis de trabalho do conhecimento de empresas da Fortune 500. Isso permite que a Amazon colete dados de fluxo de trabalho confiáveis em ambientes privados, essenciais para o treinamento de agentes mais inteligentes.
A Amazon lançou o Nova Act, uma prévia de pesquisa em março, que permite construir agentes que usam navegadores de forma confiável. Empresas e desenvolvedores estão utilizando o Nova Act, alcançando mais de 95% de confiabilidade em fluxos de trabalho complexos, como registros de médicos e enfermeiros, automação de reservas de viagens e fluxos de trabalho de controle de qualidade com 93 etapas. Luan prevê que o “momento GPT para agentes de AR” está a menos de um ano de distância, impulsionado pela autoaprendizagem em larga escala.
O Mercado de Talentos em IA e o Futuro da Pesquisa
Luan aborda a dinâmica do mercado de talentos em IA e o fenômeno da “aquisição reversa de talentos”, onde equipes técnicas de startups se juntam a grandes empresas. Ele explica que a demanda por inteligência supera em muito a oferta, tornando racional o investimento massivo em clusters de computação e talentos para impulsionar o desenvolvimento de modelos.
Sua decisão de se juntar à Amazon foi motivada pela compreensão da empresa sobre a importância de vencer no lado dos agentes e pelo acesso à escala de computação necessária. Ele previu a consolidação e o aumento dos custos de computação e talento, que hoje superam 340 bilhões de dólares em despesas de capital apenas para os principais provedores de hiperescala.
Luan afirma que, para estar na fronteira da inteligência, é preciso estar na fronteira da computação. Ele não tinha interesse em transformar a Adept em uma empresa de software empresarial que vendesse modelos menores ou implantasse agentes sobre modelos de terceiros. Seu objetivo é resolver os problemas de pesquisa cruciais para a IAG, o que exige clusters de bilhões de dólares.
Sobre o impacto desses acordos na comunidade de pesquisa e startups, Luan destaca que o fundador tem um papel importante em cuidar da equipe. Ele observa que o mercado de talentos em IA é pequeno, com poucas pessoas com muita experiência. Ele estima que o número de pessoas em quem confiaria uma grande quantia de computação para treinar um modelo de fronteira é inferior a 150, com talvez mais 500 contribuidores valiosos.
Apesar do grupo de elite ser pequeno, Luan acredita que o campo se expandirá. Ele ressalta que, ao contrário da engenharia de software tradicional, o treinamento de modelos fundamentais é um processo onde cada decisão interfere nas outras, resultando em uma “deseconomia de escala”. Isso significa que o número de pessoas que terão um assento à mesa nos esforços mais bem financiados será limitado, embora o número de pessoas capazes de fazer um trabalho significativo aumente.
Para quem busca uma carreira em IA, Luan aconselha procurar equipes pequenas com grande capacidade computacional, onde haja oportunidade de executar ideias de pesquisa. Ele também enfatiza a importância da codesign do produto, da interface do usuário e do modelo. Ele sugere evitar focar apenas em chatbots ou assistentes de codificação, que são os primeiros fatores de forma de produto com ajuste ao mercado, e buscar os próximos fatores de forma cruciais que se tornarão óbvios em retrospectiva.
Para seguir a cobertura, veja também betting.
Recomendo
🔗 Links Úteis
Recursos externos recomendados