Ícone do site Jornal O Sul

Startups do Vale do Silício criam réplicas dos sites para treinar agentes de IA

Foco é transformar bots em agentes de inteligência articifial que possam, no futuro, substituir trabalhadores. (Foto: The New York Times)

No último verão no Hemisfério Norte, advogados da United Airlines perceberam que alguém havia criado uma réplica quase perfeita do site da empresa. Esse clone digital oferecia os mesmos botões e menus para reservar voos, hotéis e carros. Incluía os mesmos links azuis para acompanhar milhas de passageiro frequente e explorar ofertas com desconto. Chegava até a usar o nome e o logotipo da United.

Então, os advogados da companhia aérea enviaram um aviso formal exigindo a remoção do site, acusando-o de violar direitos autorais.

Div Garg, cuja pequena empresa construiu o site réplica, prontamente mudou o nome para “Fly Unified” e removeu o logotipo da United. Ele não estava interessado em infringir os direitos autorais da empresa. Ele e sua equipe construíram a réplica do United.com como um campo de treinamento para inteligência artificial.

A empresa de Garg, AGI, está entre várias startups do Vale do Silício que passaram os últimos meses recriando sites populares para que sistemas de IA possam aprender a navegar na internet e realizar tarefas específicas por conta própria, como reservar voos. Se um sistema de IA aprende a usar uma réplica do United.com, ele também consegue usar o site real.

Esses novos “sites-sombra” são uma parte significativa dos esforços da indústria de tecnologia para transformar os chatbots atuais em agentes de IA – sistemas projetados para reservar viagens, agendar reuniões, criar gráficos de barras e realizar outras tarefas computacionais.

Nos próximos anos, muitas empresas acreditam que esses agentes de IA se tornarão cada vez mais sofisticados e poderão substituir alguns trabalhadores de colarinho branco.

“Queremos construir ambientes de treinamento que capturem trabalhos inteiros que as pessoas realizam”, disse Robert Farlow, cuja startup, a Plato, está entre aquelas que estão recriando sites populares e outras aplicações de software.

A nova tendência, impulsionada pelo capital de risco do Vale do Silício, mostra até onde a indústria de tecnologia está disposta a ir na busca pelas enormes quantidades de dados digitais necessárias para avançar a inteligência artificial.

Primeiro, o Vale do Silício aspirou textos, sons e imagens de toda a internet. Quando muitos sites bloquearam esses esforços, as empresas encontraram novas maneiras de pôr as mãos nos dados de outras pessoas. Agora, elas estão recriando sites como uma forma de gerar novos dados do zero.

Nos últimos meses, com o apoio de US$ 10 milhões em financiamento da Menlo Ventures e outros investidores, Garg e sua empresa também clonaram sites como Amazon, Airbnb e Gmail. Com nomes como Omnizon, Staynb e Go Mail, essas réplicas oferecem uma maneira para que sistemas de IA aprendam habilidades por meio de tentativa e erro – uma técnica que os pesquisadores chamam de aprendizado por reforço.

Em vez de aprender com dados que mostram como humanos usam sites, eles aprendem com enormes quantidades de dados que eles mesmos geram.

Pesquisadores do Vale do Silício também têm a opção de treinar sistemas de IA em sites reais. Mas, em muitos casos, isso não é possível. Sites como Amazon e Airbnb frequentemente bloqueiam bots on-line, especialmente quando eles repetem as mesmas tarefas repetidamente – um processo fundamental para o aprendizado por reforço.

“Quando você está treinando, quer rodar milhares de agentes de IA ao mesmo tempo, para que possam explorar o site, visitar suas diferentes páginas e fazer todo tipo de coisas diferentes”, disse Garg. “Se você fizer isso em um site real, será bloqueado.”

Os sistemas de IA atuais são impulsionados pelo que os cientistas chamam de redes neurais, que são sistemas matemáticos capazes de identificar padrões em textos, imagens e sons. Mas, há cerca de nove meses, empresas como a OpenAI usaram praticamente todo o texto em inglês disponível na internet. Por isso, estão recorrendo cada vez mais ao aprendizado por reforço.

Esse processo, que pode se estender por semanas ou meses, começou em áreas como matemática e programação. Ao resolver milhares de problemas matemáticos, por exemplo, sistemas de IA podem aprender quais ações levam à resposta correta e quais não levam.

Agora, empresas como OpenAI, Google, Amazon e Anthropic estão usando a técnica para construir agentes de IA. Elas começaram usando gravações de pessoas navegando em sites reais. Ao analisar a forma como esses trabalhadores contratados usavam o mouse e o teclado para pedir almoço no DoorDash ou digitar números no Microsoft Excel, os sistemas aprenderam a usar os sites sozinhos.

Para acelerar esse trabalho, empresas de IA estão pagando a startups pouco conhecidas, como AGI e Plato, para construir sites réplica onde bots podem aprender por meio de extrema tentativa e erro. (Com informações do The New York Times)

Sair da versão mobile