A Internet está Sendo Reconstruída, e Não É para Você
De cliques a instruções: como os agentes de IA estão forçando a maior reengenharia da internet desde sua criação.
Durante três décadas, a arquitetura da internet obedeceu a um pressuposto tão fundamental que deixou de ser percebido como tal: o de que, do outro lado da tela, havia um ser humano. Alguém que pesquisa, clica, rola a página, assiste a um vídeo, abandona um carrinho. Alguém cujo comportamento, por mais variável que fosse, seguia padrões previsíveis o suficiente para que toda a infraestrutura em nuvem pudesse ser dimensionada em torno dele. Diante disso, servidores eram provisionados para picos de Black Friday, suas capacidades eram estimadas por sessões simultâneas, e o custo da computação refletia, em última instância, o ritmo da atenção humana.
Esse pressuposto, porém, está sendo silenciosamente invalidado. E quem está assumindo o lugar do humano na rede não é outro humano, mas uma nova categoria de entidade digital: os agentes de inteligência artificial.
Diferentemente de um usuário convencional, que mantém uma sessão contínua enquanto navega, um agente de IA opera por rajadas. Ele recebe uma instrução, dispara dezenas de subagentes simultâneos que consultam bancos de dados, vasculham documentos e chamam APIs em questão de segundos, e depois simplesmente desaparece, sem manter conexão, sem gerar o tipo de tráfego estável para o qual a internet foi projetada. É como se, de repente, um restaurante que sempre atendeu clientes sentados, com pedidos individuais e tempos previsíveis de refeição, começasse a receber multidões que entram ao mesmo tempo, consomem tudo em trinta segundos e somem sem aviso. A cozinha, o salão, o estoque, nada foi dimensionado para isso.
E esse novo tipo de frequentador já não é uma projeção teórica. A Cloudflare, uma das maiores empresas de infraestrutura da internet, revelou que bots já respondem por 31% de todo o tráfego HTTP global nos últimos seis meses, e que rastreadores de IA, mecanismos de busca automatizados e assistentes virtuais representam cerca de um quarto dessas solicitações. A projeção da própria empresa é categórica, ao afirmar que o tráfego gerado por máquinas ultrapassará o tráfego humano em algum momento do primeiro semestre de 2027. Estamos, portanto, a menos de um ano de um marco em que a maior parte da atividade na internet não será gerada por pessoas.
Foi exatamente diante dessa realidade emergente que a Amazon decidiu reformular uma peça central da sua infraestrutura em nuvem. Na última quinta-feira, a AWS lançou a nova geração do OpenSearch Serverless, um sistema de busca e armazenamento vetorial, projetado, desta vez, especificamente para o comportamento dos agentes. A mudança principal é técnica, mas sua lógica é reveladora: na versão anterior, computação e armazenamento eram acoplados. Isso significava que, para que o sistema estivesse pronto quando um agente precisasse dele, era necessário manter ao menos uma instância permanentemente ativa, consumindo recursos e gerando custos mesmo quando ninguém, nem humano, nem máquina, estivesse usando. Era o equivalente a pagar por uma vaga de estacionamento vinte e quatro horas por dia para um carro que aparece de forma imprevisível, fica trinta segundos e vai embora.
A nova arquitetura resolve esse problema ao separar as duas camadas. A capacidade computacional agora pode escalar em segundos durante os picos de atividade dos agentes e, o que é mais significativo, reduzir-se a zero quando eles estão ociosos, de modo que o cliente não paga nada pela inatividade. A metáfora que a própria AWS utilizou é precisa: “saiu-se da vaga fixa para o parquímetro. Você paga apenas enquanto o carro está ali”.
Essa distinção, que a princípio parece um detalhe de engenharia, carrega uma implicação econômica de primeira ordem. A infraestrutura antiga, ao impor custos fixos mesmo na ociosidade, funcionava como uma barreira implícita à adoção de agentes em larga escala. Empresas que quisessem colocar sistemas agenticos em produção precisavam arcar com o custo de manter a infraestrutura de prontidão, independentemente de quanto ela fosse de fato utilizada. Ao eliminar esse custo residual, a Amazon não está apenas otimizando um serviço; está, na prática, barateando o preço de se operar um agente. E essa redução, quando distribuída por milhares de empresas, tem o potencial de acelerar dramaticamente a transição de agentes da fase experimental para a operação real.
E aqui vale reconhecer um padrão. A lógica por trás desse movimento é estruturalmente idêntica àquela que a própria Amazon aplicou no varejo ao longo das últimas duas décadas: cada centavo retirado do custo operacional é um centavo que viabiliza mais uso, que gera mais volume, que dilui ainda mais o custo, que viabiliza ainda mais uso. No varejo, essa espiral transformou a empresa na varejista mais barata dos Estados Unidos. Na nuvem, a mesma dinâmica pode transformar a AWS na plataforma onde agentes de IA são mais baratos de operar, e portanto, onde mais agentes são implantados, logo, onde a Amazon coleta mais dados sobre como agentes se comportam, e por isso, onde ela consegue otimizar ainda mais a infraestrutura. É o mesmo ciclo virtuoso, aplicado a um novo domínio.
Não por acaso, a Amazon não está sozinha nessa corrida. A Databricks e a Snowflake já se reposicionam como sistemas de memória e recuperação de dados para inteligência artificial corporativa. A Microsoft lançou atualizações no Azure projetadas para lidar com picos de uso gerados por agentes e permitir o compartilhamento de memória entre eles. A Cloudflare apresentou no mês passado uma infraestrutura voltada para oferecer aos agentes ambientes persistentes com escalonamento instantâneo. O que se observa, assim, não é a iniciativa isolada de um player, mas a reorganização coordenada de toda a camada de infraestrutura da internet em torno de um novo tipo de consumidor, um que não é humano, não é previsível e não é contínuo.
E esse consumidor já está mudando a forma como interagimos com os sistemas digitais. A Revolut, ao lançar o AIR, substituiu a navegação por menus pela simples declaração de intenção, onde o usuário diz o que quer, e o agente executa. O Magalu transformou o WhatsApp da Lu em uma jornada completa de compra, da descoberta ao pagamento, mediada por inteligência artificial. O Google, na I/O da semana passada, anunciou que usuários poderão delegar tarefas inteiras a sistemas de IA, de pesquisas de compra a reservas de viagem. Cada um desses movimentos, no entanto, pressupõe uma infraestrutura capaz de suportar o comportamento errático e explosivo dos agentes nos bastidores. E é precisamente essa infraestrutura que está sendo construída agora.
O que se desenha, com isso, é algo mais profundo do que uma atualização técnica. É a ascensão de uma segunda camada funcional sobre a internet, projetada por e para máquinas, onde a unidade básica de interação deixa de ser o clique e passa a ser a instrução, onde o padrão de consumo não é a sessão contínua mas o disparo episódico, e onde o custo de operação precisa ser tão granular quanto a própria atividade que o justifica. A internet humana não desaparece, mas passa a coexistir com uma internet agentica que, em volume e em velocidade, tende a superá-la.
Entre no canal Entrelinhas no WhatsApp e siga nosso Instagram: informação rápida, em tempo real, que tangibilizam as transformações.
Para quem toma decisões, a implicação é direta. A infraestrutura sempre foi, historicamente, uma camada invisível, algo que se delega ao time técnico e se revisa no orçamento de TI. Mas quando a infraestrutura determina quais agentes podem operar, a que custo, com que velocidade e em que escala, ela deixa de ser suporte e se torna estratégia. Empresas que não compreenderem essa mudança continuarão pensando em agentes de IA como funcionalidades a serem adicionadas aos produtos existentes. As que compreenderem entenderão que os agentes são, na verdade, os novos usuários, e que a vantagem competitiva pertencerá a quem souber servi-los melhor, antes mesmo de servir às pessoas que os comandam.
A internet está sendo reconstruída. E, pela primeira vez em sua história, o principal motivo não é melhorar a experiência de quem está do outro lado da tela. É porque, cada vez mais, não há ninguém do outro lado.





