O Fim da IA Barata
Quando o custo real da inteligência artificial chegar ao cliente, boa parte do mercado vai descobrir que nunca esteve realmente usando IA... mas apenas consumindo o subsídio de quem a financia.
Existe uma assimetria fundamental no mercado de inteligência artificial que, até agora, quase ninguém foi obrigado a confrontar: o preço que empresas pagam para usar IA não reflete, nem remotamente, o custo que essa IA tem para existir.
Durante os últimos dois anos, laboratórios como OpenAI e Anthropic operaram sob uma lógica que o Vale do Silício conhece bem, a mesma que sustentou o Uber durante quase uma década: subsidiar o uso para criar dependência, escalar a base, e resolver a equação econômica depois. O problema é que o “depois” chegou. A Anthropic protocolou confidencialmente seu pedido de IPO junto à SEC. A OpenAI caminha na mesma direção. E quando uma empresa de IA deixa de responder apenas a fundos de venture capital e passa a prestar contas a acionistas públicos, a pergunta que até então podia ser adiada torna-se inescapável: quem vai pagar a conta?
Os primeiros sinais dessa transição já são visíveis, e não são sutis. No início de junho, o GitHub Copilot migrou de um modelo de assinatura fixa para cobrança baseada em consumo de tokens, o que, na prática, revelou o custo real de uma ferramenta que milhões de desenvolvedores haviam incorporado ao fluxo de trabalho como se fosse gratuita. Relatos de usuários apontam saltos de custos mensais na ordem de dez a vinte e cinco vezes o valor anterior, casos em que contas individuais passaram de menos de trinta dólares para valores próximos de mil dólares por mês. A mudança foi tão abrupta que desenvolvedores no Reddit cunharam o termo “Tokenpocalypse” para descrevê-la. Mas o que parece um ajuste de preço é, na realidade, a remoção de um véu: o Copilot nunca custou dez dólares; custava o que os modelos de linguagem que o sustentam sempre custaram, e a diferença era absorvida pela Microsoft como investimento em adoção. A conta apenas mudou de mãos.
E o GitHub Copilot não é um caso isolado; é o canário na mina de carvão. Nos bastidores da indústria, os sinais de estresse financeiro se multiplicam com uma velocidade que surpreende até os mais atentos. A Uber consumiu seu orçamento inteiro de IA para 2026 ainda em abril, apenas quatro meses após distribuir ferramentas de codificação por IA a cerca de cinco mil engenheiros. A própria Microsoft, que investiu bilhões na OpenAI e é dona do GitHub, revogou licenças internas de ferramentas de IA após constatar que o custo por engenheiro oscilava entre quinhentos e dois mil dólares mensais. E talvez o caso mais emblemático seja o de uma empresa que, segundo relatos do Axios, acumulou uma fatura de quinhentos milhões de dólares em um único mês com o uso irrestrito de modelos avançados, simplesmente porque ninguém havia definido limites de consumo.
O que essas histórias revelam, em conjunto, é que a maioria das empresas tratou IA como se fosse mais uma assinatura de software, um custo previsível por assento, quando a realidade é que modelos de linguagem operam sob uma lógica econômica radicalmente diferente, onde cada interação consome recursos computacionais variáveis e o uso escala de forma não linear.
Há, contudo, uma dimensão desse fenômeno que transcende o choque tarifário e toca em algo mais profundo: a natureza do consumo em si. Nos últimos meses, o mercado assistiu ao surgimento e à derrocada de uma prática que recebeu o nome de “tokenmaxxing”, a obsessão corporativa por maximizar o volume de tokens consumidos como sinal de produtividade. Empresas, pressionadas pela narrativa de que precisavam adotar IA em todas as frentes, transformaram consumo em métrica de desempenho. Departamentos competiam entre si pelo volume de uso. Gestores estabeleciam metas internas de interações com modelos generativos. A Amazon chegou a criar um ranking interno de consumo de IA entre equipes, que precisou ser desativado quando ficou evidente que funcionários estavam inflando números com prompts de baixo valor apenas para subir na classificação. O tokenmaxxing, portanto, não é apenas um comportamento; é o sintoma de uma patologia organizacional mais ampla, aquela que confunde volume com valor, atividade com progresso, e acesso com compreensão.
E é nesse ponto que a analogia com o Uber se torna particularmente instrutiva, embora por razões que vão além das que normalmente se invocam. Os defensores da tese de que a IA não é uma bolha frequentemente apontam para o Uber como precedente: uma empresa massivamente deficitária que, com o tempo, encontrou o caminho da lucratividade. E isso é verdade. Porém, o que raramente se menciona é o preço dessa travessia. Para se tornar rentável, o Uber precisou se transformar radicalmente como empresa, expandindo para áreas de negócio que não existiam no modelo original, comprimindo a remuneração dos motoristas, aumentando preços para os passageiros e, fundamentalmente, mudando a natureza da proposta de valor que o havia tornado popular.
A pergunta que se impõe, deste modo, é se os laboratórios de IA conseguirão percorrer um caminho análogo, e a resposta não é óbvia. Os custos de infraestrutura computacional são mais diretos e menos compressíveis do que os custos operacionais de uma plataforma de transporte. Não há, no ecossistema de IA, um equivalente ao motorista cujo rendimento pode ser silenciosamente retraído para subsidiar o crescimento. O hardware exige capital. A energia elétrica exige capital. O treinamento de modelos cada vez mais sofisticados exige capital. E esses custos, ao contrário do que ocorreu com o armazenamento em nuvem ou a largura de banda, não estão caindo na velocidade necessária para fechar a equação.
Trata-se, no fundo, de uma inversão estrutural da lógica que sustentou outros ciclos tecnológicos. Quando analisamos o modelo da Amazon, a constatação central foi que seu fosso competitivo não reside em baixar preços como tática, mas em ter construído, ao longo de décadas, uma infraestrutura onde o custo de servir cada cliente diminui à medida que o volume cresce. Essa espiral virtuosa, de mais clientes, mais volume, menos custo unitário, preços ainda mais baixos, é exatamente o que os laboratórios de IA ainda não demonstraram ser capazes de replicar. O custo marginal de cada token gerado não cai com a mesma previsibilidade que o custo marginal de uma entrega adicional em um centro de fulfillment regionalizado. E enquanto essa curva de custo não se comportar como a da logística ou da computação em nuvem, a promessa de IA acessível permanecerá ancorada em capital de risco, não em eficiência operacional.
O que torna essa equação ainda mais volátil é o fato de que a demanda por capacidade computacional está sendo amplificada por uma mudança no tipo de uso. A ascensão dos agentes autônomos, capazes de executar cadeias inteiras de tarefas sem intervenção humana, representa um salto de complexidade que multiplica exponencialmente o consumo de tokens por interação. A lógica do agentic commerce que já começa a redesenhar a experiência financeira e o varejo, onde o usuário declara uma intenção e o sistema orquestra a execução de ponta a ponta, é fascinante do ponto de vista da experiência, mas devastadora do ponto de vista do custo. Cada decisão automatizada, cada pesquisa intermediária, cada validação contextual que um agente realiza para resolver uma única solicitação humana consome recursos computacionais que, no modelo anterior de interação por chat, simplesmente não existiam. O consumo por desenvolvedor nas organizações que adotaram ferramentas agênticas cresceu quase dezenove vezes em nove meses. Essa não é uma curva de adoção; é uma curva de explosão, e ela está acontecendo antes que os modelos de precificação estejam sequer estabilizados.
No Brasil, esse descompasso adquire contornos ainda mais acentuados. Boa parte das empresas está adotando IA não por diagnóstico estratégico, mas por ansiedade institucional, criando comitês, distribuindo licenças, aguardando que algo transformador emerja espontaneamente da exposição ao modelo. A pressa movida pelo medo de ficar para trás produz paradoxalmente o exato atraso que se temia, pois consome um orçamento que poderia ser direcionado a iniciativas com escopo definido, métricas claras e propósito real. A diferença entre o Magalu, por exemplo, que conseguiu demonstrar capilaridade genuína com mais de vinte mil pessoas usando IA de forma distribuída e orientada a resultados concretos, e uma organização que distribui licenças generativas como quem distribui crachás é a diferença entre cultura e consumo, entre transformação e teatro corporativo.
O cenário que se desenha para o segundo semestre de 2026, portanto, é de uma correção inevitável. À medida que os laboratórios de IA se aproximam dos mercados públicos, a pressão por rentabilidade vai continuar transferindo custos que eram absorvidos como investimento para a ponta do consumo. Empresas que incorporaram IA sem governança de uso descobrirão, como já estão descobrindo, que ferramentas cujo custo parecia insignificante eram, na realidade, extraordinariamente caras, mas apenas temporariamente subsidiadas. E o mercado enfrentará uma espécie de teste de realidade coletivo: separar o uso que gera valor do uso que apenas gera fatura.
Entre no canal Entrelinhas no WhatsApp e siga nosso Instagram: informação rápida, em tempo real, que tangibilizam as transformações.
É curiosamente revelador que, quando o ChatGPT Plus foi lançado, o preço de vinte dólares por mês não tenha sido pensado por nenhum modelo financeiro sofisticado, mas de uma estimativa quase arbitrária, um número jogado ao mercado para testar a disposição a pagar. E desde então, todo o ecossistema de precificação da IA se construiu sobre essa fundação improvisada, com camadas sucessivas de ajustes que tentam, retroativamente, fazer os números fecharem. Não é assim que se constrói uma indústria sustentável. É assim que se constrói uma indústria que, mais cedo do que o otimismo permitiria prever, será forçada a descobrir quanto vale, de fato, aquilo que oferece, e quantos dos seus clientes permanecerão quando o preço refletir a realidade.
A IA não ficará inacessível. Mas ficará cara o suficiente para que a distinção entre usá-la com propósito e consumi-la por inércia deixe de ser uma questão filosófica e se torne, com toda a brutalidade de um balanço trimestral, uma questão de sobrevivência.






