Grandes nomes como Microsoft e Uber estão lutando para justificar os custos altíssimos do uso intensivo de IA. O CTO da Uber, Praveen Neppalli Naga, revelou que o orçamento de IA de 2026 foi esgotado em poucos meses, e Andrew Macdonald, chefe de Operações, questiona a correlação entre o uso de tokens e recursos úteis para o consumidor.
A Goldman Sachs estima que a IA Agente pode levar a um aumento de mais de 24 vezes no uso de tokens nos próximos anos, intensificando o descompasso entre a necessidade, o desejo e a capacidade financeira das empresas.
A Microsoft começou a restringir o acesso de desenvolvedores ao assistente de programação Claude Code, direcionando-os para a ferramenta interna Copilot CLI. Embora justificado como consolidação, muitos veem a medida como um corte de custos ao final do ano fiscal.
Mesmo com engenheiros da Uber utilizando IA Agente e mais de 60% do código sendo gerado por IA, não há uma correlação clara entre o alto uso de tokens e o aumento proporcional em recursos tangíveis para os clientes, segundo Andrew Macdonald.
A IA Agente consome mais de 1.000 vezes a quantidade de tokens de um chatbot comum, o que explica o aumento explosivo nos custos. Um exemplo chocante foi o gasto de US$ 1,3 milhão em tokens por uma equipe de três pessoas em um único mês.
CEOs de empresas como Airbnb, Chime e Google alardeiam a porcentagem de código gerado por IA, mas os casos da Uber e de projetos como OpenClaw levantam dúvidas sobre o retorno financeiro real, sugerindo que o custo da IA pode estar superando o dos trabalhadores que ela supostamente substitui.
A Goldman Sachs aponta que a próxima geração de chips de inferência, como a plataforma Vera Rubin da Nvidia, pode tornar o uso de IA dramaticamente mais barato, aumentando a receita das empresas de IA. No entanto, mais de 50% dos projetos de data center com hardware Blackwell foram cancelados ou adiados.
Empresas como Google, Oracle e Microsoft planejam usar seu hardware por até seis anos, o que se choca com os avanços anuais da IA. A realidade é que os ganhos de eficiência do hardware estão distantes de compensar a explosão na demanda por IA Agente.
No curto prazo, grandes empresas estão reestruturando o uso da IA para manter a escala sem esgotar orçamentos. Se elas não conseguem bancar, a acessibilidade para o restante do mercado se torna uma questão ainda maior, ameaçando a lucratividade de curto prazo das empresas de IA.