O Custo da IA: Gigantes da tecnologia em apuros

Relatório da Goldman Sachs aponta aumento de 24x na demanda por tokens; Uber e Microsoft já sentem o impacto da cobrança por tokens

O Custo Crescente da IA e o Dilema das Gigantes

  • Empresas de Tecnologia sob Pressão

    Grandes nomes como Microsoft e Uber estão lutando para justificar os custos altíssimos do uso intensivo de IA. O CTO da Uber, Praveen Neppalli Naga, revelou que o orçamento de IA de 2026 foi esgotado em poucos meses, e Andrew Macdonald, chefe de Operações, questiona a correlação entre o uso de tokens e recursos úteis para o consumidor.

  • Previsão Alarmante da Goldman Sachs

    A Goldman Sachs estima que a IA Agente pode levar a um aumento de mais de 24 vezes no uso de tokens nos próximos anos, intensificando o descompasso entre a necessidade, o desejo e a capacidade financeira das empresas.

  • Microsoft Reestrutura o Acesso à IA

    A Microsoft começou a restringir o acesso de desenvolvedores ao assistente de programação Claude Code, direcionando-os para a ferramenta interna Copilot CLI. Embora justificado como consolidação, muitos veem a medida como um corte de custos ao final do ano fiscal.

  • Desconexão entre Custo e Benefício

    Mesmo com engenheiros da Uber utilizando IA Agente e mais de 60% do código sendo gerado por IA, não há uma correlação clara entre o alto uso de tokens e o aumento proporcional em recursos tangíveis para os clientes, segundo Andrew Macdonald.

  • O Fenômeno da IA Agente

    A IA Agente consome mais de 1.000 vezes a quantidade de tokens de um chatbot comum, o que explica o aumento explosivo nos custos. Um exemplo chocante foi o gasto de US$ 1,3 milhão em tokens por uma equipe de três pessoas em um único mês.

  • Hype vs. Realidade Financeira

    CEOs de empresas como Airbnb, Chime e Google alardeiam a porcentagem de código gerado por IA, mas os casos da Uber e de projetos como OpenClaw levantam dúvidas sobre o retorno financeiro real, sugerindo que o custo da IA pode estar superando o dos trabalhadores que ela supostamente substitui.

  • A Esperança nos Novos Hardwares

    A Goldman Sachs aponta que a próxima geração de chips de inferência, como a plataforma Vera Rubin da Nvidia, pode tornar o uso de IA dramaticamente mais barato, aumentando a receita das empresas de IA. No entanto, mais de 50% dos projetos de data center com hardware Blackwell foram cancelados ou adiados.

  • O Desafio da Escala e Renovação

    Empresas como Google, Oracle e Microsoft planejam usar seu hardware por até seis anos, o que se choca com os avanços anuais da IA. A realidade é que os ganhos de eficiência do hardware estão distantes de compensar a explosão na demanda por IA Agente.

  • Reestruturação é a Chave

    No curto prazo, grandes empresas estão reestruturando o uso da IA para manter a escala sem esgotar orçamentos. Se elas não conseguem bancar, a acessibilidade para o restante do mercado se torna uma questão ainda maior, ameaçando a lucratividade de curto prazo das empresas de IA.

Baseado no artigo de Tom’s Hardware