Agentic AI: Quando os tokens custam mais do que um humano. E que quase todos os vendedores omitem propositadamente isso.

Olá a todos!

Tenho andado a observar com crescente preocupação e, sejamos francos, alguma satisfação amarga, algo que venho a avisar há meses: a promessa de que a IA agentic vai substituir trabalhadores humanos e poupar fortunas às empresas está a chocar de frente com a realidade brutal da economia dos tokens. E finalmente hoje venho falar-vos dos números concretos, dos estudos, e das confissões de investidores multimilionários que estão a descobrir, da pior maneira, que os seus agentes de IA custam tanto ou mais do que os humanos que queriam substituir.

Fica já o aviso à navegação: este post é mais um que não é para os evangelistas da IA que acham que estamos a cinco minutos de um mundo onde ninguém precisa de trabalhar. É para quem quer entender a realidade económica por detrás do hype e tomar decisões informadas sobre onde e como investir em tecnologia. Vamos a isto.

O momento em que a máscara caiu: $300 por dia por agente…

Há poucos dias, algo notável aconteceu no podcast All-In, um dos mais influentes no mundo tech. Jason Calacanis, um investidor que não é propriamente um novato no mundo da tecnologia, confessou abertamente que está a pagar $300 por dia por agente usando a API do Claude da Anthropic. E atenção ao detalhe que torna isto verdadeiramente absurdo: o agente estava a funcionar a apenas 10 a 20% da sua capacidade total.Façam as contas comigo. $300 por dia, 365 dias por ano, dá aproximadamente $110.000 por ano. Por um agente. Que faz 10 a 20% do trabalho. Em Portugal, por esse valor contratas facilmente dois developers medios com alguma experiência, ou um developer sénior muito competente. E esses humanos trabalham a 100%, compreendem contexto, aprendem com o tempo, e não precisam que lhes paguem por cada pensamento que têm.

Chamath Palihapitiya, CEO da Social Capital e outra figura de peso no mundo dos investimentos tech, respondeu que tem exatamente o mesmo problema. E foi mais direto: disse que, aos preços atuais, os modelos de IA precisam de ser pelo menos duas vezes mais produtivos do que um empregado humano para que a matemática faça sentido. Duas vezes. Não marginalmente melhor, duas vezes melhor. E concluiu com algo que devia fazer qualquer CFO pensar duas vezes: que está a considerar seriamente impor limites orçamentais ao uso de IA nas suas empresas, porque, nas palavras dele, vai ficar sem dinheiro.

Mark Cuban, outro investidor tech de renome, reagiu a isto dizendo que o custo da IA é o contra-argumento mais inteligente que já ouviu contra a ideia de que a IA vai substituir trabalhadores humanos em massa. E tem razão.

O paradoxo dos tokens: mais baratos individualmente, mais caros no total.

Vamos falar sobre o que está realmente a acontecer nesta novela, porque a história dos tokens é um paradoxo fascinante que muitos gestores não compreendem.

Os preços unitários dos tokens caíram dramaticamente. De acordo com o relatório Tech Trends 2026 da Deloitte, os custos dos tokens caíram 280 vezes em dois anos. O Google Gemini 2.0 Flash chegou a $0.10 por milhão de tokens de input em fevereiro de 2025, trezentas vezes mais barato do que o GPT-4 original em 2023. Ao olhar para estes números, qualquer pessoa pensaria que a IA se tornou essencialmente gratuita.

Mas não se tornou. O que aconteceu foi que os workflows agenticos, aqueles onde a IA não se limita a responder a uma pergunta mas executa tarefas complexas com múltiplos passos, multiplicaram o consumo de tokens por tarefa entre 10 e 100 vezes desde dezembro de 2023. Os preços unitários desceram, mas o consumo total explodiu. É como se o preço da gasolina tivesse baixado para metade, mas de repente estivesses a conduzir vinte vezes mais quilómetros por dia. A conta no final do mês? Muito maior.

A Deloitte publicou um artigo no Wall Street Journal CIO Journal em janeiro de 2026, intitulado “AI Tokens: How to Navigate AI’s New Spend Dynamics”, onde documenta que a IA é agora a despesa que mais cresce nos orçamentos de tecnologia empresarial, com algumas empresas a reportar que consome até metade do seu orçamento de TI. As faturas de cloud computing subiram 19% em 2025 para muitas empresas, impulsionadas pelo consumo de IA generativa. E os retornos? Segundo o survey de 2025 da Deloitte, quase metade dos líderes empresariais espera que demore até três anos a ver retorno do investimento em automação básica de IA.

Três anos. Para automação básica. Não estamos a falar de agentes autónomos complexos, estamos a falar das coisas simples.

Os números que assustam: 42% dos projetos abandonados.

Se os números do custo por agente vos assustaram, esperem até verem as estatísticas de sucesso dos projetos empresariais de IA.

A S&P Global Market Intelligence conduziu um survey com mais de 1.000 empresas na América do Norte e Europa, publicado no seu relatório “Voice of the Enterprise: AI & Machine Learning, Use Cases 2025”. Os resultados são devastadores: 42% das empresas abandonaram a maioria das suas iniciativas de IA antes de chegarem a produção. Em 2024, esse número era 17%. Mais do que duplicou num único ano. Em média, as organizações descartaram 46% dos seus proofs-of-concept de IA antes de os conseguirem implementar de forma abrangente.

E porque é que foram abandonados? Custos, privacidade de dados e riscos de segurança encabeçam a lista. Notem bem: custos em primeiro lugar.

A Gartner, em junho de 2025, foi ainda mais contundente. Prevê que mais de 40% dos projetos de agentic AI serão cancelados até ao final de 2027, devido a custos crescentes, valor de negócio pouco claro e controlos de risco inadequados. Anushree Verma, Senior Director Analyst na Gartner, disse sem rodeios que a maioria dos projetos de agentic AI são experiências em fase inicial ou proofs of concept impulsionados pelo hype e frequentemente mal aplicados. E acrescentou algo que deveria estar colado na parede de todas as salas de reuniões: isto pode cegar as organizações para o custo real e a complexidade de implementar agentes de IA em escala.

Num poll da Gartner a 3.412 participantes de webinars em janeiro de 2025, apenas 19% disseram que a sua organização tinha feito investimentos significativos em agentic AI. 42% tinham feito investimentos conservadores. E 31% estavam a adotar uma postura de esperar para ver. As empresas estão hesitantes, e com bons motivos.

O “Agent washing” e os 130 vendedores reais

Outro ponto importante que a Gartner levanta, e que me irrita particularmente, é o fenómeno do “agent washing”. Isto é o equivalente em IA ao greenwashing ambiental: empresas que pegam em chatbots, em ferramentas de RPA, em assistentes virtuais que já existiam, e os repackageiam como “agentic AI” sem terem quaisquer capacidades agenticas reais.

A Gartner estima que, dos milhares de vendedores que afirmam oferecer soluções de agentic AI, apenas cerca de 130 são reais. Cento e trinta. De milhares. O resto é puro marketing a aproveitar uma buzzword para vender produtos antigos com um rótulo novo. É como pintar um Fiat Punto de vermelho e vendê-lo como Ferrari. Se alguma vez duvidaram que há uma bolha de hype à volta da IA agentic, estes números deviam esclarecer as vossas dúvidas.

A armadilha do demo: barato para começar, brutalmente caro para escalar

Há um padrão que se repete constantemente e que explica porque é que tantos projetos falham. É o que eu chamo de armadilha do demo, e que Andrei Savine descreveu brilhantemente no seu artigo “The Vibe-to-Bankruptcy Pipeline” como o paradoxo fundamental do vibe coding.

Construir um demo com IA agentic é genuinamente barato. Um fim de semana, uma chave de API, e tens algo que funciona. Respostas a fluir, tarefas a serem completadas, alguém na sala da direção a dizer que precisamos de lançar isto. O problema? O demo é barato porque tudo nele é mínimo: um modelo, um contexto, uma tarefa de cada vez, sem retries, sem orquestração, sem requisitos de fiabilidade de produção.

Quando passas para automação real, a arquitetura muda fundamentalmente. Os agentes não completam uma tarefa uma vez e param. Fazem retries quando ferramentas falham. Criam sub-agentes para workstreams paralelos. Carregam payloads massivos de contexto entre sessões. Correm em background enquanto o developer dorme.

A própria documentação da Anthropic, a empresa que criou o Claude, confirma isto. As equipas de agentes, ou seja, múltiplas sessões do Claude Code a correr em paralelo, usam aproximadamente sete vezes mais tokens do que o trabalho em sessão única standard. Sete vezes. Não 20% mais. Sete vezes. O demo que construíste num fim de semana está agora a ser medido como infraestrutura a correr a 7x o custo que modelaste quando apresentaste o business case.

Agentes não escalam como software. Escalam como trabalho humano.

E aqui está talvez a verdade mais inconveniente de todas, aquela que muda fundamentalmente a equação económica: os agentes de IA não escalam como software tradicional. Escalam como trabalho humano.

Durante vinte anos, a economia do software era simples: construir a aplicação era caro, mas escalar era barato. O modelo SaaS espalhava custos de forma plana. Quer tivesses dez utilizadores ou dez mil, o custo marginal do software aproximava-se de zero. Compradores aprenderam a esperar escalabilidade flat-rate.

Os agentes de IA destroem este modelo completamente. Cada ação que tomam queima compute, energia e tokens. Os custos tornam-se estritamente proporcionais ao trabalho executado. É como contratar um humano: quanto mais trabalho faz, mais custa. A diferença é que, ao contrário de um humano, o agente cobra-te por cada pensamento que tem, incluindo os pensamentos desnecessários, os retries, os loops redundantes.

A DataRobot publicou uma análise detalhada sobre isto, onde nota que uma simples interação de suporte ao cliente que parece eficiente com 100 tokens pode facilmente consumir 2.000 a 5.000 tokens quando o cenário requer múltiplas chamadas a ferramentas, retrieval de contexto e raciocínio multi-step. Multipliquem isso pelos volumes de uma empresa de escala, e vocês vão ter faturas mensais de tokens que eclipsam até os gastos com infraestrutura.

As subscrições mascaram o problema (até certa altura)

A resposta do mercado tem sido previsível: as equipas tentam esconder o custo debaixo de subscrições flat. Compram o plano Claude Max a $200 por mês e assumem que limitaram o risco.

Mas subscrições limitam o custo e matam a observabilidade simultaneamente. Quando atinges o rate limit, e com qualquer workload agentic real vais atingir, o agente não falha graciosamente. Pura e simplesmente para. O trabalho interrompe-se.

O consumo de tokens de developers a correr processos em background 24 horas por dia tornou-se tão severo que a Anthropic teve de impor caps semanais de utilização rigorosos, mesmo no tier mais caro de $200 por mês. Em semanas, foram forçados a lançar novos controlos administrativos empresariais que permitem às equipas de TI definir limites de gastos organizacionais rígidos e monitorizar o uso de tokens por utilizador, apenas para impedir que developers esgotassem as quotas da empresa.

Isto diz-vos tudo o que precisam de saber sobre a realidade dos custos.

O que isto significa para quem está a pensar em “Substituir humanos por IA”

Vou ser brutalmente direto, como é meu costume: se a vossa estratégia empresarial para 2026 inclui “substituir X posições humanas por agentes de IA para poupar custos”, precisam de refazer as contas. Urgentemente.

Lembram-se do post que escrevi sobre porque é que a IA não vai substituir os developers? Pois bem, os dados que temos agora reforçam esse argumento de uma forma que nem eu antecipava tão rapidamente.

Um developer humano custa o mesmo quer esteja a resolver um problema fácil ou difícil. O seu custo é fixo e previsível: salário, benefícios, contribuições. Sabem exatamente quanto vão gastar ao final do mês. Um agente de IA custa mais quanto mais tempo pensa. Cada loop de validação, cada sub-agente criado para uma tarefa que não precisava de um, cada pesquisa redundante, isso são tokens. O contador não se importa se o pensamento era necessário ou não.

As empresas que despediram engenheiros para os substituir por agentes não tomaram apenas uma decisão sobre talento. Trocaram uma estrutura de custos previsível por uma exponencial. E quando o subsídio de adoção que as empresas de IA estão a praticar acabar, porque vai acabar, a fatura real vai chegar.

A alternativa será comprar hardware. Podem ir ver o custo de  aceleradores AI da Nvidia para os workloads que estão a pensar utilizar. Eu fico á espera.

Os Estudos e Fontes

Para quem quiser aprofundar, aqui ficam as fontes principais que baseiam este post:

S&P Global Market Intelligence — “Voice of the Enterprise: AI & Machine Learning, Use Cases 2025” (survey de 1.006 respondentes na América do Norte e Europa): 42% das empresas abandonaram a maioria das suas iniciativas de IA. URL: https://www.spglobal.com/market-intelligence/en/news-insights/research/generative-ai

Gartner — Previsão de junho de 2025 sobre cancelamento de projetos de agentic AI: mais de 40% cancelados até 2027. URL: https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027

Deloitte — “AI Tokens: How to Navigate AI’s New Spend Dynamics” (WSJ CIO Journal, janeiro 2026): IA como despesa que mais cresce nos orçamentos tecnológicos empresariais. URL: https://www.deloitte.com/us/en/insights/topics/emerging-technologies/ai-tokens-how-to-navigate-spend-dynamics.html

Deloitte Tech Trends 2026 — Custos de tokens caíram 280x mas faturas empresariais estão nos tens of millions. URL: https://www.deloitte.com/us/en/insights/topics/technology-management/tech-trends.html

Cointelegraph / All-In Podcast — Jason Calacanis e Chamath Palihapitiya sobre custos de $300/dia por agente. URL: https://cointelegraph.com/news/ai-agents-wont-steal-jobs-if-theyre-too-expensive-to-run

HR Grapevine — Mark Cuban sobre o contra-argumento económico à substituição de trabalhadores por IA. URL: https://www.hrgrapevine.com/us/content/article/2026-02-23-mark-cuban-challenges-doomsday-forecasts-around-ai-linked-layoffs

DataRobot — “Balancing Cost and Performance: Agentic AI Development”: análise dos custos ocultos dos workflows agenticos. URL: https://www.datarobot.com/blog/cut-agentic-ai-development-costs/

Adam Holter — “Cheap AI Tokens, Expensive Tasks” e “AI Costs in 2025”: análise detalhada do paradoxo tokens baratos / tarefas caras. URL: https://adam.holter.com/cheap-ai-tokens-expensive-tasks-why-agentic-workflows-changed-everything/

Andrei Savine — “The Vibe-to-Bankruptcy Pipeline”: análise do pipeline de custos de demo a produção. URL: https://andreisavine.substack.com/p/vibe-to-bankruptcy-pipeline

A IA tem muito valor. Mas não o valor que vos estão a vender.

Antes que alguém me acuse de ser anti-IA, quero ser claro: a IA tem valor imenso como ferramenta de augmentação. Uso-a diariamente. Acelera tarefas, gera ideias, ajuda com debugging, é fantástica para boilerplate e documentação. Mas há uma diferença abismal entre usar IA como ferramenta que amplifica as capacidades de um humano e tentar substituir humanos por agentes autónomos que cobram por cada token de pensamento.
Hell, grande parte do meu datacenter corre gerido por IA selfhosted, com guardrails absurdamente rígidos e poupa-me muito tempo.

A narrativa de que a IA vai ser mais barata do que contratar pessoas foi construída sobre dois pressupostos que estão a revelar-se falsos: primeiro, que os custos de operação dos agentes seriam triviais; segundo, que os agentes conseguiriam atingir níveis de autonomia e fiabilidade comparáveis aos humanos. Nenhum dos dois até agora se verificou. Lembra-me a conversa de alguém que em 2015 dizia que em 2018 iria haver full self drive automóvel.

O que temos em vez disso é uma realidade onde os preços unitários dos tokens são efetivamente baratos, mas onde a arquitetura necessária para fazer algo útil com agentes autónomos consome tantos tokens que a conta final rivaliza ou excede o custo de ter humanos a fazer o mesmo trabalho. E com o agravante de que os humanos compreendem contexto, aprendem institucionalmente, não precisam de retries constantes, e não param de trabalhar quando atingem um rate limit.

Conclusão: Façam as vossas contas antes de fazerem promessas

A próxima vez que alguém numa sala de reuniões vos disser que vai poupar milhões a substituir trabalhadores por agentes de IA, peçam-lhes que mostrem os números reais. Não os números do demo de fim de semana. Os números de produção, com todos os tokens de raciocínio, todos os retries, todas as sessões paralelas, todos os custos de monitorização e governance.
Se a Gartner diz que 40% dos projetos vão ser cancelados, se a S&P Global mostra que 42% das empresas já abandonaram as suas iniciativas, se investidores como Calacanis e Palihapitiya estão publicamente a questionar se a matemática faz sentido, talvez devêssemos ouvir estes sinais em vez de os ignorar.

A IA é uma ferramenta extraordinária. Mas uma ferramenta que custa mais do que o problema que resolve não é uma solução, é um novo problema.

Até ao próximo post, e lembrem-se: nem tudo o que brilha no demo funciona em produção.

Um abraço, Nuno