The thin green line: o que a página de estado da Anthropic nos diz sobre quem é o Cliente

Olá a todos!

Há páginas na internet que nos dizem mais pelo que mostram sem querer do que por aquilo que publicam de propósito. A página de estado da Anthropic é uma dessas páginas. Aquela barra de noventa dias, pintada de vermelho, amarelo e verde, repetida produto a produto, é provavelmente o documento mais transparente que a empresa já publicou. E tenho quase a certeza de que não era suposto ser. Não tem marketing por trás. Não tem spin. Não tem comunicado de imprensa a contextualizar os números. É uma radiografia crua, atualizada ao minuto, da forma como aquela empresa distribui a sua atenção, os seus recursos e, em última instância, o seu respeito pelos diferentes tipos de clientes que tem.

Deixem me descrever o que vi. Devagar, porque a imagem é demasiado eloquente para parafrasear com pressa, e porque há coisas que só se entendem quando nos damos ao trabalho de as saborear antes de reagir.

Seis serviços. claude.ai, a interface que milhões de pessoas usam todos os dias para trabalhar, pensar, escrever e criar: 99,11% de uptime. Etiqueta no canto, a vermelho, sem qualquer ambiguidade: Major Outage. Claude Console, o painel onde os programadores gerem as suas chaves, os seus projetos e aquilo por que pagam todos os meses: 99,56%. Major Outage. Claude API, o api.anthropic.com de onde dependem literalmente centenas de produtos construídos por terceiros, startups inteiras cujo modelo de negócio assenta naquela ligação: 99,4%. Major Outage. Claude Code, a ferramenta que a própria Anthropic anda a vender em todas as conferências como o futuro do desenvolvimento de software: 99,27%. Major Outage. Claude Cowork: 99,52%. Major Outage.

E depois, no fundo da página, quase como uma nota de rodapé que não quer chamar a atenção, isolado, sereno, quase ofensivamente indiferente ao caos que existe por cima dele: Claude for Government. 99,93% de uptime. Etiqueta no canto, a verde: Operational.

Uma linha verde solitária num mar de vermelho. Não é preciso ser engenheiro de fiabilidade para perceber o que se está a olhar. É preciso é ser muito ingénuo para fingir que não se percebe.

 

Os números, sem maquilhagem

Façamos a aritmética que a Anthropic preferia que não fizéssemos, porque a aritmética das percentagens altas é traiçoeira por natureza. A diferença entre 99,11% e 99,93% parece pequena quando a escrevemos assim. Afinal, são ambos “noventa e tal por cento”, não são? E essa é precisamente a armadilha. As percentagens acima dos noventa e nove por cento escondem ordens de grandeza dentro de casas decimais, e é ali que a realidade se esconde.

99,11% de uptime ao longo de noventa dias significa qualquer coisa como dezanove horas em que o serviço não esteve onde devia estar. Dezanove horas em que pessoas que pagam ficaram a olhar para ecrãs em branco, para spinners que não acabavam, para respostas que não vinham. 99,93% significa pouco mais de uma hora e meia. Não estamos sequer a falar de uma diferença de grau. Estamos a falar de uma diferença de categoria inteira. O cliente comum, o que paga a subscrição Pro ou a fatura de API que cresce todos os meses, esse cliente teve aproximadamente doze vezes mais tempo de indisponibilidade do que o cliente governamental. Doze vezes. Durante o mesmo período de noventa dias, dentro da mesma empresa, alimentados pelos mesmos modelos de linguagem, operados pelas mesmas equipas.

E reparemos, porque isto importa, onde caem os piores resultados. Não caem sobre serviços periféricos ou experimentais. Caem precisamente sobre os produtos que sustentam a operação. A API, que é a espinha dorsal de todo o ecossistema de quem construiu negócio em cima da Anthropic, aparece a 99,4%. O Console, que é literalmente a porta de entrada de quem assina cheques e gere projetos, com a sua própria etiqueta vermelha. O Claude Code, vendido com pompa e circunstância em todas as keynotes como a ferramenta indispensável do programador moderno, é, pela métrica da própria casa, o segundo serviço menos fiável de toda a lista. O segundo pior, numa lista de seis. A ironia de vender o futuro do desenvolvimento de software com uma das piores métricas de disponibilidade da empresa merecia, no mínimo, uma reflexão pública que nunca vai acontecer.

Há aqui um padrão, e o padrão não tem nada de subtil. Quanto mais central é o serviço para a vida quotidiana de empresas, programadores e cidadãos comuns, pior é o estado da linha. Quanto mais o serviço se aproxima de um contrato com um Estado soberano, mais verde fica o ecrã. É quase uma função linear, e as funções lineares não costumam ser coincidências.

Operational não é um adjetivo. É um contrato.

Aqui é onde quero que parem e pensem comigo durante um momento, porque é tentador, quase reconfortante, encolher os ombros e dizer “azar, os sistemas governamentais são separados, é natural que sejam mais estáveis”. E sim, são separados. E é exatamente esse o ponto que estou a tentar fazer.

A diferença entre uma etiqueta que diz Major Outage e uma que diz Operational não é uma diferença de sorte, nem uma diferença de escala, nem sequer uma diferença de complexidade técnica. É uma diferença de promessa. O Claude for Government corre, quase de certeza, num ambiente completamente dedicado, isolado do resto da infraestrutura, com certificações de conformidade do tipo FedRAMP, com auditorias regulares, e com aquilo que realmente interessa atrás de tudo isto: um Service Level Agreement com dentes de verdade. Um SLA governamental não é aquele documento que ninguém lê nos termos de serviço de uma subscrição de vinte dólares. É um contrato jurídico a sério, com penalizações financeiras concretas por cada hora de indisponibilidade, com cláusulas de disponibilidade garantida que se medem em nines, com capacidade reservada que nunca, em circunstância alguma, é canibalizada para servir mais ninguém. Quando um Estado assina, exige uma linha verde por escrito. E quem não a entrega, paga. Em dinheiro, em reputação, e possivelmente em contratos futuros que deixam de existir.

E o vosso plano Pro? A vossa subscrição de equipa? A vossa fatura de API que cresce de mês para mês à medida que integram mais funcionalidades? Leiam as letras pequenas, se ainda não o fizeram. Aquilo a que vocês têm direito chama se best effort. Melhor esforço. Que, traduzido do inglês corporativo para português honesto, significa algo como: “tentamos, e se não conseguirmos, lamentamos o transtorno e sugerimos que tentem novamente mais tarde.” Não há penalização quando o serviço cai. Não há capacidade reservada com o vosso nome escrito nela. Não há ninguém do outro lado da linha que perca o sono quando a vossa integração falha durante três horas numa terça feira à tarde. Há uma página de estado bonita e bem desenhada onde podem ver, em tempo real, a vossa própria irrelevância pintada a vermelho.

A linha verde do governo não é um acidente de arquitetura. É a manifestação mais visível possível de quem, naquela empresa, tem um contrato que se faz cumprir e de quem tem apenas uma esperança educada de que as coisas funcionem.

E não se enganem quanto à direção em que o dinheiro empurra estas decisões, porque é sempre a mesma direção. Um contrato governamental de IA não é um cliente entre muitos. É, tipicamente, uma das âncoras de receita de toda a operação. É plurianual, o que significa previsibilidade num mercado onde quase nada é previsível. É renovável, o que significa que cada ano de bom serviço compra o ano seguinte. E tem, por trás, o tipo de poder que não se mede em dólares de subscrição mas em audições parlamentares, em escrutínio regulatório e em decisões que podem fechar portas a mercados inteiros.

Quando uma empresa tem de escolher, e tem sempre de escolher porque os recursos nunca são infinitos, onde colocar os seus melhores engenheiros de fiabilidade, a sua capacidade de computação reservada e as suas janelas de manutenção mais cuidadosas, a aritmética não exige malícia nenhuma para chegar sempre à mesma conclusão. O cliente que pode rescindir um contrato de oito dígitos e arrastar a empresa para um inquérito público ganha a linha verde. O cliente que, no pior dos cenários, cancela uma subscrição de vinte dólares e escreve um tweet zangado que fica perdido no algoritmo ganha a página de estado para assistir ao espetáculo como espetador passivo. Isto não é uma teoria da conspiração. Não é paranoia. É gravidade económica pura e simples. Os recursos caem sempre na direção de quem mais pode punir a empresa por eles faltarem. Sempre.

“Mas o ambiente é mais pequeno e tem menos tráfego”

Vou antecipar esta objeção porque ela é legítima, porque provavelmente é verdade na sua premissa, e porque merece uma resposta honesta que vá para lá da premissa.

Alguém dirá, provavelmente talvez um engenheiro de boa fé que conhece a infraestrutura por dentro, talvez um relações públicas com um guião preparado, que o tier governamental tem uptime superior simplesmente porque é um ambiente mais pequeno. Menos utilizadores. Menos funcionalidades experimentais a partir se todos os dias. Carga previsível e estável em vez do caos imprevisível de milhões de pedidos de consumidores a chegarem em ondas que ninguém consegue prever. E que o Cowork, por exemplo, tem aquelas primeiras barras a cinzento precisamente porque é um produto recente, ainda a encontrar o seu equilíbrio, ainda a estabilizar, e que portanto a comparação não é inteiramente justa.

Tudo isto é provavelmente verdade. E não muda absolutamente nada para quem está do lado de cá da equação.

Porque a questão nunca foi porquê. A questão sempre foi quem. Reparem no que esta defesa, aparentemente razoável, realmente admite quando a lemos com cuidado: que a fiabilidade não é uma propriedade intrínseca do serviço, mas uma função direta de quanta capacidade isolada, quanta atenção de engenharia de topo e quanta contenção de risco a Anthropic decide dedicar a cada segmento de clientes. É uma confissão disfarçada de justificação. O governo recebe um jardim murado, regado diariamente, podado com cuidado, vigiado por guardas. Vocês recebem o terreno comum: sobrelotado, exposto a todas as tempestades, e onde a vossa carga compete em tempo real com a de toda a gente, incluindo com as experiências mais recentes e mais instáveis que a empresa precisa de testar para manter a sua vantagem competitiva.

E é aqui que a intenção deixa de importar. Quer a alocação preferencial de recursos seja deliberada, definida numa diretiva escrita algures num documento interno que nunca veremos, quer seja meramente emergente, o resultado natural e não planeado da forma como os contratos foram negociados e as arquiteturas foram desenhadas ao longo do tempo, o resultado prático na vossa empresa é rigorosamente idêntico. Quando os recursos apertam, e eles apertam sempre mais cedo ou mais tarde, a linha verde que está protegida por um contrato governamental permanece verde. E a vossa, que está protegida apenas por um “melhor esforço” escrito em letras pequenas que ninguém leu, fica vermelha. A intenção é completamente irrelevante para quem fica do lado errado da decisão. O que conta é a estrutura. E a estrutura, esta página prova o todos os dias, não vos coloca no topo da lista de prioridades.

A IA pública serve os propósitos de quem a vende

É por isto que eu insisto, neste blogue, semana após semana, naquilo que muitos ainda tratam como exagero de quem vê conspirações onde não existem: a IA pública não está lá para servir os vossos propósitos. Está lá para servir os propósitos de quem a opera, de quem a vende e de quem a financia.

E quero ser claro: isto não é uma acusação moral. Não estou a dizer que a Anthropic é malévola ou que tem intenções obscuras. Estou a fazer uma descrição económica daquilo que qualquer organização racional faz quando opera sob restrições de recursos, que é a condição permanente de qualquer organização no mundo real. Uma empresa que consegue entregar cinco ou seis nines de disponibilidade num contrato estatal lucrativo e blindado juridicamente, e que ao mesmo tempo deixa os produtos de consumo e de programador a oscilar nos noventa e nove vírgula zero e qualquer coisa, essa empresa está simplesmente a fazer aquilo que a lógica económica mais elementar dita: aloca o melhor da sua capacidade ao cliente que mais a pode punir por falhar. É racional. É previsível. E é devastador para quem está do outro lado sem perceber que está.

O cliente governamental tem advogados especializados em contratos de tecnologia, penalizações financeiras automáticas por incumprimento, e poder político suficiente para transformar uma falha de serviço num problema existencial para a empresa. Vocês têm um botão de thumbs down no canto inferior da conversa e uma página de estado pública onde podem assistir, em tempo real e sem possibilidade de intervir, ao espetáculo da vossa própria despromoção na hierarquia de prioridades.

Quando vocês constroem o vosso processo de negócio crítico em cima de uma API que está, por desenho e por contrato, num tier de “melhor esforço”, vocês não são clientes no sentido que essa palavra deveria ter. São passageiros. E os passageiros não decidem para onde vai o avião quando o combustível começa a escassear. Essa decisão pertence aos contratos que viajam na cabine da frente, e vocês não têm lugar marcado ali.

E reparem que nada disto, absolutamente nada, requer má vontade da parte da Anthropic. Não é preciso assumir que alguém numa sala de reuniões decidiu prejudicar os clientes comuns. Requer apenas que a empresa exista para sobreviver e crescer, o que ela naturalmente faz, porque é para isso que as empresas existem. O erro nunca esteve em a Anthropic se comportar como uma empresa que maximiza o retorno dos seus recursos. O erro está em vós, em nós, termos assumido que ela se comportaria como uma infraestrutura pública neutra, um serviço de utilidade geral ao serviço equitativo de todos os seus clientes. Ela nunca prometeu isso. Se procurarem nos termos de serviço, não encontram essa promessa em lado nenhum. E a página de estado é o desmentido mais eloquente possível, publicado pela própria casa, atualizado a cada minuto, visível para qualquer pessoa que se dê ao trabalho de olhar.

O que realmente acontece quando a linha fica vermelha

Quero ser concreto aqui, porque a abstração é confortável e a realidade não.

Imaginem o vosso negócio. Não o vosso negócio no abstrato, o vosso negócio real, com pessoas reais, com clientes reais, com prazos reais. Imaginem que fizeram aquilo que toda a gente anda a fazer e a recomendar: automatizaram o atendimento, ou a triagem de documentos, ou a geração de propostas comerciais, ou a análise de contratos, ou a transcrição de reuniões, ou seja o que for, em cima da API da Anthropic ou de qualquer outro fornecedor de IA na nuvem. Funciona lindamente nos dias verdes. Os relatórios saem, os clientes são respondidos, os documentos são processados, tudo flui com aquela elegância que nos faz sentir que fizemos a escolha certa.

Depois chega um dia vermelho. Major Outage. E nesse dia, o vosso processo de negócio não abranda. Não degrada graciosamente como prometem os manuais de arquitetura. Suspende se. Para. Os pedidos ficam em fila ou caem silenciosamente sem que ninguém perceba durante a primeira hora. Os vossos colaboradores ficam parados a olhar para um spinner que gira indefinidamente. Os vossos clientes ficam à espera de respostas que não vêm, e ao fim de dez minutos vão embora para a concorrência. E vocês não podem fazer absolutamente nada, exceto carregar em F5 na página de estado e esperar que a empresa de quarenta mil milhões de dólares termine de servir, primeiro, quem tem um contrato que se faz cumprir e que tem consequências jurídicas reais quando é violado.

O vosso negócio ficou suspenso. Talvez porque os recursos foram alocados a um contrato governamental que tinha prioridade. Talvez por um pico de carga de consumo que sobrecarregou a infraestrutura partilhada. Talvez por um rollout de uma funcionalidade nova que a vós nem sequer interessa mas que precisava de ser testada em produção. A causa exata muda de outage para outage. A vossa impotência perante todas elas é rigorosamente a mesma.

E é aqui que separamos o brinquedo da ferramenta. Um brinquedo pode depender da boa vontade de terceiros, porque se falhar, encolhe se os ombros, ri se um bocado e tenta se amanhã. Uma ferramenta de negócio, não. Uma ferramenta de negócio tem de estar sob o vosso controlo na exata medida em que o negócio depende dela. Não parcialmente. Não “quase sempre”. Na exata medida. Tudo o resto é construir uma casa em terreno alheio e fingir surpresa quando o senhorio decide que o jardim agora é dele, que precisa do terreno para outro fim, ou simplesmente que não vai regar esta semana porque tem coisas mais importantes para fazer.

 

IA local: não como hobby, mas como continuidade de negócio

É por isto, e não por nostalgia de self hosting nem por qualquer pureza ideológica nem por aquela teimosia que certas pessoas nos atribuem quando dizemos coisas que não querem ouvir, que defendo a IA local para a esmagadora maioria das cargas de trabalho do dia a dia.

Mas vamos ser adultos sobre isto, porque a honestidade intelectual obriga nos a não cair no extremo oposto. Há tarefas que exigem genuinamente o modelo de fronteira mais capaz que existe no planeta. Tarefas onde a diferença entre um modelo de cento e tal mil milhões de parâmetros e um modelo mais pequeno é a diferença entre um resultado útil e um resultado que não serve para nada. Para essas tarefas, sim, recorre se à nuvem. Mas recorre se com os olhos bem abertos para aquilo que ela é: um serviço operado por terceiros, governado pelos interesses de terceiros, e onde a vossa prioridade de acesso é determinada não pela importância que a tarefa tem para vocês, mas pela importância que o vosso contrato tem para eles.

Agora, a pergunta que realmente importa: que percentagem do vosso trabalho diário é mesmo essa? Que percentagem exige verdadeiramente o modelo mais avançado do mundo? Pensem com honestidade. A classificação de emails. A extração de dados de faturas. A sumarização de relatórios que ninguém vai ler na íntegra. A primeira versão de um texto que vai ser editado três vezes antes de sair. A resposta a uma pergunta interna que qualquer pessoa com acesso à documentação poderia responder. A transcrição de uma reunião. A tradução de um documento. O boilerplate de código que é sempre o mesmo com variações mínimas. Quanto disto precisa, realmente precisa, de um modelo operado por outra empresa num datacenter que vocês não controlam? E quanto disto corre hoje, neste momento, à velocidade do raio numa máquina perfeitamente razoável debaixo da vossa secretária, com um modelo aberto que ninguém vos pode desligar, limitar, degradar, ou simplesmente tirar porque decidiu que o contrato de outra pessoa era mais importante?

A resposta, para a esmagadora maioria de nós, é desconfortável precisamente porque é favorável ao local. A maior parte dos workloads reais, aqueles que fazem o dia a dia funcionar, não precisa da fronteira. Precisa de fiabilidade. Precisa de previsibilidade. Precisa de privacidade. E precisa, acima de tudo, de não ficar refém de uma página de estado alheia que pode pintar se de vermelho a qualquer momento sem que vocês possam fazer outra coisa que não seja esperar. Tudo isto, o local entrega por definição. Quando o modelo corre na vossa infraestrutura, o uptime é uma decisão vossa e de mais ninguém. A capacidade é vossa. A fila de prioridade tem um único nome: o vosso. Não há nenhum contrato governamental à vossa frente na fila, porque não existe fila nenhuma. Vocês são os primeiros e os últimos ao mesmo tempo.

A IA local, neste enquadramento, deixa de ser um projeto de fim de semana para entusiastas e passa a ser aquilo que sempre devia ter sido tratada como sendo desde o primeiro dia: a infraestrutura de continuidade do vosso negócio. O suporte de retaguarda que garante que quando a linha verde de outra pessoa for protegida à custa da vermelha que vos pintaram, quando o serviço na nuvem cair porque os recursos foram realocados para quem tem mais peso contratual, o vosso processo não suspende. Não para. Continua. Porque não dependia de ninguém para continuar. Porque a capacidade de continuar estava nas vossas mãos, na vossa infraestrutura, sob o vosso controlo, desde o início.

A leitura honesta de uma imagem honesta

Devolvo vos a imagem com que comecei. Seis barras de noventa dias. Cinco etiquetas vermelhas a dizer Major Outage sobre os produtos que servem empresas, programadores e cidadãos comuns. Uma etiqueta verde, serena e solitária, a dizer Operational sobre o produto que serve um Estado.

Podem ler isto como uma coincidência de arquitetura. Como um artefacto estatístico sem significado profundo. Como o resultado inevitável de ambientes com cargas diferentes. Eu leio como uma confissão involuntária. A Anthropic não vos enganou. Bem pelo contrário, publicou a verdade num ecrã que qualquer pessoa com ligação à internet pode consultar a qualquer momento do dia ou da noite. A verdade é simples e é esta: naquela casa, existem clientes cuja disponibilidade é um direito contratual, protegido por documentos jurídicos com consequências reais, e existem clientes cuja disponibilidade é uma esperança bem intencionada sustentada por uma frase que diz “melhor esforço” e pouco mais. E vocês, salvo prova em contrário que encontrem no vosso próprio contrato, são da segunda categoria. Não por malícia de ninguém, mas porque a estrutura económica do negócio vos colocou ali e não noutro sítio.

A pergunta que vos deixo não é se confiam na Anthropic, na OpenAI, na Google, ou em qualquer outra empresa que vos vende inteligência artificial como serviço. Confiar ou não confiar é irrelevante quando a estrutura é o que é. A pergunta real é outra: faz sentido construir aquilo de que o vosso negócio depende, aquilo que os vossos clientes esperam que funcione, aquilo que sustenta os postos de trabalho das vossas pessoas, sobre uma promessa que a própria empresa, todos os dias, atualização após atualização, pinta de vermelho para vos mostrar, sem filtro e sem desculpas, que não é convosco que ela se preocupa primeiro?

A linha verde existe. Só não tem o vosso nome escrito nela. Construam a vossa.

Abraço, Nuno