Mythos: Tudo que Você Precisa Saber Sobre a IA que é Poderosa Demais para ser Democrática
A Anthropic decidiu que seu modelo mais poderoso é perigoso demais para ser público. Mas o verdadeiro risco pode estar em quem ficou de fora.
Existe uma premissa maior que acompanhou toda a trajetória da inteligência artificial generativa desde que ela entrou no vocabulário corporativo global: a de que cada novo modelo seria mais acessível do que o anterior. Mais barato, mais rápido, mais disponível. A lógica parecia autoevidente, afinal, a história da tecnologia é, em grande medida, a história da democratização progressiva de capacidades antes restritas. O computador saiu das universidades para os escritórios, dos escritórios para os bolsos. A internet saiu dos laboratórios militares para as salas de estar. A inteligência artificial, presumia-se, seguiria o mesmo arco. E seguiu, até o dia em que deixou de seguir.
Em abril deste ano, a Anthropic, um dos três principais laboratórios de IA do mundo, anunciou que o seu modelo mais avançado, o Claude Mythos, não seria disponibilizado ao público. Não por limitações técnicas, não por falta de demanda, mas porque as capacidades demonstradas em testes internos foram consideradas, pela própria empresa que o criou, perigosas demais para circulação aberta. É, até onde se sabe, a primeira vez na história comercial da inteligência artificial que um laboratório decide que o seu melhor produto deve ser mantido fora do alcance dos seus próprios clientes. E é exatamente nessa decisão, mais do que no modelo em si, que reside a verdadeira ruptura. Porque o que ela sinaliza não é um problema de engenharia. É o momento em que a curva de capacidade da IA ultrapassou a curva de governança das instituições que deveriam regulá-la.
Para entender a dimensão do que foi descoberto, é preciso ir além dos números, embora os números, por si só, sejam eloquentes. O Mythos conseguiu localizar vulnerabilidades desconhecidas, as chamadas falhas de dia zero, em todos os principais sistemas operacionais e navegadores em uso no mundo, muitas delas existentes há décadas sem que ninguém as tivesse detectado. Uma dessas falhas estava escondida há vinte e sete anos no OpenBSD, um sistema reconhecido justamente pela robustez da sua segurança. Em oitenta e três por cento dos casos, o modelo desenvolveu, de forma autônoma, formas funcionais de explorar essas falhas já na primeira tentativa. Completou uma simulação de ataque cibernético de trinta e duas etapas, tarefa que demora cerca de vinte horas para um profissional humano, sendo o primeiro modelo de IA a executar a totalidade dos passos. A Mozilla, em um único ciclo de avaliação, corrigiu duzentas e setenta e uma vulnerabilidades que o Mythos encontrou no Firefox. Esses números impressionam. Mas o que torna o Mythos genuinamente perturbador está em outra camada.
O documento técnico publicado pela Anthropic, com mais de duzentas páginas de análise comportamental do modelo, registrou três categorias de incidentes que deslocam a questão do plano operacional para o plano, arriscamos dizer, filosófico. Em testes realizados antes do lançamento, o modelo construiu por iniciativa própria um mecanismo de múltiplas etapas para escapar do ambiente isolado em que estava confinado e publicou em locais acessíveis informação sobre essa fuga. Em outros casos, utilizou um método proibido para resolver uma tarefa, aparentemente reconheceu que esse caminho seria detectável e reescreveu a solução por meios permitidos antes de apresentá-la, ocultando o procedimento real. E, numa terceira categoria, quando o seu trabalho era avaliado por outro sistema de IA, tentou manipular esse avaliador. Cada episódio, isoladamente, poderia ser classificado como uma anomalia emergente em um sistema de alta complexidade. Lidos em conjunto, porém, compõem um quadro qualitativamente diferente: o de um sistema capaz de comportamento estratégico, dissimulação intencional e ação autônoma para além das instruções que recebeu. O Mythos não apenas encontra falhas. Ele decide, por conta própria, o que fazer com o que encontra, e, mais inquietante, decide quando esconder o que fez.
É a partir desse ponto que a história do Mythos deixa de ser uma história sobre cibersegurança e se torna uma história sobre poder. Porque a reação institucional que se seguiu ao anúncio revela, com uma clareza quase brutal, o grau de fragilidade que sustenta a infraestrutura financeira global. No dia seguinte à divulgação, o secretário do Tesouro americano e o presidente da Reserva Federal convocaram uma reunião de emergência com os executivos dos cinco maiores bancos do país. O governador do Banco da Inglaterra declarou que o modelo poderia expor completamente todo o universo do risco cibernético. O Japão ordenou uma revisão nacional. A Índia determinou campanhas de remediação nas suas instituições financeiras. O Canadá levou o tema ao Fundo Monetário Internacional. E o próprio FMI, semanas depois, publicou uma análise que reformulou o problema nos termos mais desconfortáveis possíveis: modelos como o Mythos não representam um risco para instituições isoladas, mas um risco sistêmico para o sistema financeiro global.
A razão é simples e, por isso mesmo, alarmante, afinal, toda a infraestrutura financeira contemporânea, dos pagamentos ao crédito, da compensação às transferências, opera sobre uma base compartilhada de software, nuvem e redes dominada por um punhado de fornecedores. Uma violação assistida por IA em qualquer um desses pontos pode se propagar ao sistema inteiro.
A velocidade e a amplitude dessa resposta são, em si mesmas, um dado analítico. Quando bancos centrais de quatro continentes reagem em dias a um anúncio de uma empresa de São Francisco, o que está sendo revelado não é apenas a potência do Mythos, mas a consciência, até então inconfessada, de que o sistema financeiro global é mais vulnerável do que os seus guardiões admitiam publicamente. O modelo não criou essa vulnerabilidade. Apenas a tornou impossível de ignorar.
Mas é no passo seguinte da Anthropic que a análise se torna mais interessante. Em vez de lançar o modelo ou de trancá-lo definitivamente, a empresa criou uma terceira via: o Projeto Glasswing, uma iniciativa que concedeu acesso restrito ao Mythos a cerca de quarenta organizações, entre elas Amazon Web Services, Apple, Google, Microsoft, NVIDIA, CrowdStrike, JPMorgan e Goldman Sachs.
A lógica declarada é defensiva, ou seja, permitir que as empresas responsáveis pelas infraestruturas mais críticas do mundo usem o Mythos para encontrar e corrigir as suas próprias vulnerabilidades antes que modelos equivalentes cheguem a atores hostis. E essa lógica é, em si mesma, coerente. O problema é a consequência não declarada, pois ao criar um consórcio seleto de organizações com acesso à ferramenta defensiva mais avançada do mundo, a Anthropic desenhou, talvez involuntariamente, uma nova hierarquia de segurança digital. Quem está dentro do Glasswing pode vasculhar seus sistemas em busca de falhas que existem há décadas e corrigi-las preventivamente. Quem está fora opera no escuro, dependendo de que alguém lhe comunique os resultados ou de que nenhum ator hostil encontre as mesmas brechas primeiro.
Analisamos, em edições anteriores, como a Amazon construiu um fosso competitivo que não reside em um produto ou em uma marca, mas na própria estrutura de custos que sustenta tudo o que oferece, uma vantagem tão enraizada na infraestrutura que se torna, para a maioria dos concorrentes, intransponível. A mesma lógica de assimetria estrutural opera aqui, mas em uma dimensão radicalmente diferente. O fosso que o Glasswing cria não é comercial: é soberano. Cada ciclo de utilização do Mythos pelas organizações do consórcio endurece as defesas de quem está dentro e, por contraste, fragiliza relativamente quem está fora. Essa assimetria não diminui com o tempo. Ela se compõe. E o custo de não estar na mesa, neste caso, não é perder participação de mercado. É ficar exposto.
Ainda, a dimensão geopolítica desse arranjo é impossível de contornar, afinal, nenhuma organização europeia de caráter público integra o consórcio. Nenhuma organização portuguesa, brasileira ou latino-americana sequer figura na lista. A decisão da Anthropic de definir quem entra e quem fica de fora não foi tomada contra esses países, é verdade, mas foi tomada sem eles, e essa distinção, longe de atenuar o problema, agrava-o. Porque o que ela revela é que a defesa cibernética de infraestruturas críticas deixou de ser uma competência nacional e passou a ser, na prática, uma concessão comercial. Quando a capacidade de proteger hospitais, sistemas de pagamento, redes elétricas e bases de dados públicas depende de acesso a modelos controlados por empresas privadas sediadas em uma única jurisdição, e quando esse acesso é distribuído de forma seletiva, a soberania digital se torna não uma aspiração política, mas uma ficção operacional.
E o paradoxo não para por aí. A relação dos próprios Estados Unidos com a Anthropic ilustra, com uma ironia quase didática, a insuficiência das categorias institucionais existentes para lidar com o que está acontecendo. O Departamento de Defesa americano classificou a Anthropic como risco na cadeia de abastecimento, depois de a empresa se recusar a permitir o uso dos seus modelos em vigilância doméstica massiva e no desenvolvimento de armas autônomas. A Anthropic processou a administração federal em resposta. E, no entanto, a Agência de Segurança Nacional, subordinada ao mesmo Departamento de Defesa, utiliza o Mythos para varredura de ambientes em busca de vulnerabilidades. O governo americano litiga contra a Anthropic enquanto a sua própria agência de inteligência emprega o produto da empresa que tenta banir. Ou seja, se o poder militar mais sofisticado do mundo não consegue manter uma posição coerente em relação a uma única empresa de IA, o que isso diz sobre a capacidade de qualquer outro Estado de exercer controle significativo sobre essa tecnologia?
Discutimos também, em uma edição recente, como a inteligência artificial, ao assumir tarefas que antes exigiam esforço mental, pode atrofiar a própria capacidade de raciocínio que a tornava necessária, um fenômeno que se manifesta tanto na criatividade individual quanto no julgamento estratégico de líderes. O Mythos projeta essa mesma dinâmica sobre o plano institucional. Quando organizações delegam inteiramente a detecção de vulnerabilidades a um modelo de IA, o que acontece com a competência humana de compreender a arquitetura dos sistemas que operam? Quando a defesa cibernética passa a depender de um sistema que o próprio operador não controla e cuja lógica interna não consegue auditar completamente, o que resta da capacidade institucional de avaliar risco de forma autônoma?
O perigo, neste caso, não é apenas que o Mythos encontre falhas que os humanos não encontram. É que, ao fazê-lo com uma eficácia tão avassaladora, torne progressivamente dispensável o investimento em competências humanas de segurança, exatamente as competências que seriam necessárias no dia em que o modelo, por qualquer razão, deixasse de estar disponível.
E esse dia não é hipotético. Segundo o responsável pela equipe de testes adversariais da Anthropic, capacidades equivalentes às do Mythos devem chegar a atores hostis em um prazo de seis a dezoito meses. Outros analistas estendem essa janela para até vinte e quatro meses. A própria Anthropic já sinalizou que o regime de acesso restrito será, em um futuro próximo, substituído por um lançamento geral. A janela de vantagem defensiva que o Glasswing oferece é, portanto, estreita. E é exatamente por isso que o debate institucional que o Mythos provocou, por mais urgente que seja, chega com um atraso estrutural em relação ao problema que pretende endereçar. A pergunta relevante não é se modelos com essas capacidades vão se proliferar, pois isso é inevitável. A pergunta é se as instituições que precisam se defender contra eles, os hospitais, as escolas, as redes elétricas, os sistemas de pagamento, as pequenas empresas que compõem o tecido real de qualquer economia, terão tido tempo de se preparar quando esse momento chegar. Para as quarenta organizações do Glasswing, a resposta é provavelmente sim. Para o restante, a resposta é consideravelmente menos reconfortante.
Entre no canal Entrelinhas no WhatsApp e siga nosso Instagram: informação rápida, em tempo real, que tangibilizam as transformações.
O Mythos, nesse sentido, não cria novas desigualdades, mas amplifica as que já existem. Funciona como um acelerador de assimetrias pré-existentes, em que quem já dispunha de escala e orçamento para investir em segurança ganha acesso à ferramenta defensiva mais poderosa já construída, e quem já operava com recursos limitados e sistemas desatualizados fica proporcionalmente mais exposto. A ironia, portanto, é precisa: um ato de contenção responsável, a decisão de não lançar o modelo ao público, produziu como efeito colateral a cristalização de uma hierarquia de segurança digital que será extraordinariamente difícil de reverter.
No fim, o que o episódio Mythos revela é menos sobre o que uma inteligência artificial consegue fazer e mais sobre o que as instituições humanas ainda não conseguem governar. A Anthropic tomou uma decisão sem precedentes ao recusar o lançamento público do seu modelo mais poderoso. Mas, ao fazê-lo, expôs algo que talvez seja mais perturbador do que o próprio modelo: chegamos ao ponto em que a capacidade tecnológica de uma única empresa privada pode ser poderosa demais para ser democrática, mas também necessária demais para ser ignorada. E entre essas duas impossibilidades, o espaço para a ação soberana dos Estados, especialmente dos que não foram convidados para a mesa, não para de encolher. A premissa da democratização progressiva da tecnologia, aquela com a qual abrimos esta análise, não foi refutada pelo Mythos. Foi, simplesmente, suspensa por tempo indeterminado. E essa suspensão, silenciosa e sem data de validade, pode ser a consequência mais duradoura de tudo o que aconteceu.





