TL;DR
Lançamento restrito: A Anthropic está impedindo o lançamento público de seu modelo Claude Mythos AI depois de descobrir milhares de vulnerabilidades de dia zero nos principais sistemas operacionais e navegadores. Consórcio Industrial: O Projeto Glasswing concede acesso prévio a 12 gigantes da tecnologia, incluindo Microsoft, Google e Apple, apoiado por US$ 100 milhões em créditos de uso para correção de vulnerabilidades. Salto de capacidade: a Mythos produziu 181 explorações funcionais a partir de um conjunto de vulnerabilidades onde o modelo principal anterior teve sucesso apenas duas vezes em centenas de tentativas. Tensão governamental: O Departamento de Defesa designou a Anthropic como um risco na cadeia de abastecimento, revertendo um acordo do DoD de 200 milhões de dólares assinado poucos meses antes.
A Anthropic está restringindo seu modelo de IA de alto desempenho a um consórcio de parceiros de segurança depois que Claude Mythos identificou milhares de vulnerabilidades de dia zero em todos os principais sistemas operacionais e navegadores da Web nas últimas semanas.
As capacidades da Mythos estão tão além da fronteira atual da IA que a Anthropic está retendo totalmente a divulgação pública. No Projeto Glasswing, a empresa está concedendo acesso de visualização a 12 grandes empresas de tecnologia e 40 organizações adicionais que constroem ou mantêm infraestrutura de software, apoiada por US$ 100 milhões em créditos de uso e US$ 4 milhões em doações diretas para organizações de segurança de código aberto. O objetivo do consórcio é simples: corrigir as vulnerabilidades de maior prioridade antes que recursos como o do Mythos se tornem amplamente disponíveis.
As capacidades do Mythos diminuem os modelos anteriores de IA
A equipe Frontier Red da Anthropic relatou em sua avaliação que seu modelo principal anterior, o Opus 4.6, teve uma taxa de sucesso de quase zero por cento no desenvolvimento de exploits autônomos, transformando o conhecido mecanismo Firefox JS vulnerabilidades em explorações funcionais apenas duas vezes em várias centenas de tentativas. O Mythos Preview produziu 181 explorações funcionais do mesmo conjunto de vulnerabilidades, além de 29 instâncias adicionais com controle de registro. O salto não é incremental; representa uma mudança qualitativa no que a IA pode fazer com a pesquisa de segurança.
A lacuna de capacidade vai muito além dos benchmarks. Mythos descobriu um bug de 27 anos na implementação TCP SACK do OpenBSD que poderia travar remotamente qualquer host executando o sistema operacional. Ele encontrou uma vulnerabilidade de 16 anos no codec H.264 do FFmpeg, em uma linha de código que testes automatizados de fuzz testaram cinco milhões de vezes sem detectar a falha. No FreeBSD, ele escreveu autonomamente uma exploração de execução remota de código usando uma cadeia ROP de 20 gadgets dividida em vários pacotes de rede.
Nos testes OSS-Fuzz, onde o Sonnet 4.6 e o Opus 4.6 alcançaram o nível 1 em 150 a 175 casos, o Mythos Preview alcançou 595 trava nos níveis 1 e 2 e sequestro de fluxo de controle total em 10 alvos separados no nível de gravidade mais alto. Dos 198 relatórios de vulnerabilidade revisados manualmente, de acordo com a Anthropic, os prestadores de serviços especializados concordaram com a avaliação de gravidade de Claude em 89% das vezes, com 98% caindo dentro de um nível de gravidade.
Os recursos surgiram de melhorias gerais na codificação e raciocínio de agentes, e não de treinamento específico em segurança cibernética. Mythos é um sistema de uso geral semelhante ao Claude Opus 4.6, mas suas capacidades de pesquisa de segurança provaram ser fortes o suficiente para que a Anthropic determinasse que a indústria precisava de tempo de preparação antes de qualquer lançamento mais amplo. O pesquisador Nicholas Carlini disse que encontrou mais bugs nas semanas anteriores do que em toda a sua carreira anterior, capturando a escala da mudança.
A acessibilidade é igualmente preocupante. Especialistas não relacionados à segurança da Anthropic pediram à Mythos que encontrasse vulnerabilidades de execução remota de código durante a noite e acordaram para concluir explorações funcionais. O modelo também descobriu uma vulnerabilidade de corrupção de memória de convidado para host em um monitor de máquina virtual com segurança de memória de produção, cujos detalhes estão sendo retidos enquanto se aguarda um patch.
Onde os modelos anteriores podiam identificar vulnerabilidades potenciais, mas raramente transformá-las em armas, o Mythos pode encadear até cinco falhas para resultados de ataque sofisticados, incluindo escapar de sandboxes de renderizador e de sistema operacional em navegadores da web, vinculando quatro vulnerabilidades separadas com técnicas de heap spray JIT. Uma auditoria completa do OpenBSD custa cerca de US$ 20.000 para 1.000 execuções, com a descoberta de bug do SACK específico custando menos de US$ 50.
[conteúdo incorporado]
O consórcio e suas apostas
A lista de parceiros do Projeto Glasswing parece quem é quem. a indústria de tecnologia: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia e Palo Alto Networks. O facto de concorrentes ferozes estarem a colaborar sob a égide de uma startup de IA com apenas cinco anos de idade sinaliza o quão grave se tornou a ameaça da Mythos.
Elia Zaitsev, CTO da CrowdStrike, observou que a IA comprimiu a janela entre a descoberta de vulnerabilidades e a exploração de meses para minutos, enquadrando a urgência do consórcio como uma resposta direta a esta aceleração. O envolvimento da CrowdStrike é notável: as ações da empresa caíram 8% em fevereiro, quando a Anthropic lançou o Claude Code Security, mas agora está fazendo parceria com a mesma empresa cujas capacidades ameaçam seu negócio principal.
“Vê-los entregar mais de US$ 100 milhões em créditos e abrir modelos não lançados entre si me diz que o nível de ameaça passou de competitivo para existencial.”
David Gewirtz, consultor de guerra cibernética, IACSP (via ZDNet)
Para empresas que litigam rotineiramente disputas de propriedade intelectual entre si, a decisão de reunir recursos em torno do modelo da Anthropic reflete um cálculo compartilhado de que a infraestrutura não corrigida representa um risco maior do que a desvantagem competitiva. O Google está disponibilizando o Mythos Preview aos participantes por meio de sua plataforma Vertex AI, citando suas próprias ferramentas de segurança de IA Big Sleep e CodeMender, mas ingressando no Glasswing em vez de competir de forma independente.
O Mythos Preview não será disponibilizado para o público geral. A Anthropic planeja integrar salvaguardas de segurança cibernética em um próximo modelo Claude Opus antes de qualquer lançamento mais amplo, dando aos parceiros do consórcio uma janela de 90 dias para corrigir as vulnerabilidades primeiro.
Tensões governamentais e consequências de código aberto
O lançamento do consórcio ocorre em um cenário complicado para as relações governamentais da Anthropic. Um vazamento de dados em 27 de março revelou a existência do Mythos antes do anúncio oficial.
A tensão entre o acordo do Departamento de Defesa da Anthropics e o rótulo de risco da cadeia de abastecimento sublinha o dilema da dupla utilização no cerne do Project Glasswing: as mesmas capacidades que tornam o Mythos inestimável para a defesa também o tornam uma ameaça potencial se o acesso não for cuidadosamente controlado. A Anthropic fez referência às capacidades cibernéticas ofensivas e defensivas em seu anúncio, um dos poucos casos em que a empresa reconheceu publicamente as aplicações ofensivas de sua tecnologia.
O impacto do modelo na segurança de código aberto já é visível. O mantenedor do kernel Linux, Greg Kroah-Hartman, descreveu uma mudança repentina de qualidade nos relatórios de vulnerabilidade gerados por IA:
“Meses atrás, estávamos recebendo o que chamamos de’resíduos de IA’, relatórios de segurança gerados por IA que estavam obviamente errados ou de baixa qualidade… Algo aconteceu há um mês e o mundo mudou. Agora temos relatórios reais.”
Greg Kroah-Hartman, mantenedor do kernel Linux (via Weblog de Simon Willison)
o mantenedor do curl Daniel Stenberg ecoou uma mudança semelhante, observando que agora passa horas diariamente revisando relatórios de vulnerabilidade gerados por IA que são em grande parte legítimos. Os US$ 4 milhões em doações para organizações de segurança de código aberto abordam a lacuna imediata de financiamento, mas o volume de descobertas reais pode exigir uma estrutura de apoio mais permanente para projetos cujos mantenedores voluntários sustentam infraestruturas críticas em todo o mundo.
A Anthropic se envolveu em discussões com o governo dos EUA sobre as capacidades cibernéticas ofensivas e defensivas da Mythos. Simon Willison observou que o GPT-5.4 da OpenAI já tem uma forte reputação por encontrar vulnerabilidades de segurança, sugerindo que o consórcio Glasswing deveria eventualmente incluir o OpenAI também. A notável ausência da OpenAI na lista de parceiros levanta questões sobre se o consórcio pode alcançar uma cobertura abrangente do cenário de vulnerabilidade impulsionado pela IA sem incluir todos os principais fornecedores de modelos.
A Red Team da Anthropic expressou confiança de que, uma vez que o ambiente de segurança atinja um novo equilíbrio, a IA acabará por beneficiar mais os defensores do que os atacantes, aumentando a segurança geral do ecossistema de software. Se esse equilíbrio chegará antes que os atores mal-intencionados desenvolvam capacidades comparáveis, ou antes que a próxima geração de modelos expanda ainda mais a superfície de ataque, continua sendo a questão central para a janela de patches de 90 dias e além.