A Anthropic lançou uma prévia do modelo de IA fronteiriço Mythos, descrito como um de seus mais poderosos, para uso em trabalhos de cibersegurança defensiva por um grupo limitado de organizações parceiras. O modelo faz parte da iniciativa Project Glasswing, que visa escanear sistemas de software para vulnerabilidades sem torná-lo disponível ao público em geral. Essa abordagem controlada surge após um vazamento de dados que revelou detalhes sobre o modelo, originalmente chamado Capybara em documentos internos.
Anúncio do Modelo Mythos
O modelo Claude Mythos Preview é um sistema de propósito geral para os sistemas Claude da Anthropic, com fortes habilidades em codificação agentiva e raciocínio. Embora não tenha sido treinado especificamente para cibersegurança, ele demonstra capacidades avançadas em análise de vulnerabilidades, superando modelos anteriores como o Opus. A Anthropic o classifica como um modelo fronteiriço, projetado para tarefas complexas, incluindo construção de agentes e codificação, conforme descrito em documentos sobre modelos da Anthropic.
Documentos vazados indicam que o Mythos representa um avanço significativo em áreas como codificação de software, raciocínio acadêmico e cibersegurança, posicionando-o acima do lineup Opus. A empresa descreve o modelo como o mais capaz desenvolvido até o momento, com pontuações superiores em benchmarks, como 83,1% no CyberGym para tarefas de análise de vulnerabilidades, contra 66,6% do Opus 4.6.
Project Glasswing e Parcerias
A iniciativa Project Glasswing envolve 12 organizações parceiras que implantarão o Mythos para trabalhos de segurança defensiva, escaneando software proprietário e de código aberto em busca de vulnerabilidades. As parceiras incluem Amazon, Apple, Broadcom, Cisco, CrowdStrike, Linux Foundation, Microsoft e Palo Alto Networks, que compartilharão aprendizados para beneficiar a indústria de tecnologia. Além delas, cerca de 40 organizações no total terão acesso à prévia, sem disponibilidade geral ao público.
Versões de relatórios mencionam variações na lista de parceiras iniciais, incluindo Google, Nvidia e Amazon Web Services em algumas contas, ao lado de mais de 40 outras empresas como CrowdStrike e Palo Alto Networks. A Anthropic planeja usar esses testes para aprender sobre o deployment em escala, com foco em sistemas de infraestrutura crítica. Dianne Penn, head de gerenciamento de produtos de pesquisa da Anthropic, destacou que o projeto representa um primeiro passo para dar vantagem a defensores cibernéticos.
A Anthropic comprometeu até 100 milhões de dólares em créditos de uso para os participantes, com pagamentos adicionais além desse limite, e 4 milhões de dólares em doações diretas a organizações de segurança de código aberto.
Capacidades em Cibersegurança
Nas últimas semanas, o Mythos identificou milhares de vulnerabilidades zero-day, muitas críticas, incluindo bugs de uma a duas décadas de idade, como um em OpenBSD de 27 anos não detectado anteriormente. O modelo também encadeou vulnerabilidades no kernel do Linux para obter acesso de superusuário. No benchmark CyberGym, que avalia agentes de IA em tarefas de análise de vulnerabilidades, o Mythos obteve 83,1%, superando o Opus 4.6 com 66,6%.
Jim Zemlin, diretor executivo da Linux Foundation, afirmou que ferramentas como o Mythos podem democratizar a expertise em segurança para mantenedores de código aberto, que historicamente careciam de recursos acessíveis. A Anthropic alerta que capacidades como essas representam uma espada de dois gumes, pois poderiam ser usadas por atores maliciosos para explorar bugs, em vez de corrigi-los. Newton Cheng, líder do Frontier Red Team da Anthropic, enfatizou a necessidade de monitoramento próximo para gerenciar riscos em cibersegurança.
Vazamento Inicial e Descoberta
O vazamento de detalhes do Mythos ocorreu em março de 2026 devido a uma configuração incorreta no sistema de gerenciamento de conteúdo da Anthropic, expondo cerca de 3.000 documentos internos em um cache público acessível. Pesquisadores de segurança identificaram o incidente, que incluiu rascunhos de blog descrevendo o modelo como Capybara, um tier acima do Opus, com avanços em raciocínio e cibersegurança. A Anthropic atribuiu o erro humano e confirmou que os documentos eram rascunhos iniciais sem relação com infraestrutura principal ou dados de clientes, conforme relatado em memo vazado sobre o modelo Mythos.
O relatório do vazamento levou a uma queda em ações de cibersegurança, com o ETF iShares Cybersecurity estável em negociações intradiárias na terça-feira. A empresa confirmou que testava o modelo com um pequeno grupo de clientes de acesso antecipado. Pesquisadores como Roy Paz da LayerX Security e Alexandre Pauwels da University of Cambridge verificaram a autenticidade dos documentos expostos.
Contexto Legal e Discussões Governamentais
A Anthropic mantém discussões em andamento com autoridades federais dos EUA sobre o uso do Mythos, incluindo a Cybersecurity and Infrastructure Security Agency e o Center for AI Standards and Innovation. Essas conversas ocorrem em meio a um litígio com a administração Trump, após o Pentágono classificar a Anthropic como risco à cadeia de suprimentos por recusa em permitir targeting autônomo ou vigilância de cidadãos americanos. A administração apelou da decisão em disputa legal com a Anthropic.
Fundada em 2021 por ex-pesquisadores da OpenAI, a Anthropic construiu reputação em deployment responsável de IA, com o Project Glasswing lançado semanas após confronto público com o Departamento de Defesa sobre segurança. O CEO Dario Amodei escreveu em post no X que o projeto oferece oportunidade para um internet mais seguro, se gerenciado corretamente. A iniciativa evita liberação irresponsável para mitigar riscos de capacidades cibernéticas.
Além disso, a Anthropic enfrentou incidentes de segurança anteriores, como uma falha no Claude Cowork em janeiro de 2026 e críticas a claims sobre interrupção de campanhas chinesas em novembro de 2025. O nome Project Glasswing foi escolhido como metáfora para vulnerabilidades invisíveis em software, comparadas a uma borboleta transparente.


