Anthropic lança Claude Fable 5 e Claude Mythos 5

Compartilhe:

A Anthropic lançou dois novos modelos de inteligência artificial da classe Mythos: o Claude Fable 5, disponível ao público com salvaguardas para evitar usos indevidos, e o Claude Mythos 5, uma versão inicialmente restrita a parceiros de segurança cibernética e pesquisa biológica. Ambos são oferecidos ao preço de US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída, menos da metade do valor do Claude Mythos Preview. O lançamento ocorre cerca de dois meses após a Anthropic ter apresentado o Mythos Preview, modelo então limitado a um grupo seleto de empresas dentro da iniciativa Project Glasswing.

Capacidades e desempenho

Segundo a Anthropic, o Fable 5 supera todos os modelos que a empresa já disponibilizou ao público, apresentando desempenho de ponta em engenharia de software, trabalho de conhecimento, visão e pesquisa científica. A empresa afirma que, quanto mais longa e complexa a tarefa, maior a vantagem do Fable 5 sobre os modelos anteriores. Em uma demonstração, o modelo completou o jogo Pokémon FireRed utilizando apenas capturas de tela brutas, sem mapas ou auxílios extras — algo que modelos anteriores precisavam de uma estrutura complexa para fazer.

O Mythos 5, que é o mesmo modelo subjacente com salvaguardas removidas em algumas áreas, mostrou resultados expressivos em pesquisa. Em descoberta de medicamentos, a Anthropic afirma que o modelo acelerou aspectos do processo em cerca de dez vezes e, em um exemplo, igualou ou superou operadores humanos qualificados. Nove dos 14 alvos proteicos do estudo geraram candidatos robustos para desenvolvimento de fármacos. Na geração de hipóteses em biologia molecular, em comparações cegas contra modelos Opus, os cientistas preferiram as hipóteses do Mythos 5 em cerca de 80% das vezes, e várias foram encaminhadas para avaliação experimental. Uma hipótese — sobre um mecanismo inédito em uma proteína de E. coli — foi corroborada por um laboratório independente.

Em genômica, o Mythos 5 conduziu pesquisa autônoma por mais de uma semana, montando dados de células únicas de 138 espécies animais e projetando um modelo de aprendizado de máquina 100 vezes menor que um modelo recente publicado na revista Science, mas com desempenho superior. A Anthropic pretende publicar esses resultados nos próximos meses.

Feedbacks de clientes com acesso antecipado indicam que o Fable 5 é o primeiro modelo a superar 90% no benchmark principal de análises da Hex, com um salto de 10 pontos sobre o Opus. A empresa Genspark afirmou que o modelo venceu todos os concorrentes em seus testes, com vantagem significativa nas tarefas mais difíceis. Outros relatos destacam capacidade de raciocínio em nível de pesquisador sênior, redução de tokens de raciocínio em um terço e conclusão de tarefas 25% a 30% mais rápida que o Opus 4.8.

Salvaguardas e segurança

A Anthropic afirma que liberar um modelo tão capaz traz riscos, especialmente nas áreas de cibersegurança e biologia, onde poderia ser usado para causar danos. Por isso, o Fable 5 foi lançado com salvaguardas que bloqueiam respostas em tópicos de alto risco. Quando um usuário faz uma pergunta considerada perigosa — como instruções para fabricar uma toxina — o modelo não responde e recorre ao Claude Opus 4.8, anunciado no final de maio, para fornecer uma resposta segura.

A empresa afirma que as salvaguardas disparam, em média, em menos de 5% das sessões, e que foram ajustadas de forma conservadora para priorizar a segurança, podendo bloquear ocasionalmente consultas inofensivas. A Anthropic realizou testes extensivos de segurança, incluindo um bug bounty externo com mais de 1.000 horas de teste, no qual nenhum participante encontrou um jailbreak universal — definido como um prompt ou script que permite interagir com o modelo como se as salvaguardas não estivessem presentes. A empresa também trabalhou com organizações externas de red team que não conseguiram encontrar jailbreaks universais.

O Mythos 5, por ser o mesmo modelo subjacente, apresenta nível de alinhamento semelhante ao do Opus 4.8, segundo avaliações automatizadas da Anthropic. Os resultados detalhados de segurança e capacidades estão descritos no sistema de classificação do modelo.

Preços e disponibilidade

Tanto o Fable 5 quanto o Mythos 5 custam US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída. Desenvolvedores podem utilizar o Fable 5 pela API da Anthropic com o nome claude-fable-5.

O Fable 5 está disponível imediatamente para todos os usuários. Para planos de assinatura Pro, Max, Team e Enterprise (baseados em assentos), o modelo está incluído sem custo extra desde o lançamento até 22 de junho. A partir de 23 de junho, o uso exigirá créditos adicionais, a menos que a capacidade permita estender o período de inclusão. A Anthropic afirma que pretende, assim que a capacidade permitir, restaurar o Fable 5 como parte padrão dos planos de assinatura, e que comunicará quaisquer mudanças com antecedência.

O Mythos 5 é restrito a parceiros do Project Glasswing (com salvaguardas de cibersegurança removidas) e a pesquisadores de biologia selecionados (com salvaguardas de biologia removidas), até que o programa de acesso confiável esteja disponível. A Anthropic exige que os usuários do Mythos 5 aceitem uma política de retenção de dados de 30 dias para monitoramento de segurança.

Project Glasswing e acesso restrito ao Mythos 5

O Project Glasswing é uma colaboração entre a Anthropic, Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, a Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks, com o objetivo de proteger softwares críticos. Até o momento, os parceiros do projeto utilizaram o Claude Mythos Preview para encontrar mais de dez mil vulnerabilidades de alta ou criticalidade. A Anthropic planeja expandir o Glasswing para aproximadamente 150 novas organizações em mais de 15 países.

Com o lançamento do Mythos 5, todos os usuários que atualmente têm acesso ao Mythos Preview poderão fazer upgrade. A Anthropic afirma que o Mythos 5 é comparável ou um pouco superior ao Mythos Preview na maioria dos casos, por um custo substancialmente menor. A empresa planeja expandir o acesso gradualmente, em consulta com o governo dos EUA, por meio de um programa de acesso confiável para organizações de cibersegurança.

Planos futuros

A Anthropic pretende abrir também um programa de acesso confiável para biologia, fornecendo acesso ao Fable 5 com as salvaguardas de biologia e química removidas (mas com as salvaguardas cibernéticas mantidas). O programa inicialmente incluirá um pequeno número de pesquisadores de organizações de ciências da vida, com planos de expansão futura.

A empresa afirma que continuará trabalhando para melhorar as salvaguardas e reduzir falsos positivos, à medida que modelos mais capazes forem lançados nos próximos meses. Interessados em participar dos programas de acesso confiável podem se inscrever para notificações.

Artigos relacionados

Assine nossa newsletter e receba novidades em seu e-mail: