Ilustração oficial da anthropic para claude fable 5 e claude mythos 5

Anthropic volta a liberar Claude Fable 5 após suspensão por controles de exportação

Avatar de bruno martinez
A Anthropic anunciou a volta global do Claude Fable 5 em 1º de julho, com novas salvaguardas de cibersegurança, contexto regulatório dos EUA e ligação direta com o Project Glasswing.

A Anthropic anunciou que vai voltar a liberar o Claude Fable 5 globalmente a partir desta quarta-feira, 1º de julho, depois da suspensão temporária provocada por controles de exportação dos Estados Unidos. Segundo a empresa, o modelo retorna com novas salvaguardas de cibersegurança, um classificador de segurança reforçado e a proposta de um novo framework da indústria para avaliar a gravidade de jailbreaks em IA.

Ilustração oficial da anthropic para claude fable 5 e claude mythos 5
Imagem oficial divulgada pela Anthropic para o lançamento do Claude Fable 5 e Claude Mythos 5

O que aconteceu com o Claude Fable 5

De acordo com a Anthropic, o governo dos Estados Unidos aplicou em 12 de junho controles de exportação aos novos modelos Claude Fable 5 e Claude Mythos 5. Como a ordem passou a valer imediatamente e a empresa disse não ter uma forma confiável de verificar nacionalidade em tempo real, o acesso aos dois modelos foi suspenso para todos os usuários.

Agora, com a retirada dessas restrições em 30 de junho, a companhia afirma que o Fable 5 volta a ficar disponível a partir de 1º de julho no Claude Platform, no Claude.ai, no Claude Code e no Claude Cowork. Em planos Pro, Max, Team e em parte dos planos Enterprise, o modelo ficará incluído em até 50% do limite semanal até 7 de julho; depois disso, passará a usar créditos de consumo.

Esse retorno acontece poucas semanas depois do anúncio original de lançamento, publicado pela Anthropic em 9 de junho. Na ocasião, a empresa apresentou o Claude Fable 5 como um modelo de classe Mythos adaptado para uso geral, com salvaguardas mais rígidas do que as do Claude Mythos 5, versão reservada a um grupo menor de parceiros de cibersegurança e infraestrutura.

A Anthropic também liga a suspensão temporária ao novo ambiente regulatório dos EUA. A empresa cita a ordem executiva Promoting Advanced Artificial Intelligence Innovation and Security, assinada pela Casa Branca em 2 de junho, como parte do contexto que ampliou a pressão por controles mais duros em modelos avançados com potencial uso em segurança ofensiva.

Por que o modelo foi restringido

A Anthropic diz que a medida veio após um relatório em que pesquisadores da Amazon teriam encontrado uma forma de contornar as salvaguardas do Fable 5, levando o modelo a identificar vulnerabilidades de software e, em um caso, gerar código demonstrando como uma falha poderia ser explorada.

Na avaliação da empresa, porém, esse comportamento não revelava capacidades ofensivas exclusivas do nível Mythos. A companhia afirma que o caso envolvia um cenário de borda dentro da margem de segurança do Fable 5 e que outros modelos menos avançados também conseguiram chegar a resultados semelhantes em seus testes.

Quais salvaguardas foram adicionadas

Para recolocar o modelo no ar, a Anthropic informa ter treinado um classificador de segurança aprimorado, voltado especificamente para bloquear o comportamento descrito no relatório. Quando um pedido for barrado, o usuário será avisado e a solicitação será redirecionada ao Claude Opus 4.8.

Segundo a empresa, a nova proteção bloqueia a técnica citada no relatório em mais de 99% dos casos. A Anthropic reconhece, no entanto, que o reforço também pode aumentar falsos positivos em tarefas legítimas de programação e depuração, algo que ela promete continuar ajustando.

No texto, a companhia também reforça a diferença entre os dois modelos: enquanto o Claude Mythos 5 teria capacidades muito mais fortes para encontrar e explorar vulnerabilidades, o Fable 5 foi lançado com as salvaguardas mais rígidas já aplicadas pela empresa para uso geral.

Novo framework para medir jailbreaks

Outro anúncio importante da Anthropic é a criação de um framework de consenso para classificar a gravidade de jailbreaks em IA. A empresa diz estar trabalhando nessa proposta com Amazon, Microsoft, Google e outros parceiros do programa Glasswing.

A ideia é definir critérios comuns para medir o impacto de um jailbreak, a capacidade que ele entrega a um atacante e a velocidade com que isso pode se transformar em um problema no mundo real. Para a Anthropic, a ausência de um padrão compartilhado aumenta a incerteza sempre que uma nova técnica de contorno aparece.

A empresa também informou que vai lançar um novo programa no HackerOne para que pesquisadores de segurança enviem possíveis jailbreaks cibernéticos encontrados no Fable 5.

Essa discussão se conecta ao Project Glasswing, iniciativa da Anthropic voltada ao uso defensivo de modelos avançados para identificar vulnerabilidades em software crítico. Em atualização publicada no começo de junho, a companhia disse ter ampliado o programa para cerca de 150 organizações em mais de 15 países.

Mythos 5 também volta, mas com acesso limitado

Além do Fable 5, a Anthropic afirma ter restaurado o acesso ao Claude Mythos 5 para um grupo de organizações dos Estados Unidos após aprovação do governo em 26 de junho. A companhia diz que continua negociando uma ampliação gradual do acesso para outros parceiros nacionais e internacionais do programa Glasswing.

O movimento mostra como empresas de IA estão tentando equilibrar lançamento comercial, segurança cibernética e pressão regulatória em modelos cada vez mais poderosos. No caso da Anthropic, a volta do Fable 5 acontece acompanhada não só de mudanças técnicas no produto, mas também de uma tentativa de influenciar como o setor inteiro deve reagir a falhas e jailbreaks daqui para frente.

Veja também

Fontes: Anthropic — Redeploying Fable 5, Anthropic — Claude Fable 5 and Claude Mythos 5, Anthropic — Expanding Project Glasswing e The White House — Promoting Advanced Artificial Intelligence Innovation and Security.


Descubra mais sobre Showmetech

Assine para receber nossas notícias mais recentes por e-mail.

Deixe um comentário
Posts Relacionados