Na terça-feira (09/06), a Anthropic — dona do Claude — colocou no ar o Claude Fable 5, o modelo de inteligência artificial mais poderoso que a empresa já liberou para o público geral. E sim: os números impressionam, eu testei e vou te contar o que achei. Mas tem um detalhe que ninguém consegue ignorar: a mesma empresa que, dias antes, saiu avisando que a IA está ficando perigosa demais acabou de entregar seu modelo mais forte para qualquer pessoa com cartão de crédito.
O que é o Fable 5 — e o tal do “Mythos”
O Fable 5 é a versão pública de um modelo que a Anthropic chama internamente de Mythos 5 — um modelo de capacidade altíssima que até agora só rodava com um grupo fechado de parceiros em cibersegurança e biologia. Por baixo, os dois são a mesma coisa: os mesmos “pesos” (o cérebro do modelo, o resultado do treinamento). O que separa um do outro são as travas de segurança. O Fable é o gêmeo domado, liberado pra todo mundo. O Mythos, o gêmeo sem trava, segue trancado a sete chaves com parceiros selecionados.
Os números que impressionam
Em testes padronizados de programação (chamados de benchmarks — provas que servem pra comparar modelos lado a lado), o Fable 5 marcou 80,3% no SWE-Bench Pro, que mede a capacidade de resolver bugs reais de software. São 11 pontos de vantagem sobre o segundo colocado — uma distância enorme nesse tipo de disputa. E pra mostrar que o modelo realmente enxerga o que está na tela, ele zerou o jogo Pokémon FireRed olhando só os pixels da imagem, sem mapa e sem nenhuma ajuda externa. Não é truque de marketing: significa que ele entende e raciocina sobre imagens em tempo real.
Uma semana de testes: o que me surpreendeu
O destaque, disparado, é o modo de trabalho em equipe. Pedi um “code review completo” (uma revisão geral do meu programa) e vi o Fable abrir centenas de agentes em paralelo — agentes são pequenos programas de IA que executam tarefas sozinhos. Ele colocou basicamente um agente cuidando de cada arquivo do meu aplicativo, ao mesmo tempo. Achou bugs, casos extremos, documentação faltando e até melhorias de experiência do usuário espalhadas pelo código. Dei exatamente o mesmo pedido pra outros modelos, e nenhum chegou perto de achar tanta coisa.
Ele também é absurdamente autônomo. Topa muito mais do que qualquer Claude ou GPT anterior, e sai sozinho trabalhando por horas seguidas. E o melhor: eu confiei que ele ia entregar o que pedi. Ele queima uma montanha de recursos (os tais “tokens”, as fichinhas que medem quanto a IA processa de texto) pra chegar lá, mas chega. Toda vez que eu acionava o Fable, parecia que ele tinha vontade de encarar um projeto gigante.
Foi a primeira vez que me senti à vontade pra entregar tarefas enormes e complicadas pra um modelo. Mais do que com qualquer outro que já usei. E é aí que ele realmente brilha: tarefas longas, daquelas que levam horas ou dias. É difícil imaginar até onde vai o limite de fôlego desse modelo.
…e o que me incomodou
Não é um modelo perfeito. Primeiro: ele é verborrágico demais. As explicações afundam nos detalhes num piscar de olhos. Eu até mexi no arquivo de instruções (o claude.md, onde você dá as regras de como o modelo deve se comportar) pra segurar, e nem assim resolveu. Vivia tendo que pedir pra ele explicar de forma mais simples. A densidade de informação era tanta que, sinceramente, me deu a sensação de ser burro em alguns momentos.
Segundo: ele ama fazer pergunta. Um pedido simples vira uma novela — ele pergunta, resume suas respostas, pede confirmação do resumo, monta um plano, pede confirmação do plano, confirma a abordagem e só então começa. Eu queria que ele tomasse essas decisões por mim. A Anthropic diz que isso melhora com um ajuste nas instruções internas do modelo.
Terceiro: ele parece lento. Mais lento que os Opus anteriores e até que o GPT. Demora pra começar e leva seu tempo mastigando o problema. O que eu sempre amei no Opus era a velocidade — ele achava o caminho mais curto pra resposta. O Fable é o contrário: até em tarefas simples ele se arrasta. Cinco minutos depois, o cronômetro subindo e pouquíssimo texto produzido. Ele quer ser o mais minucioso possível, e isso custa tempo.
Dica de quem testou
Abaixe o “nível de esforço” do modelo — bem mais do que você acha que precisa. Mesmo no ajuste do meio, ele pensa muito. E mesmo no esforço baixo continua absurdamente capaz, raciocinando por um bom tempo antes de responder. Vale o tempo de calibrar.
O preço — e a contradição que fica
Tudo isso tem um custo, literalmente. O Fable 5 sai por US$ 10 por milhão de fichas de entrada e US$ 50 por milhão de saída — o dobro do Claude Opus 4.8 e o dobro do GPT-5.5 na entrada. É caro. Pra empresas brasileiras que já sentem o câmbio nas costas, um modelo desse nível em uso intenso facilmente bate dezenas de milhares de reais por mês. Não é pra qualquer projeto.
E aí volta o ponto que mais me incomoda. A Anthropic passou meses construindo a imagem de empresa que leva segurança a sério. A solução que ela encontrou pro Fable foi um “porteiro” automático: quando o pedido envolve cibersegurança, biologia ou química sensível, a resposta é desviada pra um modelo mais fraco e mais seguro, o Opus 4.8. Isso só dispara em menos de 5% das conversas. Tudo bem. Mas a empresa que avisou em público que a IA está ficando perigosa demais lançou seu modelo mais forte poucos dias depois. Não invalida o discurso — só pede que a gente leia ele com mais cuidado.
Vale a pena testar?
Se você assina Claude Pro, Max, Team ou Enterprise, dá pra brincar com o Fable 5 de graça até 22 de junho. Depois disso, o preço fala por si. Meu veredito da semana: é o modelo mais capaz que já usei. Ele parecia querer as minhas tarefas mais difíceis, e qualquer coisa menor que isso não servia. As manias — a lentidão, a verborragia, a mania de perguntar — são todas ajustáveis com tempo e otimização. O que eu não consigo parar de pensar é que isso é só o primeiro vislumbre de um treinamento novinho em folha, e já é o mais forte que vi até hoje.
— Sommer, Helena e um agente de IA.
Fonte: Anthropic · Imagem de capa: Foto de Juanjo Jaramillo no Unsplash