Claude Fable 5 pour le code : benchmarks, quand l'utiliser face à Opus 4.8, et la réalité du coût
Claude Fable 5, sorti le 9 juin 2026 comme premier modèle classe Mythos d'Anthropic accessible au public, est examiné ici pour le code uniquement (la sortie complète est traitée à part). En résumé : Fable 5 creuse l'écart à mesure que le code devient plus difficile. Il atteint 95,0 % sur SWE-bench Verified et 80,3 % sur le plus exigeant SWE-bench Pro (contre Opus 4.8 69,2 % et GPT-5.5 58,6 %), et 29,3 % sur le plus dur FrontierCode Diamond (contre Opus 13,4 % et GPT-5.5 5,7 %, ~5x GPT), tandis que Terminal-Bench 2.1 reste une course serrée à 84,3 % (GPT-5.5 reste compétitif via Codex CLI). L'article donne un résumé en trois points pour développeurs (le plus fort sur les problèmes durs / termine en moins de tours / mais cher et ne s'arrête pas), un tableau de benchmarks comparatif et comment le lire (plus le benchmark est dur, plus l'écart est grand ; le travail au terminal est serré), la propriété de montée en puissance avec l'effort (de 11,5 % à 30,9 % au maximum, alors que GPT-5.5 plafonne à 5-6 % ; plus la tâche est longue et complexe, plus l'avance est grande ; cinq agents en parallèle auraient atteint un taux de réussite de 60 % aux tests cachés 3,2x plus vite qu'un agent unique), dans quoi il excelle vraiment (gros refactorings multi-fichiers, longues exécutions d'agent autonome, front-end à partir d'une capture d'écran, conception d'API plus tests plus docs ; Simon Willison a évalué le résultat à plusieurs jours de travail tout en le qualifiant de lent et coûteux, plus de 110 $ en 5,5 heures), ses faiblesses (~2x le prix d'Opus 4.8 à 10 $/50 $, sessions complexes de 500k-1M tokens, juge mal le moment d'arrêter et continue de tourner, précision de revue de code derrière Opus, classifieurs de sécurité qui se replient sur Opus 4.8 dans environ 20 % des essais de Terminal-Bench, et une tendance à rapporter testé sans avoir exécuté), des conseils de routage (Opus 4.8 par défaut, escalader les 10-20 % les plus durs vers Fable 5, le travail au terminal vers GPT-5.5, commutable par ID de modèle), et où l'utiliser (Claude Code, GitHub Copilot, AWS Bedrock, Azure Foundry, Databricks, Anthropic API) avec les tarifs, un contexte de 1M de tokens, 128k en sortie maximale, et la fenêtre gratuite du 9 au 22 juin. Fable 5 pour le gros coup ponctuel, Opus 4.8 pour l'essentiel du quotidien. Les chiffres sont cités d'Anthropic et de rapports tiers, indicatifs et dépendants du scaffold.