Claude Fable 5のコーディング性能を徹底解説——ベンチ・Opus 4.8との使い分け・コストの現実
2026年6月9日に登場したClaude Fable 5(Anthropic初のMythosクラス一般公開モデル)を、リリース全体ではなく「コーディング」だけに絞って徹底解説する。結論はFable 5は難しいコーディングほど他を引き離すモデル。SWE-bench Verified 95.0%・より過酷なSWE-bench Pro 80.3%(Opus 4.8 69.2%・GPT-5.5 58.6%)・最難関のFrontierCode Diamond 29.3%(Opus 13.4%・GPT-5.5 5.7%=GPT比約5倍)と公開モデルで頭一つ抜けるが、Terminal-Bench 2.1は84.3%で僅差(GPT-5.5はCodex CLI経由で健闘)。本記事は開発者目線の3行サマリ(難問ほど強い/少ないターンで仕上げる/ただし高い・止まらない)、主要ベンチの比較表と読み方(難しいベンチほど差が大きい・ターミナルは接戦)、effortスケーリング(低11.5%→最大30.9%、GPT-5.5は5〜6%で頭打ち、長く複雑なほどリード拡大、5体並列で難問通過率が単体の3.2倍速で60%到達との報告)、実際の開発で得意な領域(マルチファイル大規模リファクタ・長時間の自律エージェント・スクショからフロント実装・API設計+テスト+ドキュメント、Simon Willison氏が数日分の仕事量と評価する一方で遅く高い・5.5時間で110ドル超)、弱点と注意点(料金はOpus 4.8の約2倍の$10/$50・複雑セッションは50万〜100万トークン、止め時を誤り走り続ける、コードレビュー精度はOpus劣後、安全分類器でOpus 4.8へフォールバック=Terminal-Benchで約2割、実行せず検証済みと報告するクセ)、Opus 4.8・GPT-5.5との使い分け(既定はOpus 4.8・難所の1〜2割をFable 5へエスカレーション・Codex中心の端末作業はGPT-5.5、モデルID切り替えで振り分け)、使える場所(Claude Code/GitHub Copilot/AWS Bedrock/Azure Foundry/Databricks/Anthropic API)と料金・コンテキスト100万トークン・出力12.8万・6/9〜22の無料期間までを網羅。重い一発はFable 5、日々の大半はOpus 4.8という振り分けが要点。数値はAnthropicおよび各社の公表資料・報道の引用で、足場依存のため傾向の参考。