Claude Fable 5Claude Opus 4.8 都是 Anthropic 的顶级模型——但答案既不是"永远用 Fable 5",也不是"永远用 Opus 4.8"。正确做法是按任务来选。Fable 5 是最强的,但价格约为 Opus 4.8 的 2 倍,用量额度的消耗也更快。作为日常工作的主力,Opus 4.8 已经足够强大。

本文将两者在性能、价格、功能上并列对比,并通过决策流程和成本感受,梳理清楚何时该选 Fable 5、何时用 Opus 4.8 就够了。文中数值引用自 Anthropic 官方发布,最新数值请以官方为准。

30 秒下结论

赶时间的话看这里就够了

日常工作的绝大部分
Opus 4.8(快、便宜、足够强)
最高难度、长时间的自主作业
Fable 5(顶级,当难度配得上 2 倍价格时)
实务上的推荐
以 Opus 4.8 为主,仅难点用 Fable 5

1. 规格对比(性能、价格、功能)

先看整体。上下文窗口(1M tokens)和最大输出(128K)是相同的,差异体现在智能上限、价格和可用功能上。

项目Claude Fable 5Claude Opus 4.8
定位顶级(面向最高难度作业)Opus 级主力、高度自主
SWE-Bench Pro(高难度编码任务)80.3%69.2%
API 价格(每 100 万 tokens)输入 $10 / 输出 $50输入 $5 / 输出 $25(约一半)
上下文窗口1M1M(相同)
最大输出128K128K(相同)
思考(thinking)始终开启(adaptive,通过 effort 调节深度)adaptive+effort(可关闭)
Fast Mode(约 2.5 倍速)不支持支持
额度消耗快(单价更高)较缓
擅长长时间、自主智能体/最高难度代码日常编码、知识工作、广泛的实务用途

※ 基准测试与价格引用自 Anthropic 官方发布(截至 2026 年)。数值可能变动,使用前请查阅官方页面确认最新信息。

有三点结论。① Fable 5 更聪明(SWE-Bench Pro 上高出 +11.1 分,任务越长差距越大)。② Opus 4.8 价格只有一半(即 Fable 5 是 2 倍)。③ Fast Mode 仅 Opus 4.8 支持——在讲究速度的对话场景中,Opus 的 Fast Mode 很管用。effort(工作量)设置两者都能用,可在深度与成本之间取得平衡。

2. 价格差究竟意味着什么——如何看待 2 倍

Fable 5 的单价正好是 Opus 4.8 的 2 倍(输入 $10 对 $5,输出 $50 对 $25)。而且做同样的工作,它消耗用量额度(订阅上限)也更快。在用不满其性能的任务上,"一律用 Fable 5"很容易变成成本浪费

同样的输出量

Fable 5 成本是 2 倍

例如输出 10 万 tokens,Opus 4.8 是 $2.5,Fable 5 是 $5.0。每天大量运行时,差距会越滚越大。

所以

按难度来选

值得付 2 倍钱的,是难度或长度超出 Opus 4.8 能力范围的任务。只要 Opus 4.8 能搞定,就足够了。

关于价格和订阅更深入的思路,可参考 Claude 价格对比AI 编码成本优化

3. 到底用哪个?——决策流程

按下面的顺序来想,就不会出错。

先用 Opus 4.8 试试

日常的编码、摘要、分析、知识工作的绝大部分用它就够了。又快又便宜。

不够用时再上 Fable 5

用于 Opus 4.8 精度、完成率都不够的最高难度任务——数小时的自主智能体、大规模重构等。

速度优先 → Opus 4.8+Fast

如果对话中的响应速度很重要,就用 Opus 4.8 的 Fast Mode,而不是 Fable 5。

成本紧张 → 降低 effort

两个模型都一样,降低 effort 就能减少消耗。先从这里调起。

经验法则:"先用 Opus 4.8 试试,只有明显不够时才换 Fable 5。"不要一开始就往顶级模型上堆。

4. 两者并用才是正解——以 Opus 4.8 为主,难点交给 Fable 5

实务中最有效的是并用:把 Opus 4.8 设为默认,只把难点丢给 Fable 5。这样既能压低整体成本,又能在关键时刻用上顶级智能。

此外,2026 年 7 月重新上线的 Fable 5 带有一个机制:当请求被安全防护拦截时,会自动改路由到 Opus 4.8(应用中的"切换模型"开关)。开启它后,即便在使用 Fable 5 期间中途触发安全防护,对话也不会中断,而是继续在 Opus 4.8 上进行。实际上,即使以 Fable 5 为主,Opus 4.8 也会成为后备。

💡 实现提示:如果通过 API 搭建,就把默认设为 Opus 4.8,仅当判断某任务难度高时才路由到 Fable 5。不锁定单一模型的设计,对成本和可用性都有好处。

5. 注意事项——可用性与依赖风险

别忘了可用性。Fable 5 曾在 2026 年 6 月因监管被全面暂停,又在 7 月重新上线。顶级模型可能因监管或国家安全等原因,供应状况突然发生变化。加上云端接入(AWS/Google Cloud/Microsoft Foundry)也是分阶段恢复的,不依赖单一模型的设计就是你的保险。详见 AI 依赖风险与应对

反过来说,把供应更广泛、更稳定的 Opus 4.8 放在"地基"位置,不仅在性能和成本上合理,在持续性方面同样明智

总结

  • 智能:Fable 5 > Opus 4.8(SWE-Bench Pro 80.3% vs 69.2%,任务越长差距越大)。
  • 价格:Fable 5 约为 Opus 4.8 的 2 倍($10/$50 vs $5/$25),用量额度的消耗也更快。
  • 功能:1M 上下文窗口和 128K 最大输出相同。Fast Mode 仅 Opus 4.8 支持。
  • 取舍:日常工作用 Opus 4.8,只在最高难度、长时间任务上用 Fable 5。并用(以 Opus 为主+难点用 Fable)最优。触发安全拦截时会自动改路由到 Opus 4.8。
  • 可用性:Fable 5 有过因监管突然变动的先例。要避免依赖单一模型。

FAQ

Q. 到底该把哪个设为默认?

对大多数人和团队来说,把 Opus 4.8 设为默认是稳妥的选择。在日常工作中它在速度、成本、可用性上都有优势,性能也足够。只在 Opus 4.8 明显不够用的最高难度、长时间任务上才切换到 Fable 5——这是性价比最高的用法。

Q. Fable 5 聪明的程度对得起"2 倍价格"吗?

要看任务。在难度高且耗时长的任务上(大规模重构、数小时的自主智能体等),完成率和精度的差异往往足以让 2 倍单价物有所值。而在 Opus 4.8 本就能很好解决的任务上,换成 Fable 5 感受不到多少提升,反而更贵。

Q. 我要速度。Fable 5 和 Opus 4.8 哪个更快?

如果看重对话的响应速度,Opus 4.8 的 Fast Mode(约 2.5 倍速)是有力选择。Fable 5 在设计上会持续思考,遇到高难度任务时单次请求有时会耗上几分钟。速度优先的场景更适合 Opus 4.8。

Q. 怎样在压低成本的同时聪明地使用?

(1) 把默认设为 Opus 4.8;(2) 按用途降低 effort(工作量);(3) 只把难点切换到 Fable 5;(4) 打开安全拦截时的自动改路由——这四点能在性能与成本之间取得平衡。

Q. 如果 Fable 5 又被暂停了怎么办?

由于它此前有过因监管暂停的先例,在生产环境中最安全的做法是准备一个能自动切换到替代模型(如 Opus 4.8)的后备方案。只要做到不依赖单一模型,就能扛住突发的供应中断。