跳转到主要内容

Claude Fable 5 vs GLM-5.2:Fable 暂停后,哪个路线现在能测试?

A
9 分钟阅读AI Model Comparison

截至 2026 年 6 月 14 日,Fable 5 是等待复核路线,GLM-5.2 是可以按 Z.AI Coding Plan 做小范围测试的路线;不要在没有同一任务证据前替换默认模型。

Claude Fable 5 vs GLM-5.2:Fable 暂停后,哪个路线现在能测试?

Claude Fable 5 和 GLM-5.2 现在不是两条同等可运行的选择。按 2026 年 6 月 14 日复核到的官方材料,Anthropic 已说明 Fable/Mythos 访问被停用,所以 Fable 5 只能作为等待复核的分支;Z.AI 文档把 GLM-5.2 放在 GLM Coding Plan 里,因此 GLM-5.2 是可以先做小范围 Coding Agent 测试的分支。

这不等于 GLM-5.2 自动替代 Fable 5。你不能因为一边暂时跑不了,另一边在文档里可见,就把生产默认模型改掉。正确顺序是:先确认当前可用性,再用同一个 repo、同一个 issue、同一个 prompt、同一组工具权限和同一条验收测试来测,最后才讨论谁更适合你的工作流。

分支什么时候走第一动作停止规则
等 Fable 5你必须评估 Anthropic 自有模型行为、账单、策略或 fallback。重新检查 Anthropic access statement、model docs 和 pricing docs。如果当前不能运行 Fable 5,就不要给它的实时任务表现打分。
小测 GLM-5.2你需要本周能跑的 Coding Agent 路线。在 Z.AI Coding Plan 里确认 GLM-5.2 或 GLM-5.2[1m],再跑一个边界清晰的小任务。任务没有通过、延迟和配额没有记录、回滚成本不可控时,不叫替代。
保留双跑包你正在考虑团队默认模型或生产路由变更。保存同一任务包,等 Fable 恢复后再跑同一组输入。没有两边都可运行的同一任务证据,就没有胜负结论。

证据提示: 本文使用的 Anthropic Fable 发布页、访问状态、模型与价格文档,以及 Z.AI GLM Coding Plan 文档,复核时间是 2026 年 6 月 14 日。模型可用性、配额、价格和路由随时可能变,发布或改默认路由前要回到官方文档重新确认。

快速结论:先问能不能跑

如果你的问题是“今天该先测试谁”,答案不是按模型名排强弱,而是按路线排。Fable 5 当前不是一个适合开始 live Coding Agent 评测的分支,因为 Anthropic 的访问说明写明 Fable 5 和 Mythos 5 已对所有客户停用。它的上下文、输出上限、价格行和模型 ID 仍然有参考价值,但在不可访问期间不能拿来跑同一任务。

GLM-5.2 则是可以先验证的分支。Z.AI 最新模型文档列出了 GLM Coding Plan 对 GLM-5.2 的支持,工具集成文档也给出 OpenAI-compatible 的 coding provider 路径和 GLM-5.2 / GLM-5.2[1m] 这类标签。这个证据足够让你做 smoke test,但还不足以让你写“GLM-5.2 全面胜出”。

把“先测谁”和“谁更好”分开,会少很多误判。前者是可用性问题,后者是同一任务证据问题。现在可以先测 GLM-5.2;如果 Fable 恢复访问,再把保存好的任务包拿去双跑,而不是拿新任务去对比旧印象。

本地讨论容易把问题讲成一场戏

中文讨论里很容易把这件事包装成“Fable 全面封禁、GLM-5.2 全面放开”的戏剧化叙事。这个叙事抓住了时间线,但容易漏掉两个关键边界:第一,Fable 不可用时不能公平参与 live task;第二,GLM-5.2 可见并不等于它已经通过你的代码库、测试、延迟和回滚标准。

所以不能只写“国产替代”或“全面开放”。真正要做的是把信息分层:官方访问状态归 Anthropic,GLM Coding Plan 归 Z.AI,生产默认模型归自己的任务验收,视频或论坛实测只能作为线索,不能代替你自己的同一任务包。

更稳的处理方式是不要把封禁新闻和模型能力揉成一个结论,而是回到操作层。你要先确认哪条路线能跑,再确认单位怎么计费,最后确认这条路线是否能在你的 repo 里交出可审查的 diff。

本周真正改变的是可用性

Anthropic 在 2026 年 6 月 9 日宣布 Claude Fable 5。几天后,独立的 Fable/Mythos access statement 说明 Fable 5 和 Mythos 5 因美国政府指令需要对所有客户停用。这个变化让任何“Fable vs GLM”的静态表格都不完整,因为表格如果不先写可用性,就会暗示两边都能被同样测试。

Z.AI 的证据层不同。GLM-5.2 不是在本文证据里以一个通用 API 发布页出现,而是作为 GLM Coding Plan 的文档化路线出现。文档提到 GLM-5.2 支持,并在工具路径里展示了 GLM-5.2 与 1M context 相关配置。正确读法是:这里有一条需要你验证的路线,而不是所有 wrapper、旧 GLM 对比页、社交媒体截图都自动适用。

Claude Fable 5 与 GLM-5.2 时间线

如果你无法运行 Fable,就不要给 Fable 的同一任务表现打分。如果你能运行 GLM-5.2,也不要因为它能跑就直接升级为默认。可用性只决定测试顺序,不决定生产信任。

官方合同表:谁拥有哪条说法

合同点Claude Fable 5GLM-5.2
先找谁确认AnthropicZ.AI
2026-06-14 当前状态Fable/Mythos 访问说明显示不可用。GLM Coding Plan 文档中可见。
需要盯的模型标签claude-fable-5glm-5.2 与 glm-5.2[1m]
上下文边界Anthropic 文档列出 1M context 与 128k output,但当前不可运行。Z.AI coding route 记录 1M context 类路线。
成本单位Anthropic 是 per-million-token 价格行。Coding Plan 是配额或倍率消耗规则。
对 Coding Agent 的含义规格强,但当前只能等待复核。可先做小范围任务验证。
不能证明什么不能证明今天能跑 Fable。不能证明 GLM-5.2 更强或可替代所有默认模型。

这个表的作用不是颁冠军,而是让你知道每条说法应该回到哪个系统复核。Anthropic 负责 Fable 访问、模型文档和价格行;Z.AI 负责 GLM Coding Plan 路线;你自己的 repo、测试和日志负责生产可用性。

如果你的真实工作流是 Claude Code,还要额外分清配置归属。使用第三方 provider/base URL 是路由配置问题,不是模型能力问题。Claude Code 的配置边界可以参考 Claude Code API 配置,凭证和账单归属可以参考 Claude Code API Key 与订阅账单

成本不能直接用一行价格比出来

Fable 5 和 GLM-5.2 的成本单位不一样。Fable 有官方 token 价格行;本文证据里的 GLM-5.2 主要是 Coding Plan 路线,使用配额和倍率规则。把“每百万 token 多少钱”和“一个计划里扣多少配额”直接相除,得到的往往不是可执行结论。

一个 Coding Agent 任务的真实成本还包括工具调用、长上下文、失败重试、人工 review、CI 时间和回滚。便宜的失败尝试并不便宜;昂贵但一次通过的任务也可能更划算。你需要用同一任务测这些变量,而不是拿营销表格或视频标题决定。

Claude Fable 5 与 GLM-5.2 成本单位对照

需要记录的单位为什么必须记录
prompt tokens复制整个 repo 上下文时,输入成本或配额消耗会放大。
output tokenspatch 说明、日志和长回答可能让输出成为主要成本。
工具调用Coding Agent 路线常被工具使用模式影响。
延迟便宜但卡住 review 或 CI 的路线未必便宜。
通过/失败失败任务会转化成人工修复成本。
重试次数重试会同时烧配额、时间和信任。
回滚成本错 patch 的真实成本经常不在账单里。

如果这些行还没有数据,就应该说“单位暂不可比”。这句话比一个看似自信但不能复现的价格胜负更有用。

什么时候值得先测 GLM-5.2

当你的问题是“Fable 暂停期间,我本周还能把哪个 Coding Agent 路线拿来试一下”,GLM-5.2 值得优先小测。适合的任务包括边界清楚的仓库修复、可复现的测试失败、迁移清单、文档生成、低风险重构和能快速 review 的补丁。

不适合先测 GLM-5.2 的情况也要写清楚。如果你必须评估 Anthropic 特有策略、账单、fallback 语义、Claude Code 原生行为,或者你要做真正的 Fable 对照实验,那就应该等待 Fable 可运行再开始。安全敏感、合规敏感、回滚困难或需要深入业务上下文的任务,也不应该把一次 smoke test 结果当默认模型依据。

测试 GLM-5.2 时,先把范围缩小。不要让模型同时改架构、改测试、改 lint、改部署脚本。一个任务只验证一个能力:能不能理解 issue、给出可 review 的 diff、通过指定测试、保持日志可追踪、失败时容易回滚。

不要现在就更换默认模型

默认模型是生产决策,不是新闻判断。Fable 暂停访问可以决定测试顺序,但不能替你决定生产信任。GLM-5.2 即使在一个小任务上表现不错,也只说明它通过了这一类任务的初步验证。

更换默认前,至少要满足这些条件:任务包完全相同,验收条款完全相同,日志和 diff 能保存,延迟和配额可接受,失败原因可解释,回滚路径清楚,团队知道何时退回原路线。

更换前要求通过条件
同一任务包repo、issue、prompt、文件范围、工具权限和时间预算一致。
同一验收条款测试、review 清单和失败预算一致。
同一证据包保存命令日志、diff、测试输出、延迟、配额和失败原因。
同一回滚计划知道如何 revert、隔离或重跑。
同一决策阈值事先定义“足够好”和“必须回退”。

如果 Fable 恢复访问,应该用保存的同一任务包重跑。不要拿 GLM-5.2 的新任务去对比 Fable 的旧印象,也不要拿 Fable 的发布规格去对比 GLM-5.2 的真实执行日志。

同一任务评估清单

最干净的测试应该刻意变小。选一个 repo、一个 issue、一条验收测试。任务要足够真实,能暴露模型行为;也要足够小,让 review 不靠猜。

Claude Fable 5 与 GLM-5.2 同一任务评估清单

  1. 锁定输入:prompt、branch、文件范围、issue 描述、工具权限、时间预算。
  2. 通过 Z.AI 文档化 coding route 运行 GLM-5.2。
  3. 保存模型标签、provider route、命令日志、diff、测试输出、延迟、配额备注和失败原因。
  4. 只看可观察结果:patch 质量、测试是否通过、重试次数、review 负担、回滚成本。
  5. Fable 恢复后,使用同一任务包重跑,不改 prompt 和验收标准。
  6. 两边都可运行后,再比较被验收任务的成本和失败模式,而不是比较名称热度。

这样得到的结论才可防守。可以说“GLM-5.2 在我们的迁移任务里一次重试后通过,配额消耗可接受”。不能说“GLM-5.2 赢了,因为 Fable 现在跑不了”。

常见问题

Claude Fable 5 现在能用吗?

按 2026 年 6 月 14 日复核到的 Anthropic access statement,Fable 5 和 Mythos 5 访问已对所有客户停用。计划任何 Fable 测试前,都要重新检查 Anthropic 当前访问状态、模型文档和价格页。

GLM-5.2 比 Claude Fable 5 更好吗?

现在不能给公平的 live 结论,因为 Fable 5 当前不可运行。GLM-5.2 是可以先测试的路线,但“更好”需要两边都用同一任务、同一输入和同一验收标准跑出可观察结果。

应该看哪个模型字符串?

Fable 侧看 Anthropic 文档中的 claude-fable-5 和当前访问状态。GLM 侧看 Z.AI 文档中的 glm-5.2 与 glm-5.2[1m],特别是 Coding Plan 和 1M context 路线是否在你的工具里可选。

GLM-5.2 一定更便宜吗?

不能简单说一定更便宜。Fable 是 token 价格行,GLM-5.2 在本文证据里是 Coding Plan 配额和倍率规则。只有同一任务的 tokens、工具调用、重试、延迟和通过率被记录后,才能讨论真实成本。

可以把 GLM-5.2 当 Fable 替代吗?

可以把 GLM-5.2 当作当前可测试路线,不要直接当作 Fable 替代。等 Fable 恢复后再用同一任务包双跑;在此之前,GLM-5.2 最多是你当前工作流里的候选分支。

结论

这篇比较真正要解决的不是“哪个名字更强”,而是“哪条路线现在能被诚实测试”。截至 2026 年 6 月 14 日,Fable 5 有官方规格但访问暂停,GLM-5.2 有 Z.AI Coding Plan 文档化路线并可先做小范围验证。

所以顺序应该是:先复核 Fable 状态;再验证 GLM-5.2 路由;用同一任务测成本、质量、延迟、重试和回滚;最后才讨论默认模型。只要少了同一任务证据,就不要把可用性差异写成模型胜负。

分享文章:

laozhang.ai

一个 API,所有 AI 模型

AI 图片

Gemini 3 Pro Image

$0.05/张
官方2折
AI 视频

Sora 2 · Veo 3.1

$0.15/个
异步API
AI 对话

GPT · Claude · Gemini

200+ 模型
同官方价
已服务 10万+ 开发者
|@laozhang_cn|送$0.1