科技·商业·财经

实测Claude史上最强模型Fable 5,普通人慎用

   时间:2026-06-10 11:04 作者:格隆汇
对普通人最坏的消息要来了。

就在刚刚,Anthropic 宣布推出 Claude Fable 5 和 Claude Mythos 5。其中,Fable 5 是 Anthropic 首个面向公众开放的 Mythos 级模型,Mythos 5 则主要面向少数网络安全防御机构、关键基础设施提供方以及后续进入可信访问计划的生物医学研究者。只是,鲜少有人注意的是,按照官方说明,Fable 5 从现在到 6 月 22 日,会包含在 Pro、Max、Team 和按席位计费的 Enterprise 计划里,不额外收费。到了 6 月 23 日,Fable 5 将从这些订阅计划中移出,继续使用就需要消耗 usage credits。换句话说,过去那种一张「月卡」解锁最强 AI 的模式,或许将一去不复返。对于用户而言,未来需要考虑的可能不只是订阅价格,还有每一次调用、每一次长任务执行背后真实消耗的 token 成本。欢迎进入 Token 计费时代。Claude Fable 5 封神登场,但它也是最狠的「Token 刺客」Anthropic 对 Fable 和 Mythos 的命名也给出了解释。Fable 源自拉丁语 fabula,意为「被讲述的小故事」,含义上接近希腊语 Mythos。两个新名字看起来像两款模型,实际更接近同一底层模型的两个版本。Fable 5 目前面向公众开放,带有更严格的安全限制;Mythos 5 目前只通过 Project Glasswing 计划提供给少数网络安全防御机构和关键基础设施合作方。根据 Anthropic 官方博客的介绍,Fable 5 是该公司目前一般可用模型中能力最强的一款,在软件工程、知识工作、视觉理解、科学研究等方向都有明显提升。任务越长、越复杂,它相对此前 Claude 模型的优势越大。Fable 5 的意义在于,Mythos 级能力第一次大规模面向普通用户开放。基准测试跑分图如下,主打一个遥遥领先。不过,模型名字本身也引发了一些讨论。原 OpenAI Codex 相关负责人 Tibo都发文调侃道,Anthropic 用了 OpenAI 想用但没有用的 Fable 命名。能力层面,软件工程是官方最强调的方向之一。Anthropic 提到,Stripe 在早期测试中让 Fable 5 处理一个 5000 万行 Ruby 代码库的迁移任务。这个工作如果交给一个工程团队手动完成,原本需要两个多月,Fable 5 在一天内完成。Cognition 的 FrontierCode 测试也显示,Fable 5 在复杂生产级代码任务中表现领先。这个评测关注的不是普通代码题,而是模型能否完成困难编程任务,并达到高质量生产代码库的要求。Anthropic 还强调,Fable 5 比此前 Claude 模型更节省 token。当然,这话听听得了,以往每次 Claude 新模型的发布都有类似的表述,但几乎都成了一个个 Token 刺客,为偌大的互联网提供了相当多的笑话。知识工作方面,Fable 5 在 Hebbia 的金融基准测试中拿到最高成绩,提升集中在文档推理、图表理解和复杂问题分析。IMC 的交易分析评测也显示,Fable 5 在事实检索、概念推理、原因分析和期望值分析上都有较强表现。视觉能力也是发布重点。Anthropic 称,Fable 5 能从复杂科学图表中提取精确数字,也能根据网页截图重建应用源码。官方还展示了一个更直观的案例:Fable 5 只依靠游戏画面完成《宝可梦火红》,没有使用额外地图、导航工具或游戏状态信息。此前的 Claude 模型做类似任务,还需要更复杂的辅助系统。长上下文和记忆能力也有提升。Anthropic 在《杀戮尖塔》测试中发现,给模型提供持久化文件记忆后,Fable 5 的表现提升幅度达到 Opus 4.8 的三倍,进入最终章节的频率也提升三倍。生命科学方向更敏感。Anthropic 称,内部蛋白质设计专家使用 Mythos 5,把部分药物设计流程加速约 10 倍。在一个案例里,Mythos 5 借助蛋白质设计和生物信息学工具,在没有人工协助的情况下完成了科学家通常要处理的一整套流程,包括选择结合位点、调用设计工具、处理失败结果。14 个蛋白靶点中,有 9 个产生了值得继续研究的候选方案。生命科学和网络安全能力的提升,也解释了 Anthropic 为什么没有把完整 Mythos 级能力直接放开。Fable 5 面向公众开放时,配套了一套新的安全分类器。只要用户请求涉及网络安全、生物、化学或模型蒸馏等高风险方向,系统就会自动改由 Claude Opus 4.8 响应,并告知用户模型发生了变化。Anthropic 表示,早期数据中,超过 95% 的 Fable 5 会话不会触发这种变化。普通写作、编程、分析、设计、数据处理等任务,大多数情况下仍能使用 Fable 5 本身。但只要进入高风险区域,模型能力就会受到限制。网络安全是限制最严的方向。Anthropic 承认,Mythos 级模型擅长发现和利用软件漏洞,也具备较强的代理式攻击能力,可能覆盖侦察、发现、横向移动等环节。为了避免这种能力被滥用,Fable 5 的网络安全分类器覆盖范围很广。生物和化学方向也类似。Anthropic 认为,模型已经具备完成真实科学任务的能力,过去只屏蔽少数生物武器相关问题已经不够。因此,Fable 5 暂时会在大多数生物和化学相关请求上回退到 Opus 4.8 处理。值得一提的是,Anthropic 还为 Fable 5 加入了一层针对前沿大模型开发的隐藏保护。它主要限制 Claude 协助构建预训练流水线、分布式训练基础设施或 ML 加速器设计等任务,避免模型反过来加速其他机构训练下一代前沿模型。和触发后会切换到 Opus 4.8 的安全限制不同,这类保护不会直接提示用户,而是通过提示词修改、steering vectors 或 PEFT 等方式,降低 Fable 5 在相关任务上的性能。目前也已经有受害者现身说法。截至目前,Claude Fable 5 现已面向全球用户开放。开发者可以通过 Claude API 调用 claude-fable-5。Claude API 和按需付费的 Enterprise 计划从发布日起已经全面可用。Fable 5 和 Mythos 5 的价格相同,均为每百万输入 token 10 美元,每百万输出 token 50 美元。按照 Anthropic 的说法,这已经低于 Claude Mythos Preview 的一半,但对于高强度长任务来说,价格仍然不低。AI 终于数清了 6 根手指比起官方博客,实测更能说明 Fable 5 到底变强在哪里。根据我的实测,Fable 5 已经能够识别 6 根手指了。恰逢高考结束,我们也拿了道全国高考一卷语文作文题,让它练练手,怎么说呢?整体文风表达比较流畅,并不「普通」。更具体的对比可以参考@ Hypergent 的实测,在小行星可视化任务中,Fable 5 不仅完成数据提取,还设计了包含轨道轨迹和悬停详情的交互式展示,在保证性能的同时提升了信息表达能力。在健身度假村规划任务中,Fable 5 借助 GPT-Image-2 和 Nano Banana 生成更符合实际使用逻辑的场地方案,能够考虑区域连接、功能分布和人流动线,而不仅是简单摆放建筑。

Fable 5 能够把天文现象与可视化表达结合起来,展示太阳耀斑对极光影响的模拟;而 Opus 4.8 甚至未能正常加载。

 
 
更多>同类内容
全站最新
热门内容