科技·商业·财经

Claude Sonnet 5 正式发布:智能体能力升级,部分性能直追Opus 4.8

   时间:2026-07-01 15:36 作者:苏婉清

Anthropic 正式发布 Claude Sonnet 系列最新模型——Claude Sonnet 5,宣称这是该系列中智能体能力最突出的版本。新模型不仅具备自主规划能力,还能熟练调用浏览器、终端等工具完成复杂任务,标志着智能体技术向实用化迈出重要一步。

开发者可通过 Claude Code 和 Claude Platform 直接调用该模型,API 接口支持指定 "claude-sonnet-5" 参数。这种无缝集成设计使得企业级应用能够快速部署,无需额外适配即可获得最新能力。据测试数据显示,新模型在工具调用效率上较前代提升约 37%,任务完成率提高至 92%。

性能评测显示,Claude Sonnet 5 在智能体搜索基准测试 BrowseComp 中得分较 Sonnet 4.6 提升 29%,计算机操作基准 OSWorld-Verified 测试中改进幅度达 34%。部分场景下其表现已接近旗舰模型 Opus 4.8 的水平,特别是在多步骤任务处理和实时环境交互方面展现显著优势。

安全机制方面,新模型构建了多层级防护体系。通过强化学习训练,其拒绝恶意请求的成功率提升至 98.6%,对提示注入攻击的抵抗能力增强 41%。同时,幻觉率降低至 2.3%,在保持创造力的同时显著提升输出可靠性。测试表明,在处理敏感信息时,模型主动触发安全协议的频率较前代增加 27%。

该模型采用混合架构设计,结合了神经符号推理与实时环境感知模块。这种创新结构使其既能处理抽象规划,又能精准执行具体操作。目前已有超过 1200 家企业参与早期测试,涵盖金融、医疗、物流等多个领域,典型应用场景包括自动化客服、智能运维和科研辅助等。

 
 
更多>同类内容
全站最新
热门内容