科技·商业·财经

科技新赛道:阿里云“芯-云-模型-推理”全栈升级,引领Agent化时代

   时间:2026-05-20 21:17 作者:钟景轩

在近期举办的阿里云峰会上,一场围绕智能体(Agent)的技术变革正式拉开帷幕。阿里云宣布完成从芯片到推理引擎的全栈Agent化升级,推出全新AI产品官网“千问云”、搭载自研AI芯片“真武M890”的超节点服务器,以及旗舰大模型Qwen3.7-Max。这一系列动作标志着国内云厂商首次以Agent为核心,构建完整的技术产品体系。

阿里云此次升级的逻辑源于对行业趋势的判断:云与AI的消费主体正从人类转向智能体。就在峰会前一天,谷歌在I/O开发者大会上宣布将开发平台Antigravity升级为agent-first架构,并推出定位为“24/7个人智能体”的Gemini Spark。两大科技巨头的同步动作,印证了智能体作为AI下一阶段核心载体的共识。然而,要实现围绕Agent的全栈重构,需同时具备底层芯片、云计算基础设施和前沿大模型三方面的自研能力——全球范围内,仅有少数企业具备这一条件。

阿里云资深副总裁刘伟光指出,Agent突破临界点后将具备24小时不间断工作的能力,其对算力和云服务的需求将呈现指数级增长。为适应这一变化,阿里云决定重构整个技术体系。以新上线的“千问云”为例,该平台为人类用户和智能体设计了差异化入口:人类开发者可通过界面体验模型对比、API接入等功能;而智能体则通过一条标准化指令直接调用平台能力,实现自主决策与任务执行。

在芯片层面,阿里云发布了基于新一代AI芯片“真武M890”的磐久AL128超节点服务器。该服务器搭载自研互联芯片ICN Switch 1.0,通过128张AI芯片的协同工作,将P2P时延控制在150纳秒以内,可满足Agent场景下海量并发推理和大模型训练的需求。据介绍,真武M890的显存容量达144GB,片间互联带宽800GB/s,支持从FP32到FP4的多种数据精度,性能较上一代提升3倍。平头哥半导体副总裁高慧表示,Agent时代对算力、网力、存力的协同要求极高,全栈自研芯片矩阵是实现系统级优化的关键。目前,真武系列芯片已累计出货56万片,服务于中国电信、中国一汽等400多家客户。

云平台的改造是另一项核心工程。传统云产品以人类操作为设计前提,通过控制台、菜单等交互方式提供服务;而Agent的工作负载具有“无规律弹性、短生命周期、瞬时起量即走”的特点,与稳态云计算模式截然不同。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,将每个产品转化为智能体可调用的标准化能力模块。例如,开发者仅需一句自然语言指令,Agent即可完成从资源识别到应用部署的全流程。目前,千问云已封装150多款主流模型的API,支持OpenClaw、Hermes Agent等框架快速接入。

驱动智能体的核心是模型能力。阿里云推出的Qwen3.7-Max在第三方评测机构Arena的全球大模型盲测中位列国产模型第一,与GPT、Claude等国际顶尖模型接近。更引人注目的是其实战表现:在未接触过的真武M890芯片上,Qwen3.7-Max仅凭任务说明,在35小时内自主完成432次内核评估和1158次工具调用,最终编写并调优了一个生产级AI计算内核,性能较官方参考实现提升10倍。这一案例表明,大模型正从“辅助人类”转向“自主执行任务”,其能力边界已延伸至芯片级优化领域。

规模化落地的问题则由百炼平台解决。该平台构建了大规模GPU资源集群,通过并池调度、上下文缓存等技术应对并发挑战,同时内建安全治理能力,确保智能体在预设权限范围内运行。生态策略上,百炼采取开放接入模式,除自研的千问模型矩阵外,还引入了智谱GLM-5.1、月之暗面Kimi K2.6等第三方模型。阿里云CTO李飞飞强调,在Agent自主运行的场景下,平台需通过模型丰富度和低切换成本建立优势,而非依赖单一模型。

资本市场的反馈印证了这一战略的前瞻性。阿里最新财报显示,其AI模型及应用服务的年度经常性收入(ARR)已超过80亿元,预计年底突破300亿元,消息公布当日股价上涨8%。截至2026年3月,百炼平台客户数量同比增长8倍,token消耗规模显著提升。管理层预计,Agent驱动的模型即服务(MaaS)收入将取代传统计算服务(ECS),成为阿里云最大的产品线。这一转变意味着云服务的计量单位从“算力时长”转向“token消耗量”,而智能体7×24小时的工作特性,将彻底打破人类工作时长对云增长的天花板限制。

 
 
更多>同类内容
全站最新
热门内容