科技新赛道：阿里云“芯-云-模型-推理”全栈升级，引领Agent化时代-网界

在近期举办的阿里云峰会上，一场围绕智能体（Agent）的技术变革正式拉开帷幕。阿里云宣布完成从芯片到推理引擎的全栈Agent化升级，推出全新AI产品官网“千问云”、搭载自研AI芯片“真武M890”的超节点服务器，以及旗舰大模型Qwen3.7-Max。这一系列动作标志着国内云厂商首次以Agent为核心，构建完整的技术产品体系。

阿里云此次升级的逻辑源于对行业趋势的判断：云与AI的消费主体正从人类转向智能体。就在峰会前一天，谷歌在I/O开发者大会上宣布将开发平台Antigravity升级为agent-first架构，并推出定位为“24/7个人智能体”的Gemini Spark。两大科技巨头的同步动作，印证了智能体作为AI下一阶段核心载体的共识。然而，要实现围绕Agent的全栈重构，需同时具备底层芯片、云计算基础设施和前沿大模型三方面的自研能力——全球范围内，仅有少数企业具备这一条件。

阿里云资深副总裁刘伟光指出，Agent突破临界点后将具备24小时不间断工作的能力，其对算力和云服务的需求将呈现指数级增长。为适应这一变化，阿里云决定重构整个技术体系。以新上线的“千问云”为例，该平台为人类用户和智能体设计了差异化入口：人类开发者可通过界面体验模型对比、API接入等功能；而智能体则通过一条标准化指令直接调用平台能力，实现自主决策与任务执行。

在芯片层面，阿里云发布了基于新一代AI芯片“真武M890”的磐久AL128超节点服务器。该服务器搭载自研互联芯片ICN Switch 1.0，通过128张AI芯片的协同工作，将P2P时延控制在150纳秒以内，可满足Agent场景下海量并发推理和大模型训练的需求。据介绍，真武M890的显存容量达144GB，片间互联带宽800GB/s，支持从FP32到FP4的多种数据精度，性能较上一代提升3倍。平头哥半导体副总裁高慧表示，Agent时代对算力、网力、存力的协同要求极高，全栈自研芯片矩阵是实现系统级优化的关键。目前，真武系列芯片已累计出货56万片，服务于中国电信、中国一汽等400多家客户。

云平台的改造是另一项核心工程。传统云产品以人类操作为设计前提，通过控制台、菜单等交互方式提供服务；而Agent的工作负载具有“无规律弹性、短生命周期、瞬时起量即走”的特点，与稳态云计算模式截然不同。为此，阿里云对云产品进行了Skill化、MCP化和CLI化改造，将每个产品转化为智能体可调用的标准化能力模块。例如，开发者仅需一句自然语言指令，Agent即可完成从资源识别到应用部署的全流程。目前，千问云已封装150多款主流模型的API，支持OpenClaw、Hermes Agent等框架快速接入。

驱动智能体的核心是模型能力。阿里云推出的Qwen3.7-Max在第三方评测机构Arena的全球大模型盲测中位列国产模型第一，与GPT、Claude等国际顶尖模型接近。更引人注目的是其实战表现：在未接触过的真武M890芯片上，Qwen3.7-Max仅凭任务说明，在35小时内自主完成432次内核评估和1158次工具调用，最终编写并调优了一个生产级AI计算内核，性能较官方参考实现提升10倍。这一案例表明，大模型正从“辅助人类”转向“自主执行任务”，其能力边界已延伸至芯片级优化领域。

规模化落地的问题则由百炼平台解决。该平台构建了大规模GPU资源集群，通过并池调度、上下文缓存等技术应对并发挑战，同时内建安全治理能力，确保智能体在预设权限范围内运行。生态策略上，百炼采取开放接入模式，除自研的千问模型矩阵外，还引入了智谱GLM-5.1、月之暗面Kimi K2.6等第三方模型。阿里云CTO李飞飞强调，在Agent自主运行的场景下，平台需通过模型丰富度和低切换成本建立优势，而非依赖单一模型。

资本市场的反馈印证了这一战略的前瞻性。阿里最新财报显示，其AI模型及应用服务的年度经常性收入（ARR）已超过80亿元，预计年底突破300亿元，消息公布当日股价上涨8%。截至2026年3月，百炼平台客户数量同比增长8倍，token消耗规模显著提升。管理层预计，Agent驱动的模型即服务（MaaS）收入将取代传统计算服务（ECS），成为阿里云最大的产品线。这一转变意味着云服务的计量单位从“算力时长”转向“token消耗量”，而智能体7×24小时的工作特性，将彻底打破人类工作时长对云增长的天花板限制。