在人工智能技术迅猛发展的当下,Agent(智能体)正以惊人的速度重塑企业的工作模式。从撰写深度报告到开发软件,从剪辑家庭视频到自动化处理日常事务,智能体展现出的强大能力让打工人体验到了前所未有的便捷。然而,随着智能体应用的深入,其对底层云服务的需求也日益凸显,一场关于“土地”的变革正在悄然兴起。
在6月5日举行的INSPIRE创想者大会上,华为公司董事、华为云CEO周跃峰提出了一个引人注目的观点:“4年前做AI要买算力卡,3年前要卷大模型,而今天,做AI就是开发和用好智能体。”他强调,随着智能体时代的到来,云服务必须从传统的“算力黑土地”转变为适合智能体生长的“硅基黑土地”。这一转变不仅意味着技术层面的升级,更预示着AI发展路径的重大调整。
智能体的广泛应用带来了前所未有的挑战。当数字劳动力深入企业流程,每一次看似简单的任务背后,都隐藏着复杂的模型调用、工具链切换和资源调度。仅靠提升模型参数和GPU数量已远远不够,如何优化Token效率、记忆管理、资源调度和安全保障,成为决定智能体能否真正落地的关键因素。
华为云提出的Agentic Infra新范式,正是为了应对这些挑战。该范式包含高效Token工厂、持续学习、通智一体化调度和安全自治四大核心要素,旨在为智能体的大规模应用奠定坚实基础。其中,AICS灵衢智算集群作为高效Token工厂的代表,通过创新性的统一总线协议和超节点架构,打破了传统服务器的物理界限,构建了一个逻辑上的“巨型计算机”,显著提升了Token的生产能力和服务稳定性。
在记忆管理方面,华为云推出的AMS Agentic记忆存储解决方案,为智能体提供了PB级的记忆空间和先进的长上下文管理技术,使其能够保存更长时间的任务状态和经验。这对于需要处理复杂、长期任务的企业级智能体来说至关重要。
资源调度是另一个关键难题。华为云的通智一体化调度引擎CCE VolcanoNext,通过“训推共池”和“碎片整合”两大技术,实现了算力资源的高效利用。该引擎能够将训练和推理算力整合为一张网,让不同负载在同一资源池中动态复用,同时还能将零碎的算力“偷”出来,用于在线推理任务,从而大幅提升了整体硬件利用率。
安全保障同样不容忽视。华为云推出的AgentSphere生产级智能体运行环境,集成了沙箱隔离、身份权限管理、意图防护等多重安全机制,为智能体的应用提供了坚实的安全屏障。其羽量级沙箱技术还实现了快速启动和高并发批创能力,满足了智能体在不同场景下的需求。
在Agentic Infra的基础上,华为云进一步推出了ModelArtsNext和AgentArts两层能力,以解决模型应用和智能体开发的问题。ModelArtsNext通过模型路由能力,能够根据请求特征和实时负载动态选择最合适的模型,从而优化了成本和使用体验。而AgentArts则专注于将模型能力封装成稳定、可控的“数字员工”,为企业提供长程任务管理、企业级安全、行业知识深度和全链路可观测等核心能力。
与互联网云厂商不同,华为云更关注Token背后的实际价值。周跃峰在媒体见面会上表示,华为云不太在乎Token总量和收入总量,更在乎的是国产化算力系统生产出来的Tokens能否带来健康提升、节电和生产力提升。这种差异化的定位,源于华为云对行业需求的深刻理解和长期深耕。
华为云的“全栈”能力也是其独特优势之一。从底层的芯片算力到中间的底层使能,再到最上层的智能体平台,华为云全部实现了自研。这种全栈自研的逻辑,不仅提升了华为云的技术自主性,也为其在智能体时代的发展奠定了坚实基础。
除了技术层面的创新,华为云还注重开放生态的建设。在INSPIRE创想者大会上,华为云发布了“行业AI梦工厂”计划,旨在将已经验证过的技术、工具链和行业经验开放出去,推动行业AI的普及和可持续发展。首批“梦工厂”涵盖了医疗、具身智能、科学计算、智能制造等多个垂直领域,将为行业AI的发展注入新的活力。









