在2026年GTC大会上,英伟达正式推出Vera Rubin AI平台,旨在加速智能体AI(Agentic AI)的技术演进。这一平台被公司创始人兼首席执行官黄仁勋称为“代际飞跃”,标志着其历史上最大规模AI基础设施建设的启动,覆盖从大规模预训练到实时推理的完整AI生命周期。
在算力架构方面,新一代NVL72机架通过NVLink 6技术将72块Rubin GPU与36块Vera CPU深度整合,实现了计算效率的突破性提升。相较于前代Blackwell平台,该系统在混合专家大模型(MoE)训练中仅需四分之一的GPU资源,同时将每瓦推理吞吐量提高10倍,单Token处理成本降低至十分之一。
针对AI模型验证环节,英伟达设计了专用Vera CPU机架,集成256块液冷CPU。该架构通过优化散热设计,使运行效率达到传统CPU的两倍,数据处理速度提升50%,为大规模模型验证提供了高效支撑。
为满足智能体系统对低延迟和长上下文的需求,英伟达同步推出Groq 3 LPX推理加速机架。该系统配备256个LPU处理器,与Vera Rubin平台协同工作时,每兆瓦推理吞吐量最高可提升35倍,显著优化了实时交互场景的性能表现。
在数据存储领域,全新BlueField-4 STX机架构建了AI原生存储架构。基于DOCA Memos框架,该系统可高效处理大型语言模型生成的海量键值(KV)缓存数据,在降低能耗的同时将推理吞吐量提升最高5倍,为多轮AI对话等复杂场景提供更快的响应能力。











