英伟达借收购扩展Rubin功能，Groq 3 LPU助力AI多智能体系统提速-网界

在人工智能技术持续突破的背景下，英伟达在近日举办的GTC主题演讲中公布了一项重要技术进展：通过整合2025年从Groq收购的知识产权，公司正在为Rubin平台注入全新算力。这项创新的核心是一款名为Groq 3 LPU的推理加速器芯片，其设计理念突破了传统AI加速器的内存架构限制。

与主流AI加速器依赖高带宽内存（HBM）的方案不同，Groq 3 LPU采用500MB的静态随机存取存储器（SRAM）作为核心存储单元。这种常用于CPU/GPU高速缓存的存储技术，在单个芯片上实现了150TB/s的惊人带宽，相较HBM4的22TB/s带宽提升近7倍。尽管288GB的HBM4容量远超SRAM，但后者在处理带宽敏感型AI解码任务时展现出显著优势，特别适用于需要实时交互的生成式AI场景。

英伟达的工程团队将这种技术优势转化为系统级解决方案，推出了包含256个Groq 3 LPU的Groq 3 LPX机架。该系统通过专用扩展接口实现640TB/s的内部互联带宽，在128GB总SRAM容量的配置下，可提供高达40PB/s的推理加速能力。这种架构设计使得AI模型在处理万亿参数时，仍能保持数百万token上下文窗口的实时交互性能。

超大规模计算副总裁Ian Buck特别强调了该技术对多智能体系统的变革性影响。在传统架构中，AI代理间的通信吞吐量被限制在每秒100个token，而Rubin与Groq LPU的组合可将这一指标提升至1500个token/秒以上。这种数量级的提升，使得AI系统能够摆脱人类交互的节奏限制，真正实现智能体间的自主高效协作。

技术白皮书显示，这种架构创新源于对AI工作负载特性的深度理解。在需要处理数十亿参数的生成式模型中，约70%的计算资源消耗在内存访问环节。Groq 3 LPU通过将存储单元与计算核心紧密耦合，将内存延迟降低至传统架构的1/20，同时通过独特的数据流架构避免了HBM架构中常见的带宽争用问题。

行业分析师指出，这项技术突破可能重塑AI基础设施的竞争格局。特别是在需要处理超长上下文窗口的对话系统、多智能体协作平台等场景，英伟达的新方案展现出显著的性能优势。随着生成式AI从文本生成向复杂决策系统演进，这种低延迟、高吞吐的推理架构或将成为新一代AI基础设施的标准配置。

从内部信介绍来看：ATH目前由五个核心部门组成：通义实验室：（Qwen大模型的整体研发工作）创造领先的多模态模型，不断追求基础模型能力上限，为集团和业界提供最领先模型；MaaS业务线：（由MaaS升级而成）…

这次机哥翻了一圈目前的爆料，发现大家讨论最多的，是一台ProMax新机。官方在预热中提到，畅享90系列会搭载“巨鲸大电池”，对此有爆料指出，Pro Max这块电池容量很可能在8500mAh左右。需要注意的…

3月13日，嘉兴市发展改革委举办“OpenClaw和OPC社区运营专场分享会”，邀请阿里云计算、36氪等行业专家，围绕AI智能体技术演进趋势和OPC社区运营模式进行深度分享，探索“人工智能+”行动背景下产业孵…

为推动行业健康快速发展，京东依托超级供应链核心优势，以及零售、物流、健康、工业、外卖、家政等海量真实业务场景，将建成全球规模最大、场景最全的具身智能数据采集中心，两年内积累超1000万小时优质数据，助力具身…

全域智能交互的魅力，在于让车真正成为懂你的出行伙伴，让每一次操作都简单随心。14.6英寸高清中控大屏搭载的FlymeAuto智能座舱系统，操作丝滑无卡顿，就像操控随身的智能设备般顺手，导航、娱乐、车辆设置一键…

近期官方开始预热iqooz11，定位依然是“性能续航小超人”，据之前爆料，这款手机会采用中端高性能处理器+9020mAh电池的核心配置，在性能与续航方面还是不错的。iqoo z11系列除了有标准版，这次…

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号