科技·商业·财经

华为Atlas 800T A3超节点:为大模型训练打造高性能AI智算新引擎

   时间:2025-12-13 22:11 作者:顾雨柔

华为近日正式发布面向互联网、运营商及金融行业的AI智算新品——Atlas 800T A3超节点。该产品专为大规模AI模型训练场景设计,凭借高性能、高可靠性和易部署特性,为数据中心提供强大的硬件支撑,同时支持通用风冷机房环境,显著降低部署门槛。

硬件架构方面,Atlas 800T A3由超节点服务器与灵衢总线设备组成。超节点服务器采用10U机框设计,可无缝适配标准19英寸机柜,通过正交盲插架构集成CPU抽屉、NPU抽屉、灵衢总线板及IO框等核心模块。其核心配置搭载4颗鲲鹏920处理器与8个昇腾910 AI模组,整机在FP16精度下可提供6.016PFLOPS峰值算力,INT8精度下算力翻倍至12.032POPS。超节点内部任意两个NPU模组间双向互联带宽达784GB/s,充分满足大规模并行计算需求。

为保障设备稳定运行,该产品采用双路供电方案,支持220V交流电或336HVDC/240HVDC直流电输入,最大输入功耗16.2kW,电源转换效率最高达96%,并配备5+1冗余备份及多重保护机制。散热系统创新性地结合风冷与华为自研LAAC液冷模组,每个抽屉配备5个风扇模组,支持4+1热插拔更换,确保设备在5℃至35℃工作温度范围内(符合ASHRAE Class A2标准)持续稳定运行。

网络连接层面,灵衢总线设备以LingQu 630 V1为核心,提供高性能、低延迟的组网能力,支持多种供电模式及1+1电源冗余。通过自研总线交换协议,该设备可实现超节点内部7个平面组网,支持64、96、192、384等不同规模配置。其中,384超节点方案需通过56台灵衢总线设备与48台超节点服务器全互联构建。

在扩展性与管理功能上,超节点服务器前后板配备灵衢总线接口、参数面接口、USB、VGA及管理网口等丰富接口,IO框支持10个2.5英寸硬盘及最多5个PCIe 5.0扩展插槽,内存最大容量达4096GB,并集成多种内存保护技术。系统管理采用iBMC智能管理系统,兼容IPMI2.0规范,支持远程控制、故障检测及告警上报,同时可通过Redfish接口与第三方网管平台集成。

该产品物理尺寸为442mm×447mm×920mm,满配状态下净重229kg,其模块化设计与高集成度特性,使其能够灵活适配各类数据中心环境,为AI密集型业务提供高效可靠的硬件基础。

 
 
更多>同类内容
全站最新
热门内容