Cerebras芯片助力GPT-5.5推理加速，AI推理赛道竞争格局生变？

时间：2026-05-19 09:52 作者：天脉网

在纳斯达克敲钟当日，Cerebras以560亿美元估值创下2026年科技领域最大IPO纪录，股价单日飙升68%。这家以晶圆级芯片颠覆行业规则的公司，正凭借每秒2000 token的推理速度搅动AI硬件市场，但一场关于技术可行性的质疑风暴也随之而来。

推动Cerebras市值狂奔的核心动力，源自其与OpenAI的深度绑定。据公司CFO在IPO前夜透露，Cerebras不仅在运行GPT-5.4和GPT-5.5等万亿参数模型，更通过246亿美元的订单成为OpenAI推理基础设施的关键供应商。这种排他性合作条款明确禁止向Anthropic等竞争对手提供服务，形成事实上的技术联盟。

支撑其性能神话的是WSE-3芯片的颠覆性设计。这块直径30厘米的晶圆级芯片集成4万亿晶体管，通过44GB SRAM实现21PB/秒的内存带宽。相较于传统GPU依赖HBM的架构，SRAM在推理场景中展现出压倒性优势——当模型逐个生成token时，WSE-3可近乎全速调用15.6 PFLOPS算力，而英伟达Blackwell GPU的实际利用率不足20%。这种差异使得Cerebras在120B参数模型上实现2000 token/秒的突破，较Anthropic Opus 4.6 fast快20倍。

但技术光环下隐藏着致命缺陷。SemiAnalysis的技术拆解报告指出，Cerebras当前公开云服务中最大模型仅为120B参数，预览模型上限355B。当面对DeepSeek V4等1.6万亿参数模型时，44GB内存容量迫使系统采用层分割技术，将模型拆解到12块晶圆上运行。这种分布式架构导致层间通信延迟呈指数级增长，实际推理速度可能低于传统GPU集群。

市场已出现明显分化。在要求极致速度的细分领域，Cerebras获得Cognition、Notion等企业青睐，其快速模式在AI编程工具Devin中实现1000 token/秒的输出。但SemiAnalysis采集的43.2万条真实请求显示，近半数需求超过128K上下文窗口限制，这恰是Cerebras当前架构的硬伤。随着Agent应用对长文本处理需求激增，内存容量与通信带宽的矛盾可能进一步加剧。

行业观察家指出，Cerebras的困境折射出AI硬件发展的核心悖论：追求极致速度的专用架构与通用大模型需求之间存在根本性冲突。虽然OpenAI通过架构分割策略，将AWS Trainium、Cerebras和GPU分别用于输入理解、token生成和长上下文处理，但这种多硬件协同模式能否规模化推广仍存疑问。当推理算力消耗预计在2027年占AI总需求的80%时，这场关于速度、容量与成本的三角博弈将决定下一代硬件的走向。

更多>同类内容

CHERRY携手《宝可梦》推耿鬼联名鼠标，搭载PAW3955传感器性能强劲

05-19

Apple Watch Ultra 4或迎重大更新外观重设计传感器数量有望翻倍

05-19

vivo S60系列来袭：蓝河流畅引擎加持，五年持久流畅不是梦

05-19

邯郸“太空船”：从人才短板中突围，小游戏赛道闯出出海新天地

05-19

AI大模型“火眼金睛”上线光伏产线：20倍效率提升，0.5毫米级精准质检

05-19

索尼1000X“The ColleXion”耳机宣传图亮相，双处理器高规格配置引期待

05-19

智元WITA大模型完成备案即将推出新模型并发布“358宏图计划”

05-19

苹果揭晓2026年Apple设计大奖入围名单《明日方舟：终末地》等佳作获提名

05-19

WWDC26倒计时！苹果iOS 27或携AI写作、Siri革新及壁纸生成功能亮相

05-19

银河航天再突破！国内首款高性能星载“伞天线”下线核心指标达国际先进水平

05-19

苹果2026设计大奖入围名单揭晓《明日方舟：终末地》等多款佳作获提名

05-19

赛力斯携手博奥镁铝：全球首款半固态镁合金CCB量产下线助力车型升级

05-19

马斯克诉讼超时效败诉，OpenAI IPO之路或迎重大进展

05-19

中国移动“超千兆宽带”来袭：2000Mbps网速搭配AI，开启家庭网络智能新篇

05-19

狨猴研究新突破：弓状束同源为人类语言起源探索打开新窗口

05-19

点击查看更多 +

全站最新

2025消金行业大洗牌：头部稳中有忧，腰尾“K型分化”加剧

毕业典礼“画风突变”：前谷歌CEO谈AI，引毕业生集体“吐槽”

具身智能爆发前夜：安全风险凸显，百度给出破局“方法论”

从实习生视角出发，揭秘字节跳动如何搭建视觉理解大模型评估体系

BOOX文石leaf5与科大讯飞X5深度PK：阅读控与办公族的理想之选大揭秘

AI收入占比首超半壁江山，百度以DAA新标尺开启AI盈利新篇章

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号