AI大模型领域正迎来新一轮技术升级浪潮,以英伟达Blackwell架构为核心的训练模型即将成为行业焦点。花旗研究将其定义为当前竞争格局中的关键技术催化剂,指出多家头部实验室已密集布局新品发布,推动模型能力进入快速迭代阶段。Anthropic本周率先推出Claude Opus 4.8,在智能体协作、可控推理和诚实度方面实现全面突破;马斯克宣布参数量达1.5万亿的Grok-5训练完成,预计2至3周内发布;MiniMax则通过预告图暗示采用稀疏注意力机制的M3模型即将登场,性能提升幅度引发市场关注。
Blackwell架构的算力优势尚未完全释放,但市场已形成明确预期:首批基于该架构训练的模型将与现有产品形成显著能力差距。花旗模型发布日历显示,谷歌Gemini 3.5 Pro、Anthropic Claude Sonnet 4.7等预计二季度落地,Claude Opus 5、DeepSeek V5等定档四季度,OpenAI GPT-6.0则排期三季度。这些产品中哪些能成为首批完全由Blackwell算力训练的模型,成为当前市场核心关注点。GPU算力租赁市场数据印证了这一预期,Blackwell系列芯片租赁价格自2025年下半年持续攀升,反映市场对下一代训练算力的强劲需求。
Anthropic的Claude Opus 4.8在发布节奏上打破常规,距离4.7版本发布仅约一个月,较外界预期的6月中旬明显提前。此次升级包含三大核心变化:新增“投入控制”机制,允许用户调节推理资源投入强度;推出“动态工作流”预览版,支持数百个并行子智能体处理大规模任务;显著提升诚实度,代码缺陷未提示通过概率降至4.7版本的四分之一。基准测试显示,Opus 4.8在Online-Mind2Web浏览器智能体测试中取得84%的成绩,超越4.7版本和GPT-5.5。定价方面维持每百万输入token 5美元、输出token 25美元的标准,同时推出“快速模式”,速度提升2.5倍,成本降至此前模型的三分之一。
马斯克披露的Grok-5在参数规模上实现跨越式发展,从当前Grok-4的0.5万亿扩至1.5万亿,增长三倍。该模型纳入大量来自AI编程工具Cursor的训练数据,后者年经常性收入已达20亿美元,开发者交互数据为编程能力建模提供完整思维链素材。SpaceX与Cursor的合作协议为Grok-5训练提供超算支持,同时获得收购期权或合作费用,这一架构将强化Grok-5在编程场景的竞争力。MiniMax的M3模型则通过稀疏注意力机制实现性能突破,预填速度提升9.7倍,解码速度提升15.6倍,其前代M2.7以每百万tokens 0.22美元的低价占据性价比市场,M3的落地有望延续这一优势。
企业端AI采用呈现“垂直需求之墙”特征,需求增速远超预期。谷歌每月tokens处理量同比增长7倍至3.2千万亿,Anthropic二季度末年化收入预计达500亿美元,较3月底增长67%,二季度收入预测环比增幅130%;OpenAI一季度收入57亿美元,超过去年上半年总和。花旗研究指出,企业AI采用仍处于早期阶段,需求天花板远未到来。然而,供给端增速滞后导致算力成本攀升,OpenAI推出“保证容量”方案,企业通过签订1至3年合约锁定算力,消费越多折扣越大;Anthropic也签署类似协议,将算力服务模式转向“预留实例”的云计算模式。






