科技·商业·财经

稀宇科技发布MiniMax M3模型:超长上下文多模态,编程等多领域表现亮眼

   时间:2026-06-02 01:02 作者:互联网

稀宇科技近日宣布,正式推出其最新研发的多模态大模型——MiniMax M3。这款模型不仅支持原生多模态交互,包括图片、视频输入以及电脑桌面操作,还具备高达100万字符的超长上下文处理能力,成为国内首个同时实现这三项突破的模型。更引人注目的是,M3也是目前国内唯一开源的同类模型,其技术架构和模型权重将在近期向全球开发者开放。

在性能评测方面,M3展现了强大的竞争力。根据官方公布的数据,在编程能力评测集SWE-Bench Pro上,M3取得了59.0%的优异成绩,超越了GPT-5.5和Gemini 3.1 Pro,仅略低于Opus 4.7。在Agent智能体评测Claw-eval中,M3更是斩获最高分,显示出其在复杂任务处理上的优势。在多模态测试集OmniDocBench上,M3的表现也优于Gemini 3.1 Pro,进一步验证了其多模态交互能力的领先性。

技术架构上,M3采用了创新的稀疏注意力机制——MiniMax Sparse Attention(MSA)。这一架构显著提升了模型的处理效率,在100万上下文长度下,每个token的计算量仅为上一代模型的二十分之一。在预填充(prefilling)阶段,M3的加速效果超过9倍;在解码(decoding)阶段,加速效果更是达到15倍以上,为大规模应用提供了坚实的性能基础。

伴随M3的发布,稀宇科技还同步更新了其Agent产品MiniMax Code,并推出了全新的Token Plan订阅方案。该方案提供三个档次的服务:Plus版每月49元,Max版每月119元,Ultra版每月469元,满足不同用户的需求。同时,M3的API服务即日起正式开放,512k上下文版本在上线初期提供限时5折优惠,持续7天。模型的技术报告和完整权重将在10天内开源,供全球开发者研究和改进。

 
 
更多>同类内容
全站最新
热门内容