一款来自中国的AI模型MiniMax M3,近期在全球科技圈引发了不小的震动。这款模型不仅得到了硅谷重量级人物的公开推荐,更在开发者社区中掀起了一场关于其真实能力的激烈讨论。
Vercel的CEO Guillermo Rauch,在社交媒体上罕见地为MiniMax M3站台,这一举动迅速吸引了大量关注。Rauch的推荐,让这款原本默默无闻的中国模型,一夜之间成为了全球开发者热议的焦点。然而,与海外社区的热烈讨论形成鲜明对比的是,国内社区对于M3的评价却显得褒贬不一,甚至有些“吵闹”。
国内社区的争议焦点,主要集中在M3的Token Plan价格调整上。不少老用户感到自己的权益受到了影响,纷纷在评论区表达不满,一时间,吐槽声四起。而与此同时,海外开发者则更关注M3的技术细节,如架构参数、稀疏注意力机制以及训练数据规模等。他们更希望了解这款模型在实际应用中的表现,而不仅仅是价格问题。
面对外界的种种评价,MiniMax官方迅速做出了反应。他们不仅发布了补偿方案,确保老用户的权益不受影响,还为新用户提供了额外的周限额加赠。这一举措在一定程度上平息了国内社区的争议,也让人们的注意力重新回到了M3本身的技术实力上。
为了验证M3的真实性能,全球开发者们自发组织了一场“硬核验货”活动。他们通过盲测的方式,将M3与其他知名模型进行对比。在一项让AI生成动画的测试中,M3的表现让网友们大跌眼镜。原本被认为表现平平的M3,最终却以出色的动画效果赢得了多数网友的认可。
另一场测试中,开发者JAZII要求M3和另一款知名模型用Three.js在HTML中从零开始创建一个《我的世界》的克隆版。虽然M3在耗时上略长一些,但最终的代码运行结果却与对手“Super close”,几乎不相上下。这一结果再次证明了M3的强大实力。
除了这些盲测实验外,还有开发者对M3的多模态和Agentic Coding能力进行了极限测试。他们让M3制作一个复杂的游戏,过程中需要理解复杂的视觉手势并完成超长程的逻辑代码编写。令人惊讶的是,M3不仅成功完成了任务,而且Token的消耗量仅为同类模型的20%。
AI测评人Thomas Wiegold在第一时间对M3进行了实测,并发布了一篇长达3000字的报告。他在报告中称赞M3是“今年测过的最有意思的模型之一”,对其性能给予了高度评价。
为了更深入地了解M3的能力边界,有开发者专门设计了一系列高难度测试。其中一项测试是让M3梳理一篇长达50页的技术报告中的核心工程逻辑。M3不仅成功完成了任务,还把实现路径拆解得明明白白,逻辑链条毫无断点。另一项测试则要求M3根据一张结构图找到对应的数学公式,并解释图中的隐藏约束。M3同样给出了精准的解析和详细的拆解。
在另一项更具挑战性的测试中,M3被要求观看一场长达近2小时的英伟达GTC大会主题演讲视频,并根据规范撰写一篇深度报道。面对如此庞大的原始视频数据,M3不仅成功完成了任务,还交出了一份初稿质量相当高的报道。虽然距离专业发稿水平还有一定差距,但已经足够作为一个高质量的起点。
M3之所以能够取得如此出色的表现,得益于其三项核心能力的同时到位:前沿级编程、1M上下文窗口以及原生多模态。这些能力的基底是一个全新的注意力架构——MiniMax Sparse Attention(MSA)。MSA通过块级稀疏的方式解决了传统注意力机制在处理百万级上下文时的计算量爆炸问题,显著提高了计算效率和性能。
在多模态方面,M3同样表现出色。它从训练之初就将文本、图片、视频混合在一起进行训练,重构了整条数据管线,并将预训练规模直接拉到了100T量级。这使得M3在多个综合智能指数榜上取得了优异成绩,甚至在某些榜单上超越了知名闭源模型。
随着M3的权重与完整技术报告即将在十天内开源,全球开发者们正翘首以盼。他们期待着用真实项目来检验这款模型的实力,并探索其无尽的应用可能性。而M3的出色表现,也无疑为中国AI模型在国际舞台上赢得了一席之地。







