在旧金山举办的Cursor Compile旗舰大会上,一家新兴AI公司Cursor宣布推出参数规模达1.5万亿的新模型,引发行业震动。该模型在超过十万块GPU组成的集群上完成预训练,标志着这家曾以代码编辑工具闻名的企业正式进军基础模型研发领域。
公司25岁的首席执行官Michael Truell在主题演讲中透露,新模型的参数规模已与Anthropic的Opus系列和OpenAI的GPT-5系列处于同一量级。他特别指出,当前市面上宣称达到2万亿参数的模型实际都未突破这个门槛,这意味着开源社区有望通过规模化扩展实现性能追赶。
据技术白皮书披露,该模型研发历时18个月,采用全自研架构而非基于现有开源模型微调。这种从零开始的训练方式使团队能够精准控制模型行为,使其更适配开发者实际工作场景。研发团队特别优化了模型对编程工具链的理解能力,包括调试器、版本控制系统等工程化组件的交互。
算力投入成为本次突破的关键支撑。相比前代模型,本次训练使用的计算资源增长了15倍,单次训练耗资超过2亿美元。Michael承认,这种级别的资源投入在创业公司中极为罕见,暗示获得某战略投资方的特殊支持。行业分析师指出,这种规模的训练集群通常只有科技巨头才有能力构建。
新模型将突破传统代码生成器的功能边界。研发团队展示了模型自动完成软件测试、修复漏洞甚至优化用户界面的能力。在演示视频中,模型不仅能识别代码缺陷,还能生成修复方案并验证修复效果,整个过程无需人工干预。这种端到端的工程能力被视为向"AI工程师"迈出的重要一步。
市场观察家注意到,Cursor的转型恰逢AI行业进入规模化竞赛阶段。目前仅有Anthropic成功实现十万亿参数模型的稳定训练,OpenAI虽多次宣称突破但尚未发布实际产品。若Cursor能如期推出具备工程化能力的万亿参数模型,将打破现有竞争格局,迫使头部企业加速技术迭代。
据内部人士透露,新模型将于本月末通过API形式开放测试,首批合作伙伴包括多家知名科技企业。开发团队正在构建配套的工程化工具链,包括可视化调试界面和自动化评估框架。这些基础设施的完善程度,将成为决定模型商业化成败的关键因素。






