科技·商业·财经

OpenAI两大开源语言模型重磅发布,携手亚马逊云助力企业智能化升级

   时间:2025-08-24 01:57 作者:冯璃月

OpenAI终于有了新动作,尽管万众期待的GPT-5并未如期而至,但公司带来了一份别样的惊喜——两个全新的开源语言模型。

这一消息对于AI社区而言,无疑是一剂强心针。自GPT-2之后,OpenAI已经很久没有开源新的模型了。据内部人士透露,关于模型开源的讨论在OpenAI内部已经持续了一段时间,甚至数次接近实现,但直到近日才正式对外公布。

此次OpenAI一次性开源了两个推理模型,它们均具备强大的实际应用性能,并且具有显著的低成本优势。据OpenAI首席执行官Sam Altman介绍,这两个模型的性能与o4-mini相当,更令人惊讶的是,其中较大的模型甚至可以在高端笔记本电脑上运行,而较小的模型则能在手机上流畅使用。

这两个开源模型一经发布,就引起了海外AI社区的广泛关注。众多开发者纷纷下载尝试,以至于Hugging Face的服务器一度面临崩溃的风险。这两个模型也已经上线亚马逊云科技Amazon Bedrock和Amazon SageMaker AI,用户可以直接使用。

在技术细节上,这两个开源模型采用了Transformer架构,并结合了专家混合(MoE)技术,以减少处理输入所需的活跃参数数量。同时,它们还采用了交替密集和局部带状稀疏注意力模式,以及分组多查询注意力等技术,以提高推理和内存效率。在训练过程中,OpenAI结合了强化学习和内部最先进模型的训练技术,使得这两个模型在核心推理基准测试上表现出色。

在安全性方面,OpenAI对这两个开源模型进行了全面的安全训练和评估测试,并基于自身的准备框架测试了对抗性微调版本,引入了额外的评估层。从结果来看,这两个模型在内部安全基准测试中的表现与OpenAI的前沿模型相当。

OpenAI还与AI Sweden、Orange和Snowflake等早期合作伙伴合作,了解这两个开源模型在现实应用中的情况,包括将它们托管在本地以确保数据安全,以及在专业数据集上进行微调。这些合作伙伴的反馈将进一步推动这两个模型在实际应用中的优化和改进。

在性能评估方面,OpenAI在标准学术基准上对比测试了这两个开源模型与OpenAI推理模型的表现。结果显示,这两个开源模型在编程、竞赛数学、医疗和智能体工具使用等方面均表现出色,甚至在某些领域超越了o4-mini等专有模型。

这两个开源模型还支持“低、中、高”三档推理强度调节,开发者可以根据具体用例和延迟需求轻松设置,实现延迟与性能的平衡。它们还具备完整的思维链(CoT)能力,即模型可以展示其推理过程,从而更便于开发者进行调试并增强对输出的信任。

对于国内开源模型而言,这两个OpenAI开源模型的发布无疑带来了新的挑战和机遇。它们的高性能和低成本优势将推动国内开源模型在技术和应用上的进一步发展。同时,国内开发者也可以从这些开源模型中汲取灵感和经验,不断提升自身的技术水平和创新能力。

 
 
更多>同类内容
全站最新
热门内容