OpenAI两大开源语言模型重磅发布，携手亚马逊云助力企业智能化升级-网界

OpenAI终于有了新动作，尽管万众期待的GPT-5并未如期而至，但公司带来了一份别样的惊喜——两个全新的开源语言模型。

这一消息对于AI社区而言，无疑是一剂强心针。自GPT-2之后，OpenAI已经很久没有开源新的模型了。据内部人士透露，关于模型开源的讨论在OpenAI内部已经持续了一段时间，甚至数次接近实现，但直到近日才正式对外公布。

此次OpenAI一次性开源了两个推理模型，它们均具备强大的实际应用性能，并且具有显著的低成本优势。据OpenAI首席执行官Sam Altman介绍，这两个模型的性能与o4-mini相当，更令人惊讶的是，其中较大的模型甚至可以在高端笔记本电脑上运行，而较小的模型则能在手机上流畅使用。

这两个开源模型一经发布，就引起了海外AI社区的广泛关注。众多开发者纷纷下载尝试，以至于Hugging Face的服务器一度面临崩溃的风险。这两个模型也已经上线亚马逊云科技Amazon Bedrock和Amazon SageMaker AI，用户可以直接使用。

在技术细节上，这两个开源模型采用了Transformer架构，并结合了专家混合（MoE）技术，以减少处理输入所需的活跃参数数量。同时，它们还采用了交替密集和局部带状稀疏注意力模式，以及分组多查询注意力等技术，以提高推理和内存效率。在训练过程中，OpenAI结合了强化学习和内部最先进模型的训练技术，使得这两个模型在核心推理基准测试上表现出色。

在安全性方面，OpenAI对这两个开源模型进行了全面的安全训练和评估测试，并基于自身的准备框架测试了对抗性微调版本，引入了额外的评估层。从结果来看，这两个模型在内部安全基准测试中的表现与OpenAI的前沿模型相当。

OpenAI还与AI Sweden、Orange和Snowflake等早期合作伙伴合作，了解这两个开源模型在现实应用中的情况，包括将它们托管在本地以确保数据安全，以及在专业数据集上进行微调。这些合作伙伴的反馈将进一步推动这两个模型在实际应用中的优化和改进。

在性能评估方面，OpenAI在标准学术基准上对比测试了这两个开源模型与OpenAI推理模型的表现。结果显示，这两个开源模型在编程、竞赛数学、医疗和智能体工具使用等方面均表现出色，甚至在某些领域超越了o4-mini等专有模型。

这两个开源模型还支持“低、中、高”三档推理强度调节，开发者可以根据具体用例和延迟需求轻松设置，实现延迟与性能的平衡。它们还具备完整的思维链（CoT）能力，即模型可以展示其推理过程，从而更便于开发者进行调试并增强对输出的信任。

对于国内开源模型而言，这两个OpenAI开源模型的发布无疑带来了新的挑战和机遇。它们的高性能和低成本优势将推动国内开源模型在技术和应用上的进一步发展。同时，国内开发者也可以从这些开源模型中汲取灵感和经验，不断提升自身的技术水平和创新能力。

联合产业链上下游合作伙伴，主导建设了涵盖资源层、调度层、能力层、服务层的“超算互联网标准体系”，形成了“建、用、评”的完整生态闭环。曹振南接受经济日报记者采访时表示，推动算力与应用、产业结合，是超算互联网建…

初学者：只管拍内容，不管平台如何理解；成熟者：懂得训练平台，主动给账号贴标签；当你学会把标题、字幕、话题、口播全部统一到一个语义信号，配合检索+推荐双路径，再结合话题卡位和弹性测算，你就能掌握真正的…

8月23日，2025中国算力大会主论坛二活动中，国家超级计算太原中心、青岛“海之心”人工智能计算中心、长沙人工智能创新中心、万达开先进计算中心等7家算力中心正式接入国家超算互联网。至此，国家超算互联网所连接的…

在 SaaS 小程序制作平台的话，可以进行这个 SKU 的管理，企业可以对每一个商品的不同规格、颜色、尺寸等属性设置的话，设置独立的 SKU编号。在 SaaS 小程序制作平台，企业可以给用户设置积分的规则，…

这意味着，如果未来商业化进展顺利，预计今年年底左右AI搜索对传统在线营销业务的赋能可能就会开始在业绩上有所体现。一个值得警惕的数据是，对比2023年初，百度在研发上的单季度投入减少了近25%，这可能会影响后期…

马斯克在X上发帖称“加入xAI，帮助建立一家名为Macrohard的纯人工智能软件公司。这是一个半开玩笑的名字，但这个项目是非常真实的！一位网友问到：“有机械工程师的职位吗？” 此前有报道称，马斯克旗下xA…

目前唯一的问题是，这家科技巨头正面临两难抉择：究竟是自主开发大语言模型，还是依靠合作伙伴来实现其计划。据彭博社报道，苹果已接洽谷歌并要求这家广告巨头为其开发定制化AI模型，用于新版Siri系统。目前苹果正…

这玩意其实并不新，阿里云一直推渠道，虽然官网有公开价和各种优惠，但做大型采购的公司，尤其是互联网、制造业、金融行业这些，永远都想拿到最低价。这里的行业误区很多，比如有的公司觉得代理一定更便宜，但实际上阿里云现…

字节跳动推出的Seed1.5-Thinking是一款具备卓越推理能力的混合专家模型（MoE），其激活参数为200亿，总参数达2000亿。在模型开发方面，数据、强化学习（RL）算法和RL基础设施是三个关键要…