阿里云近日推出新一代大语言模型Qwen3.6-Plus,将其定位为"国产最强编程模型"。这一动作标志着国内人工智能领域正从"理解世界"向"改造世界"加速转型。该模型在编程能力、逻辑推理和工程交付三大维度展现出显著优势,在权威评测中超越GLM-5、Kimi-K2.5等2-3倍参数量级的竞品,编程表现直逼国际顶尖的Claude系列模型。
在逻辑推理测试中,Qwen3.6-Plus展现出惊人的深度思考能力。面对"甲说乙说谎,乙说丙说谎,丙说甲乙都说谎"的经典悖论题,模型没有直接给出答案,而是通过完整的"假设-验证-排除"流程推导出唯一解:乙说真话。这种结构严密的推导方式,与人类解决复杂问题的思维模式高度契合,彻底摆脱了传统AI依赖概率猜测的局限。
多约束写作任务测试进一步验证了模型的精准控制能力。当要求用300字以内完成"以反问句开头、不含特定词汇、比喻结尾、资深科技记者语气"的自我介绍时,Qwen3.6-Plus生成的文本既符合所有条件,又保持了专业水准。其信息密度、表达克制度和逻辑连贯性,已达到可直接作为商业稿件发布的程度,这在现有AI模型中极为罕见。
工程交付能力测试则揭示了该模型的产业价值。面对"开发AI短视频脚本生成工具"的需求,模型不仅生成代码,更展现出完整的产品架构思维:从需求拆解、用户画像到技术栈选型,从前后端分离方案到数据流转机制,甚至提供了用户流程设计、接口代码示例和部署优化建议。这种从概念到落地的全链条能力,使其成为真正意义上的"数字生产单元"。
行业观察人士指出,Qwen3.6-Plus的发布具有风向标意义。国产大模型的竞争焦点已从知识广度和趣味性,转向稳定性和工程化能力。当AI能够像资深工程师一样独立完成任务拆解、规避业务风险并输出系统性方案时,企业竞争力将取决于如何有效整合这些智能资源。目前,Qwen3.6-Plus已登陆阿里云百炼平台,输入价格低至每百万Tokens 2元;千问3.6版本则在悟空、千问APP等渠道开放体验,开发者可率先感受新一代模型的强大能力。







