通义实验室近日宣布,其最新研发的Qwen3.7-Plus多模态智能体模型正式上线阿里云百炼平台。这款基于Qwen3.7架构升级的模型,通过深度整合视觉感知能力,实现了从文本处理到多模态交互的跨越式突破,能够完成从界面理解到代码生成、从应用操作到结果验证的全链路闭环任务。
在实测场景中,基于该模型构建的Hybrid-Agent系统展现出惊人能力。该系统持续运行11小时完成英语单词学习APP的全流程开发,累计生成超过1万行代码,触发1000余次API调用,覆盖需求分析、代码编写、自动化部署、测试验证等完整开发周期。更令人瞩目的是,系统在版本迭代过程中实现自我修正,最终交付功能完备的成品应用。
针对桌面应用场景的专项测试显示,模型可精准解析macOS原生Stocks应用的UI布局,自动生成符合SwiftUI规范的源代码,并通过接入LongBridge金融API获取实时行情数据。在编译构建环节,系统自主完成从代码到可执行文件的完整转化,最终生成的复刻应用不仅还原了原生应用的暗色主题和分栏布局,更通过10项功能测试验证,实现与官方版本完全一致的交互体验。
该模型的多模态处理能力覆盖多个专业领域:可解析地铁线路图等复杂视觉信息完成路径规划,支持图像视频转SVG矢量代码的精确转换,具备视觉驱动的网页设计能力。在浏览器Agent场景中,系统能自主完成ECS云服务器的采购配置、运维监控等企业级任务。在BabyVision、MathVision等权威基准测试中,模型展现出超越同类产品的性能表现。
目前开发团队已开放OpenAI兼容API与Anthropic协议调用接口,支持开发者将Qwen3.7-Plus集成至各类商业应用。该模型的推出标志着多模态智能体技术进入实用化阶段,其全链路自动化能力有望重构软件开发、系统运维等领域的作业模式。








