蚂蚁集团近日正式发布了一款名为“灵光”的全模态通用人工智能助手,这款产品以其强大的多模态内容生成能力迅速引发行业关注。作为业内首个具备全代码生成能力的AI助手,“灵光”不仅支持通过自然语言在30秒内生成小型应用,还能实现3D数字模型、音频、图标、动画及地图等全类型信息的输出。
目前“灵光”已推出三大核心功能模块:基于智能对话的“灵光对话”模块,可实现多轮自然语言交互;主打快速应用生成的“灵光闪应用”模块,用户通过简单描述即可获得定制化工具;以及专注视觉内容创作的“灵光开眼”模块,支持从静态图像到动态视频的全场景生成。该产品现已同步上线安卓及苹果应用商店,用户可免费体验基础功能。
技术层面,“灵光”突破了传统AI工具的单模态限制,通过融合语言理解、图像生成、语音识别及数据分析能力,构建起跨模态信息处理体系。其核心优势在于将复杂操作转化为直观交互,例如用户输入“生成一个展示季度销售趋势的3D动画”,系统可自动完成数据抓取、图表生成及动画渲染的全流程。这种端到端的解决方案显著降低了技术使用门槛。
在应用场景方面,“灵光”覆盖了办公、学习、创作三大领域。办公场景中,其文档速读功能可快速提取网页核心内容并生成结构化摘要;学习场景下,拍题答疑功能支持多学科题目解析;创作领域则提供从AI绘画、视频生成到智能配音的一站式服务。特别值得关注的是,该产品集成了财报速读、智能P图、多语言翻译等20余项实用功能,形成完整的人工智能工具矩阵。





















