据伦敦《金融时报》报道,埃隆·马斯克旗下的xAI公司正加速推进“世界模型”的研发,试图在下一代人工智能领域与meta、谷歌等科技巨头展开竞争。这类模型的核心能力在于自主理解并模拟物理环境的动态特征,包括物体的物理属性、空间关系及实时交互逻辑。
与传统大语言模型依赖文本训练不同,世界模型通过整合文字、图像、视频及动作数据,能够生成具有物理一致性的动态场景。例如,xAI计划将其应用于游戏领域,创建可交互的3D环境,甚至为机器人AI系统提供实时决策支持。目前,该公司已从英伟达挖角两位资深研究员——泽尚·帕特尔与何宜晖,以强化研发实力。
英伟达凭借Omniverse平台在该领域占据先机,其技术允许创建并运行高精度模拟环境。xAI的入局被视为对现有格局的挑战。知情人士透露,xAI的世界模型不仅服务于游戏,未来还可能拓展至实体产品领域,如人形机器人。英伟达此前曾向《金融时报》表示,这类技术的潜在市场规模可能接近全球经济总量。
马斯克近期在社交平台X上重申,xAI计划在2025年底前推出一款“由AI生成的优秀游戏”,呼应其去年设定的目标。与此同时,该公司本周发布了新一代图像与视频生成模型,宣称进行了“重大升级”并免费向公众开放。
与传统视频生成模型(如OpenAI的Sora)通过预测帧序列生成内容不同,世界模型能实时解析物理因果关系。例如,它可模拟物体在不同环境中的碰撞、重力影响等动态过程。然而,技术瓶颈依然存在:训练此类模型需要海量现实世界数据,且数据采集与标注成本高昂。
行业内部对此存在分歧。《博德之门3》开发商拉瑞安工作室的发行主管迈克尔·道斯公开质疑AI在游戏领域的应用价值。他指出,行业真正缺乏的是“领导力与远见”,而非算法生成的玩法循环。他强调,玩家更需要的是“能让人沉浸其中的世界构建”,而非技术堆砌。
截至目前,xAI及相关研究员尚未对上述报道作出回应。随着研发推进,世界模型能否突破技术壁垒并重塑AI应用场景,仍待观察。