全球人工智能领域迎来新一轮热潮,OpenAI推出的新一代AI视频生成模型Sora 2及其配套应用Sora App,在国庆假期期间引发科技圈强烈关注。尽管需要邀请码才能体验,这款产品仍在四天内登顶美区App Store免费榜,超越ChatGPT、Google Gemini等知名AI应用,成为海外创作者和内容营销者的新宠。
社交平台迅速被用户创作的“AI同人宇宙”占据:动漫角色出现在现实街道,游戏角色穿梭于都市建筑,甚至OpenAI首席执行官山姆·奥尔特曼的形象被网友重新演绎——从东北炕头吃饭到化身外卖骑手,各种创意场景层出不穷。奥尔特曼本人将这款产品比作“创意领域的ChatGPT 3.5时刻”,媒体评价其将AI视频生成技术推向新高度。
Sora App的核心功能建立在Sora 2模型之上,首次实现视频、音效和背景音乐的同步生成。应用界面采用垂直视频流设计,底部功能栏包含视频推荐、灵感广场、生成器等模块。灵感广场展示热门作品,用户可直接复制提示词进行二次创作。生成器功能虽不支持上传自制素材,但提供图片转视频和Cameo虚拟形象两种特色创作方式。
多角色视频创作测试中,要求奥尔特曼与另一用户形象扮演《后宫甄嬛传》角色用中文对话,系统因版权问题拒绝生成。删除影视名称后,AI自动为角色设计符合清宫戏背景的争吵台词,但出现声音与口型不匹配的情况。这类问题在多人对话场景中尤为突出,显示技术对复杂交互的处理仍需改进。
AI配音功能存在明显缺陷:语气生硬、情感表达不足,若未明确指定语调,生成的对话会显得机械。提示词设计仍具挑战性,普通用户可能因描述不详细导致结果偏离预期,专业创作者则需反复优化提示词来弥补AI细节处理的不足。
OpenAI将Sora 2定位为“最先进的视频音频生成模型”,强调其从初代产品的“GPT-1时刻”直接跃升至“GPT-3.5时刻”。技术突破体现在音画同步、虚拟形象复用和多镜头叙事等方面,但实际体验显示其距离颠覆创意产业仍有差距。音乐制作人小旭指出,虽然音频质量超越多数同类工具,但10秒视频时长和480P分辨率限制了专业应用。
应用采用的邀请裂变机制印证了其社交属性:每个成功注册的用户可生成4个新邀请码,形成用户网络。但严格的版权限制削弱了娱乐性,系统会拦截多数真实人物和影视角色的创作请求。与抖音相比,Sora App缺乏话题挑战、达人生态等社交功能,内容同质化问题突出,用户刷屏后容易产生审美疲劳。
这款产品显著降低了AI视频创作门槛,整合了视频音频生成流程,普通用户通过简单操作即可获得创作乐趣。然而画质限制、内容同质化和技术瑕疵,使其难以满足专业创作者对高质量、长序列内容的需求。当前版本更像是一款有趣的消费级产品,要成为真正的生产力工具,仍需等待后续迭代完善。