科技·商业·财经

阿里HappyHorse 1.0来袭!实测图生视频,马斯克奥尔特曼“法庭激辩”

   时间:2026-04-27 22:22 作者:苏婉清

阿里ATH创新事业部近日宣布,其最新研发的视频生成与编辑模型HappyHorse 1.0(中文译名:快乐小马)已正式开启灰度测试。创作者可通过阿里云百炼平台和HappyHorse官网注册使用,普通用户则能在千问App中体验这一创新技术。

在盲测平台Arena.ai的最新评测中,HappyHorse 1.0在文生视频、图生视频和视频编辑三个榜单上均位列第二,仅次于近期备受关注的字节Seedance 2.0。为验证其实际效果,相关团队进行了多维度测试。

用户只需输入简单的文字描述,HappyHorse 1.0即可生成3秒至15秒的视频,支持多镜头切换和连贯剧情。该模型最高支持1080p分辨率,最多可同时生成4个视频。价格方面,生成720p和1080p视频的刊例价分别为每秒0.9元和1.6元,Pro套餐包月价格叠加限时折扣后为每秒0.44元和0.78元。

目前,HappyHorse 1.0已集成到阿里旗下多款产品中,包括阿里悟空、MuleRun和JVS Claw等Agent平台。千问App预告将推出“测一测”视频玩法,用户可测出自己在短剧宇宙中的本名角色,并通过HappyHorse 1.0生成本人“出演”的角色短剧片段。

测试结果显示,HappyHorse 1.0在指令遵循和生成速度方面表现突出,但在画面物理准确性、音画同步等方面仍有改进空间。具体而言,该模型生成视频仅需2至5分钟,与其他同类模型相比具有竞争力;能准确理解并执行复杂的提示词要求,包括镜头运动、画面构图和风格氛围等;在图生视频中,能高度还原上传的参考元素,如人物、场景和道具等。然而,在乐器演奏等复杂场景中,模型生成的手部动作与音频节奏存在明显错位;10秒以上的长视频中,容易出现无外力物体自移动等物理错误;画面中的文字常出现乱码或错误。

在文生视频能力测试中,HappyHorse 1.0展现了较强的指令遵循能力。例如,在“街头音乐表演”场景中,模型生成的人像无肢体异常,镜头运动和画面灯光符合要求,但吉他手演奏与音乐节奏不同步。在“海边悬崖”场景中,模型成功模拟了波涛汹涌的效果,海浪与岩石的撞击符合物理规律,但近景画面中水滴滑落速度略慢。

测试还考察了HappyHorse 1.0对超长提示词的理解能力。在一段长达800词的提示词测试中,模型准确呈现了画面中的几乎所有元素,包括人物、天气、环境和建筑等。然而,开头画面出现车门无外力自动关闭的物理错误,最后一个镜头中主角形象发生变化,显示一致性方面有待提升。

在图生视频测试中,HappyHorse 1.0支持最多9张图片参考。测试中,模型成功生成了OpenAI联合创始人萨姆·奥尔特曼喝咖啡的画面,人物与真人照片相似度达8成左右。在多人物参考测试中,模型初始生成结果未能体现马斯克与奥尔特曼争吵的效果,经细化要求后,能生成二人用英语争论的画面,但人物表情与参考图存在偏差。在多元素参考测试中,模型准确呈现了上传的所有参考元素,但画面中出现纸箱自动合上、门自动打开等物理错误。

业内人士对HappyHorse 1.0的表现给予了不同评价。出海一站式AI电商营销平台麦斯国际的技术合伙人李明认为,3秒至15秒的生成长度、较快的生成速度和支持1080p是该模型的亮点,但在生成结果一致性和语音内容机械感方面仍有提升空间。参与内测的AI视频创作平台FLOVA团队则认为,HappyHorse 1.0在真实感与叙事能力上表现不错,尤其适合叙事性内容和纪录片风格题材,其焦段运用接近实拍,镜头运动自然。

 
 
更多>同类内容
全站最新
热门内容