阿里HappyHorse 1.0来袭！实测图生视频，马斯克奥尔特曼“法庭激辩”-网界

阿里ATH创新事业部近日宣布，其最新研发的视频生成与编辑模型HappyHorse 1.0（中文译名：快乐小马）已正式开启灰度测试。创作者可通过阿里云百炼平台和HappyHorse官网注册使用，普通用户则能在千问App中体验这一创新技术。

在盲测平台Arena.ai的最新评测中，HappyHorse 1.0在文生视频、图生视频和视频编辑三个榜单上均位列第二，仅次于近期备受关注的字节Seedance 2.0。为验证其实际效果，相关团队进行了多维度测试。

用户只需输入简单的文字描述，HappyHorse 1.0即可生成3秒至15秒的视频，支持多镜头切换和连贯剧情。该模型最高支持1080p分辨率，最多可同时生成4个视频。价格方面，生成720p和1080p视频的刊例价分别为每秒0.9元和1.6元，Pro套餐包月价格叠加限时折扣后为每秒0.44元和0.78元。

目前，HappyHorse 1.0已集成到阿里旗下多款产品中，包括阿里悟空、MuleRun和JVS Claw等Agent平台。千问App预告将推出“测一测”视频玩法，用户可测出自己在短剧宇宙中的本名角色，并通过HappyHorse 1.0生成本人“出演”的角色短剧片段。

测试结果显示，HappyHorse 1.0在指令遵循和生成速度方面表现突出，但在画面物理准确性、音画同步等方面仍有改进空间。具体而言，该模型生成视频仅需2至5分钟，与其他同类模型相比具有竞争力；能准确理解并执行复杂的提示词要求，包括镜头运动、画面构图和风格氛围等；在图生视频中，能高度还原上传的参考元素，如人物、场景和道具等。然而，在乐器演奏等复杂场景中，模型生成的手部动作与音频节奏存在明显错位；10秒以上的长视频中，容易出现无外力物体自移动等物理错误；画面中的文字常出现乱码或错误。

在文生视频能力测试中，HappyHorse 1.0展现了较强的指令遵循能力。例如，在“街头音乐表演”场景中，模型生成的人像无肢体异常，镜头运动和画面灯光符合要求，但吉他手演奏与音乐节奏不同步。在“海边悬崖”场景中，模型成功模拟了波涛汹涌的效果，海浪与岩石的撞击符合物理规律，但近景画面中水滴滑落速度略慢。

测试还考察了HappyHorse 1.0对超长提示词的理解能力。在一段长达800词的提示词测试中，模型准确呈现了画面中的几乎所有元素，包括人物、天气、环境和建筑等。然而，开头画面出现车门无外力自动关闭的物理错误，最后一个镜头中主角形象发生变化，显示一致性方面有待提升。

在图生视频测试中，HappyHorse 1.0支持最多9张图片参考。测试中，模型成功生成了OpenAI联合创始人萨姆·奥尔特曼喝咖啡的画面，人物与真人照片相似度达8成左右。在多人物参考测试中，模型初始生成结果未能体现马斯克与奥尔特曼争吵的效果，经细化要求后，能生成二人用英语争论的画面，但人物表情与参考图存在偏差。在多元素参考测试中，模型准确呈现了上传的所有参考元素，但画面中出现纸箱自动合上、门自动打开等物理错误。

业内人士对HappyHorse 1.0的表现给予了不同评价。出海一站式AI电商营销平台麦斯国际的技术合伙人李明认为，3秒至15秒的生成长度、较快的生成速度和支持1080p是该模型的亮点，但在生成结果一致性和语音内容机械感方面仍有提升空间。参与内测的AI视频创作平台FLOVA团队则认为，HappyHorse 1.0在真实感与叙事能力上表现不错，尤其适合叙事性内容和纪录片风格题材，其焦段运用接近实拍，镜头运动自然。

此前，阿里ATH方面透露，阿里巴巴在AI视频生成领域已深耕多年，HappyHorse项目由ATH创新事业部主导，联合阿里平台技术、通义实验室及淘天技术等多个团队协同打造。在翁冬冬看来，用大模型做AI视频，…

Agent Native 需要的是，文件格式从 .docx 换成 Markdown、CSV、HTML 这些 Agent直接读写的纯文本，Agent 之间有共享的上下文而不是各自锁在对话窗口里，新能力写一段…

在机身尺寸与电池等用户高度关注的配置方面，三星也做出了一些重大调整。电池方面，三星ZFold8将电池容量大幅提升至5000mAh，并将有线快充从Fold7的25W升级至45W，这是Z Fold系列自Fo…

月 27 日消息，据博主 @数码闲聊站今日爆料，某厂下一代有类 Pro mini 定位新旗舰，2nm 旗舰芯 +50Mp LOFIC超大底新主摄 + 新潜望。结合该博主此前的爆料习惯，预计为 vivo 旗…

我比较喜欢它的一点，是这款手机没有只靠华为品牌撑价格，而是真的把体验做得比较均衡。所以我的看法很简单，如果你预算充足，喜欢新机，愿意为Pura系列买单，那Pura90当然可以看；但如果你只是想买一台好用、…

科大讯飞携星火新一代多模态智能座舱、iFLYSOUND智慧声场氮化镓母带级声学系统以及星火海外大模型重磅登场，重新定义AI座舱的智能边界，让智能汽车成为会办事、更懂你的出行伙伴，为中国汽车走向全球注入更加强劲…

所以我的建议很明确，如果你就想买最新款，喜欢大电池和前置自拍，Pura90标准版可以考虑；但如果你更看重后置影像、旗舰质感、大内存和综合配置，Pura80 Pro+现在这个4719元的价格，我认为更值得捡漏…

后来我听领导说过一句：那个项目从一开始就没把干系人搞定，业务方和研发之间信息从来没对齐过，需求改一次撕一次。他一走，他下面的人接不住。不是我有多积极，是我发现公司裁到最后，留下来的都不是单一技能最强的人，是能…

随着 DeepSeek-V4的发布，百万上下文从大模型的「高端选配」变成了「基础标配」，正式迈入普惠时代。正如官方所说：“从现在开始，1M（一百万）上下文将是DeepSeek 所有官方服务的标配。” …

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号