科技·商业·财经

阿里AI视频大模型HappyHorse登顶全球榜首 预计一周后正式开源发布

   时间:2026-04-10 18:25 作者:赵云飞

近日,阿里巴巴在AI视频生成领域取得重大突破,其自主研发的AI视频大模型HappyHorse1.0以1333Elo分的成绩登顶Artificial Analysis视频竞技场全球排行榜,成为当前开源模型中性能最强的视频生成工具。该模型由淘天集团未来生活实验室主导开发,技术负责人张迪带领团队完成,预计将于一周后通过阿里百炼平台正式对外开源。

作为全球首个原生支持音视频联合生成的开源模型,HappyHorse1.0采用40层统一自注意力Transformer架构,拥有150亿参数规模。在硬件效率方面,该模型在单张H100显卡上生成5秒1080p视频仅需38秒,较同类模型提升40%以上。其多语言支持能力尤为突出,可实现英语、普通话、粤语、日语、韩语、德语、法语七种语言的精准唇形同步,词错误率控制在行业最低水平。

在竞技场实测中,HappyHorse1.0展现出显著优势:对OVI1.1模型取得80%胜率,对LTX2.3模型胜率达60.9%。在文本转视频(无音频)和图像转视频(无音频)场景中,其生成质量全面超越Seedance2.0和可灵3.0;在文本转视频(有音频)领域保持小幅领先,图像转视频(有音频)场景则与Seedance2.0持平。这些数据验证了模型在跨模态生成任务中的技术领先性。

据开发团队介绍,HappyHorse1.0采用完全开源策略,将向全球开发者开放模型权重、训练代码和部署文档。其创新性的音视频联合生成架构,通过统一处理时空维度特征,解决了传统模型中音频视频不同步的技术难题。目前该模型已支持通过阿里百炼平台进行在线体验,开发者可自由调用API进行二次开发。

行业分析师指出,HappyHorse1.0的开源将推动视频生成技术进入新阶段,其多语言支持和高效推理能力特别适合短视频创作、影视特效、虚拟直播等商业场景。随着模型正式发布,预计将引发全球AI社区对跨模态生成技术的新一轮探索。

 
 
更多>同类内容
全站最新
热门内容