字节跳动Bernini框架开源：创新协同机制破解视频生成编辑行业难题

时间：2026-06-04 11:02 作者：ITBEAR

字节跳动商业化技术团队近日宣布开源一款名为Bernini的视频生成与编辑框架，该框架通过“先理解、后生成”的协同机制，针对性解决了传统模型在处理复杂指令时常见的画面失控、帧间闪烁等问题。其核心创新在于将视频处理流程拆分为语义规划与视觉渲染两个独立模块，形成更高效的工作流。

在技术实现上，Bernini首先利用多模态大模型对输入素材进行深度解析，生成包含关键元素的“语义草图”，再由渲染模块将抽象规划转化为稳定连续的视频画面。这种分工模式显著提升了可控编辑能力，用户可通过自然语言指令调整天气、季节、视觉风格等参数，同时精准控制镜头视角、焦点位置及主体动作轨迹。

该框架突破了传统文本操控的局限，支持引入图片和视频作为视觉参考素材。在视频编辑场景中，系统能将特定材质或海报精准植入目标区域，并自动处理透视关系与边界融合问题。针对新视频生成需求，Bernini实现了从单图或多角度参考到连续镜头的自动化演变，通过专属位置编码机制有效解决了多素材串联时的时空混淆难题。

据内部测试数据显示，Bernini在字节自建评估体系中已跻身行业第一梯队。目前其推理代码与第二阶段模型Bernini-R的权限已全面开放，完整功能版本将于近期上线。开发者可通过项目官网（https://bernini-ai.github.io/）获取技术文档与开源代码。

更多>同类内容

谷歌推出新功能：网站所有者可自主掌控内容是否现身生成式AI搜索

06-04

小米汽车YU7 HyperOS1.16升级：智驾大模型全系搭载，多模式优化驾乘体验

06-04

谷歌Gemini App月活破9亿，AI搜索普及超25亿，技术迭代引领新竞争

06-04

港股异动丨黄金股普跌国际金价走低黄金ETF近一个月资金净流出超百亿元

06-04

A股早评：三大指数集体低开，CPO、AI PC概念股回调

06-04

港股早评：三大指数低开，科技股继续下跌，石油黄金软件股普跌

06-04

大东南(002263.SZ)：公司拥有锂电池隔膜生产线，没有陶瓷复合隔膜生产线

06-04

大东南(002263.SZ)：公司目前没有mlcc相关研发项目

06-04

铭利达(301268.SZ)：目前公司已掌握数据中心和服务器液冷产品相关核心技术和制造工艺，500KW CDU、服务器水冷板、Close loop液冷模组等产品研发进展良好

06-04

美股异动丨CrowdStrike夜盘跌超10%，第二财季业绩指引未能“惊艳市场”

06-04

振芯科技(300101.SZ)：公司的GPU算力板卡主要针对特定行业，占收入比例很低

06-04

年内主动权益翻倍基突增至11只张明昕、金梓才包揽业绩前四

06-04

台积电CEO：将自主驾驶汽车和机器人视为长期增长动力

06-04

钯期货跌4%

06-04

香港推出首个生产力级超级智能体

06-04

点击查看更多 +

全站最新

华为2026智能光伏战略&新品发布会：以技术创新引领新型电力系统新未来

字节跳动估值攀升助力张一鸣，再登中国首富宝座缩与亚洲顶富差距

华为智能光伏战略新品发布：以构网与AI之力，共拓能源低碳智能新路径

B站盈利背后：中腰部UP主生存困境，创作热情在现实账本前消散？

千寻智能斩获15亿A+轮融资，具身基座模型登顶北美赛事，商业化加速推进

淘宝虚拟电商如何稳健起步？掌握六大基本功，推荐靠谱虚拟资源平台

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号