滚动资讯

当前位置：网界 > 行业动态 > 正文内容

CameraSquad：解锁多视角视频生成新维度助力空间智能迈向新台阶

时间：2026-06-21 23:03 作者：互联网

在视频生成技术迈向空间智能的关键阶段，中国科学院大学团队联合多所高校及企业提出名为CameraSquad的创新方法，通过并行生成多视角一致视频，为4D重建等任务提供高质量3D世界状态。该研究已被ACM SIGGRAPH 2026会议录用，标志着视频生成领域在空间一致性控制方面取得突破性进展。

传统视频生成技术面临核心挑战：当需要从不同视角观察同一场景时，现有方法往往因串行推理导致内容错位。例如，同一人物在不同视角下可能出现发型突变或动作轨迹断裂，这种不一致性严重制约了4D重建的精度和沉浸式应用的体验。研究团队通过解耦空间与内容信息，构建了支持多轨迹并行生成的视频扩散框架，使不同视角视频在内容、几何和运动层面保持高度一致。

技术实现上，CameraSquad在Wan2.2视频扩散模型基础上进行三大创新：首先设计相机与内容解耦注意力机制，将3D几何投影关系编码为注意力变换矩阵，使模型在注意力层面直接感知相机视锥体间的空间关系；其次提出双模式跨视角注意力模块，通过内容共享注意力（CVA-α）确保物体外观一致性，利用几何监督注意力（CVA-β）维持空间位置对齐；最后采用多视角深度估计反投影技术，将并行生成的视频转换为动态3D点云，其密度和精度较单视角反投影提升3倍以上。

实验数据显示，在WebVid和HumanVid数据集上，该方法将旋转误差控制在1.42°-1.52°区间，位移误差降低至2.86-3.47像素，两项指标均达到行业最低水平。视觉质量评估方面，FID指标在HumanVid数据集上取得30.78的优异成绩，CLIP-V相似度达91.37，证明空间控制未损害生成质量。特别在多轨迹生成测试中，系统可同步处理6组相机参数，生成的视频在纹理细节、运动轨迹和背景元素上保持跨视角一致，而对比方法均出现明显内容错位。

该成果为空间智能任务提供全新解决方案：在自动驾驶场景重建中，多视角一致视频可生成更精确的动态点云；在影视制作领域，导演可通过参数调整实时预览不同机位画面；在虚拟现实应用中，用户视角切换时能获得无缝的空间感知体验。研究团队采用两阶段训练策略，先在低分辨率下学习相机控制，再逐步提升分辨率并引入跨视角注意力模块，有效缓解了合成数据与真实场景的域差异问题。

更多>同类内容

雷军谈“过早”引热议：流量时代下，一笑置之或是最好应对之策

06-21

华为乾崑智驾发布避险视频，累计辅助驾驶里程超120亿公里再创新高

06-21

丰巢携手微信支付创新“刷掌取件”：无手机操作，取件更高效便捷

06-21

雷军谈“武汉街边蹲坐过早被吐槽”：流量时代需承受的代价

06-21

跨越国界与时代：“DNA之父”沃森与中国生命科学学者的深厚情谊

06-21

AI支付入口争夺战打响：支付宝“造城”与微信“修路”的路径之争

06-21

华润新能源明日启动申购拟募资245亿成深交所史上最大规模IPO

06-21

AI进入淘汰赛关键期：以市场为尺，织就安全网迎接新变革

06-21

雷军武汉过早遭小女孩吐槽“吃早饭多人拍照”：热搜多日，自感意外

06-21

雷军谈武汉“过早”上热搜：流量时代笑对争议，嘲讽亦是流量代价

06-21

雷军首谈与董明珠“赌约”风波：玩笑不妥，尊重前辈未回击

06-21

雷军吃早餐引热议回应“匪夷所思”：流量时代下真实松弛方为破局之道

06-21

顺钠股份高层变动：张译军辞去董事长兼总经理等多项职务

06-21

雷军BIBF分享创业经：造车亲自试驾170余辆，下真功夫筑牢基础

06-21

金价半年跌近450元跌幅超25% 端午假期黄金卖场消费者选购热情高涨

06-21

点击查看更多 +

全站最新

科大讯飞双屏翻译机：打破语言壁垒，让商务出行与跨国交流畅通无阻

商界铁娘子之女不拼家世拼实力，500块开启北漂路终成演艺圈“逆袭者”

贝索斯：AI将降低创造门槛，激活市场对建设者需求致劳动力紧缺

华为沪上发布鲲鹏超节点TaiShan 950 SuperPoD 助力金融Agentic AI新时代

婴儿纸尿裤“甲酰胺”风波持续，涉事品牌及多方发声回应质疑

钉钉新CEO陈宇森首封全员信：组织架构大调整，能否引领钉钉AI转型？

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号

CameraSquad：解锁多视角视频生成新维度 助力空间智能迈向新台阶

CameraSquad：解锁多视角视频生成新维度助力空间智能迈向新台阶