滚动资讯

当前位置：网界 > 行业动态 > 正文内容

商汤开源SenseNova U1图文交错生成增强版模型

时间：2026-06-12 21:59 作者：互联网

6 月 12 日消息，商汤科技今日宣布开源商汤日日新 SenseNova U1 系列新成员 —— U1-8B-MoT-Interleaved 图文交错增强版模型。

官方表示，该模型面向图文交错创作与生成（Interleaved Generation）场景进行了专项强化，更好地支持绘本、故事书、多页 PPT、图文教程等连续内容创作，解决传统多模态模型“多轮生成后角色形象飘移、画风断裂、图文脱节”等痛点。

据介绍，该模型核心升级主要体现在四个方面：

叙事一致性与角色连贯性大幅提升：模型显著提升了长周期创作中的叙事连贯性、角色一致性与画风统一性。故事线在整个生成过程中被严格遵循，人物形象从第一页到最后一页均保持高度一致；

图文对应关系增强，告别“图文脱节”：经过专项训练，模型大幅改善了图像内容与文字描述之间的语义对齐能力。生成的画面能更准确地呈现文本所描述的复杂场景、动态动作与物体间的空间关系；

视觉质量与 Artifact 明显改善：针对人物结构、文字渲染、页面排版等高频高难区域进行了定向优化，显著降低了生成物中的视觉瑕疵（Artifact）；

全新能力：多页 PPT 自动生成：新版本首次支持了多页 PPT 自动生成能力。模型能够智能从输入内容中提取要点，自行完成排版设计与文字渲染。

附开源链接如下：

https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved

更多>同类内容

赛力斯张兴海：受存储芯片涨价，问界单车平均成本涨近2万

06-12

雷军秀出小米家充机械臂：自动插拔枪，手机可遥控

06-12

鸿蒙HarmonyOS 7发布：Mate90今秋首发

06-12

华为龚体：鸿蒙HarmonyOS 6升级率达98%

06-12

雷军现身江苏盐城：一路逛吃打卡品尝特色鱼汤面、鸡蛋饼

06-12

vivo X Fold6搭载全新电脑模式：连上大屏界面更接近PC

06-12

赛力斯张兴海回应“增程是脱裤子放屁”

06-12

华为官宣昇腾亲和大模型：6月30日开源上线

06-12

华为余承东：鸿蒙和开源鸿蒙今年将优化到64KB内存也能跑

06-12

华为启动鸿图计划：加快开源鸿蒙生态规模化发展

06-12

华为余承东发布开源盘古2.0模型，月底陆续开源7大组件

06-12

华为发布HarmonyOS 7：鸿蒙空间计算+Agent架构演进

06-12

听劝！7875位网友建议成真：魏牌高山7 SUV版6月16日上市

06-12

字节跳动成立云瑞长石科技公司，注册资本16亿元

06-12

苹果iPhone 18 Pro Max机模曝光：深樱桃色等颜色亮相

06-12

点击查看更多 +

全站最新

泰和新材“5天4板”股价创新高业绩承压下如何谋转型突围？

90后技术天才陈宇森接棒钉钉CEO，AI新征程能否引领钉钉二次腾飞？

6·18大促百亿补贴“掺水” 五大电商平台遭监管约谈限期整改

淅川护林员陈人范：42年坚守水源地，用一生筑牢生态屏障荣膺“中国好人”

从换帅到新打法：钉钉变局背后，阿里文化与组织战略的深度调整

钉钉换帅陈宇森掌舵：阿里以年轻之力，开启AI原生组织新征程

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号