商汤科技发布U1-8B-MoT-Interleaved模型：图文创作更连贯，多页PPT一键生成

时间：2026-06-12 23:15 作者：格隆汇

商汤科技今日正式推出其日日新SenseNova U1系列全新模型——U1-8B-MoT-Interleaved图文交错增强版，并宣布开源供全球开发者使用。该模型针对图文混合创作场景进行了深度优化，旨在解决传统多模态模型在连续内容生成中存在的角色形象不一致、画面风格断裂以及图文语义错配等核心问题。

在叙事连贯性方面，新模型通过强化长周期创作能力，实现了故事线从首页到末页的严格遵循。测试数据显示，人物形象在跨页生成中的相似度提升超过40%，画面风格统一性指标达到行业领先水平。这一突破使得绘本创作、长篇故事书生成等复杂场景成为可能。

针对图文对应关系这一行业痛点，研发团队构建了专门的语义对齐训练框架。模型能够精准解析文本中的空间关系、动作描述等复杂信息，生成的图像在物体位置、动态表现等方面与文字描述的匹配度提升60%以上。例如在生成"小猫在沙发上跳跃"这类场景时，模型可准确呈现物体间的相对位置和动作轨迹。

视觉质量优化方面，模型对人物结构、文字渲染等高频问题区域实施定向改进。通过引入三维解剖知识约束和排版美学评估模块，生成内容中的视觉瑕疵减少55%，文字可读性显著提升。在多页PPT生成场景中，模型可自动完成要点提炼、版式设计和图文混排，用户仅需输入核心内容即可获得专业级演示文档。

该模型现已在Hugging Face平台开放下载，开发者可通过以下链接获取完整代码和预训练权重：https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved。商汤科技表示，此次开源将推动图文创作领域的技术普惠，为教育、出版、广告等行业提供更高效的智能化解决方案。

更多>同类内容

赛力斯张兴海谈车企困境：存储芯片碳酸锂涨价，问界单车成本增1.5至2万

06-12

华为开发者大会2026：星闪协议栈7月15日全量开源引领短距通信新潮流

06-12

雷军官宣小米汽车家用充电机械臂：自动充断电手机远程操控无感体验

06-12

华为鸿蒙HarmonyOS 7系统卓易通App升级现已支持安卓16版本

06-12

鸿蒙HarmonyOS 7正式亮相：AI赋能性能跃升 Mate90系列秋季首发搭载

06-12

华为开发者大会：龚体透露鸿蒙HarmonyOS 6升级率高达98% 用户满意度佳

06-12

蔚来严打“山寨NOMI”：多地公司被诉仿冒品存严重安全隐患

06-12

雷军盐城行：逛吃打卡体验风土人情更为小米YU7测试直播精心筹备

06-12

vivo X Fold6折叠屏来袭：电脑模式+定制SoC，打造随身工作新体验

06-12

华为AI眼镜携手小艺看世界8月登场，助力视障群体开启探索世界新旅程

06-12

赛力斯张兴海：增程技术曾遭质疑，数据力证其破解充电与里程难题

06-12

余承东再掌华为大模型：以先驱之姿立赶超之志，目标直指第一

06-12

华为昇腾亲和大模型发布：6月30日开源，赋能AI应用大规模部署

06-12

澜起科技(06809.HK)获摩根大通增持54.37万股

06-12

龙蟠科技(02465.HK)获摩根大通增持45.6万股

06-12

点击查看更多 +

全站最新

HDC2026看小艺进化：从助手到智慧大脑，重新定义智能体时代交互与服务

泰和新材“5天4板”股价创新高业绩承压下如何谋转型突围？

90后技术天才陈宇森接棒钉钉CEO，AI新征程能否引领钉钉二次腾飞？

6·18大促百亿补贴“掺水” 五大电商平台遭监管约谈限期整改

淅川护林员陈人范：42年坚守水源地，用一生筑牢生态屏障荣膺“中国好人”

从换帅到新打法：钉钉变局背后，阿里文化与组织战略的深度调整

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号