滚动资讯

当前位置：网界 > 行业动态 > 正文内容

科研绘图告别“美工关”：三校联合研发AI系统实现多场景智能绘图与编辑

时间：2026-06-07 05:01 作者：快讯

科研人员常面临一个耗时耗力的难题：论文中的架构图、流程图或学术海报，即便实验数据已完备，绘制一张准确且美观的配图仍需数小时甚至一整天。传统绘图工具要求手动对齐元素、调整布局，修改时往往牵一发而动全身，而现有AI绘图工具虽能生成风景或人像，却难以应对科研图示的结构化需求——它们或依赖单一文字输入，或输出静态位图无法局部编辑，更常因局部错误（如箭头错位、标签乱码）导致反复重试仍无法修正。

针对这一痛点，一支跨学科研究团队提出系统性解决方案：通过构建多智能体框架CRAFTER与配套工具CRAFTEDITOR，将科研配图生成转化为“调度-校正”流程，而非单纯依赖图像生成模型的“单次输出”。该框架不追求更强的底层引擎，而是通过五个协作智能体维护一份动态更新的“图形规格说明书”，记录布局、颜色、元素约束及修改历史，确保每次迭代精准定位问题而非累积矛盾。实验显示，这一设计使系统在覆盖18个学科的评测基准CRAFTBENCH上领先第二名超22分，且能处理文字、草图、遮罩、关键元素四种输入形式，生成可逐元素编辑的SVG矢量图。

科研配图的复杂性远超普通图像：一张方法架构图可能包含数十个命名模块、带标签箭头、颜色分区及精确空间关系，任何部件错误都会破坏整体准确性。现有AI工具的“随机性”缺陷在此尤为突出——同一段描述可能生成布局截然不同的图，且每次修改都会引入新错误。研究团队将此比喻为“没有记忆的修改”：模型仅叠加文字指令而不更新结构化理解，导致指令矛盾累积，生成质量下降。传统工具仅支持文字输入、输出位图无法局部编辑的短板，进一步限制了其在科研场景的应用。

CRAFTER的核心创新在于其“调度套具”设计：五个智能体各司其职，形成闭环修正流程。意图推理器首先解析用户输入（文字、草图或元素），生成初始说明书；方案生成器提出多种布局候选，并行生成图像；批评员从内容准确性、布局一致性等六维度诊断问题，输出具体修正建议；说明书修改员将诊断转化为结构化编辑指令，避免文字堆叠矛盾；收敛判断器决定是否接受当前结果或回退至历史最优版本。这一流程通过多方案探索避免“先天布局缺陷”，通过结构化记忆确保修改意图可追溯，通过自动回退机制防止质量退步，最终将生成成功率提升至传统方法的3倍以上。

为验证框架的泛化能力，研究团队构建了包含279个样本的评测集CRAFTBENCH，覆盖学术配图、会议海报、信息图三种类型，任务场景扩展至遮罩补全、关键元素组合及草图条件生成。评测采用“AI对标人类”的自动评分机制，结果显示CRAFTER在所有任务类型和质量维度上均显著领先，且对底层引擎的依赖度较低——更换更强的图像生成模型仅提升总分2.1分，证明框架价值主要来自调度逻辑而非引擎性能。进一步分析表明，去除多方案探索、结构化说明书或修改循环等机制均会导致总分下降超5分，验证了各组件的不可替代性。

生成高质量配图后，如何实现局部编辑成为另一挑战。传统位图修改需重新生成整张图，而研究团队开发的CRAFTEDITOR可将位图转换为结构清晰的SVG矢量图，支持单独修改模块标签、调整配色或替换图标。该工具通过“提取-处理-合成”三阶段实现转换：视觉理解智能体首先清理背景噪声，保留核心元素；分类智能体为每个元素标注坐标并决定矢量/位图嵌入方式；语言模型生成SVG骨架草案后，混合批评员结合程序化检查器检测文字溢出、箭头对齐等结构问题，确保输出符合科研规范。评测显示，CRAFTEDITOR在位置、颜色、文字等七维度评分全面领先同类工具，尤其在箭头端点对齐等细节上优势显著。

尽管CRAFTER在提升科研绘图效率方面展现潜力，研究团队也坦诚指出其局限性：意图推理器可能误解子图数量导致面板丢失，遮罩补全任务中填充区域风格不连贯，草图生成时过度忠实布局而忽略具体内容。针对这些问题，团队提出在意图推理阶段增加子图数量核查、优化填充区域连贯性检测及强化草图内容理解等改进方向。目前，系统生成单张图成本在0.25至0.85美元之间，且评测集信息图覆盖较薄弱，未来需通过扩大样本量及降低成本进一步提升实用性。相关代码与数据集已开源，研究者可通过论文编号查询技术细节。

更多>同类内容

AI进军3D建模领域：首个专业评测平台亮相，能力边界与突破路径何在？

06-07

本田HRC总裁透露：思域Type R HRC Concept将量产，性能升级值得期待

06-07

康奈尔大学新突破：AI化身3D设计师，单图秒变可编辑3D场景

06-07

卡内基梅隆大学新突破：多智能体协作让电脑操作AI告别“单打独斗”

06-07

AI智能体告别“健忘症”！清华等团队新框架让探索记忆双进化

06-07

AI组队刷题为何成绩波动？多智能体协作的成败密码被破解

06-07

香港城大与快手团队新突破：为视频生成模型配备“逻辑纠错监考官”

06-07

AI长视频生成新突破：京东开源JoyAI-Echo，告别抽卡开启协作新范式

06-07

英伟达、南加大与MIT新突破：AI视频生成有了“记忆库”，长视频更稳定

06-07

汽车油耗莫名飙升别慌！5个自查小妙招，自己动手轻松解决高油耗

06-07

国产机器人闪耀世界舞台：创新驱动、刚需引领，广东企业书写出海新篇章

06-07

广东团餐调味需求激增，哪些企业能精准适配提供定制化服务？

06-07

百年人寿“百年V店”上线：数字化赋能顾问，开启寿险服务新征程

06-07

广东团餐调味定制需求如何满足？这些企业凭实力与服务脱颖而出

06-07

字节跳动辟谣造车：赛豆聚焦技术服务，助力汽车智能化升级

06-07

点击查看更多 +

全站最新

从智能清洁到跨界造车手机，俞浩的多元化之路：理想照进现实还是“画饼”难圆？

华为“蒲公英计划”启航：携手全球伙伴共筑教育医疗智能新生态

字节跳动明确辟谣：未涉足造车领域赛豆与字节无股权关联

古尔曼爆料：iOS 27优化底层架构，助力iPhone 17等机型续航提升

SNEC光伏展观察：AI智能体成焦点算电协同发展挑战与机遇并存

夏日驱蚊市场乱象：劣质白牌大厂“毒”谋套利终遭监管重拳出击

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号