百度PaddleOCR-VL-1.6发布：全球领先准确率，复杂文档解析再升级

时间：2026-06-03 03:34 作者：快讯

在多模态大模型技术竞争日益激烈的当下，一款名为PaddleOCR-VL-1.6的开源文档识别系统引发行业关注。该系统由文心大模型团队研发，在权威评测基准OmniDocBench v1.6中以96.33%的准确率刷新全球纪录，超越包括Gemini-3-Pro、GPT-5.2在内的多款国内外主流模型，成为复杂文档解析领域的性能标杆。

这款新模型延续了0.9B参数的轻量化架构设计，却实现了核心识别能力的显著突破。通过创新的模型驱动数据构建机制与渐进式训练策略，系统在表格结构解析、古籍文字识别、生僻字处理、印章定位及图表信息提取等复杂场景中展现出卓越性能。在Real5-OmniDocBench真实场景评测中，该系统以93.19%的综合指标持续领跑，有效解决了扫描件噪点、文档弯折变形、屏幕拍照畸变、光照不均以及倾斜文档等长期困扰行业的解析难题。

作为文心大模型多模态技术体系的重要组成部分，PaddleOCR系列已支持超过100种语言的文字识别，服务范围覆盖全球170余个国家和地区。此次升级版本保持了与前代系统的架构兼容性，企业用户和开发者无需修改现有代码即可实现无缝迁移。开源社区的热烈反响印证了其技术价值——GitHub平台上的项目关注量已突破79.2K次，超越谷歌Tesseract OCR成为全球最活跃的开源OCR项目。

目前，PaddleOCR-VL-1.6的完整代码与预训练权重已在官方平台开放下载。这款兼具高性能与轻量化的模型，不仅为金融、档案、出版等行业的文档数字化提供了高效解决方案，更通过开源生态的构建，加速推动人工智能技术在复杂多模态场景中的规模化应用。其技术突破标志着我国在文档智能解析领域已达到国际领先水平，为全球开发者贡献了具有自主知识产权的核心技术方案。

更多>同类内容

马斯克xAI招中文AI导师，时薪最高超300元，远程办公机会难得

06-03

奥特曼驳“AI致裁员论”：积极用AI的企业反成招聘“大户”？

06-03

Claude iOS版将焕新设置菜单推出“记忆文件”功能优化移动端体验

06-03

软银750亿欧元重注法国算力，开启欧洲AI基础设施投资新篇章

06-03

摩托车保养秘籍大公开！五个实用细节，让爱车越骑越“年轻”！

06-03

技术创新引领市场智能化普及加速比亚迪5月成绩斐然彰显中国新能源实力

06-03

长城汽车5月销量数据揭晓：欧拉魏牌增长显著哈弗坦克等有波动

06-03

零跑汽车斥资6.87亿拿地 20亿打造全球总部开启“产权扎根”新征程

06-03

摩托车胎压别照搬说明书！3万公里老骑手总结的实用调压指南

06-03

极石汽车月销刚过两千却存续5年：魏桥布局轻量化背后的关键棋子

06-03

赛道利器再进化！全新丰田GRMN卡罗拉升级登场，限量发售配6MT

06-03

郑州日产逆势上扬：1-5月销量劲增超五成，新能源与出海双轮驱动

06-03

比亚迪深汕布局成效显著：第二代刀片电池落地，闪充战略加速推进

06-03

节油混动成全球新宠：日系领跑，国产车企加速布局燃油技术新赛道

06-03

SpaceX拟本月IPO：与投行协商压低承销费率至0.75%以下仍或赚5亿

06-03

点击查看更多 +

全站最新

字节AI大牛顾全全离职：从AI制药到LLM基建，顶尖学者未来去向引猜测

字节开源视频新框架Bernini：多模态规划+Diffusion渲染，AI视频编辑精准可控再升级

对话灵初王启斌：锚定轮式双臂，探索具身智能“笃定派”的破局之路

AI走向全民时代：文科生“翻译官”成推动技术普及关键力量

搜狐教育盛典：启郡教育余志成谈成人教育，从“追随”到“架构”引领新方向

2025 Agent元年：小厂借AI东风，在垂直赛道加速崛起

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号