性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型

1月29日,百度正式发布并开源新一代文档解析模型PaddleOCR-VL-1.5。该模型以仅0.9B参数的轻量架构,在全球权威文档解析评测榜单OmniDocBench V1.5中取得全球综合性能第一成绩,整体精度达到94.5**%**,超过Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2等模型。

值得关注的是,PaddleOCR-VL-1.5 全球首次实现OCR模型的"异形框定位"能力,使机器能够精准识别倾斜、弯折、拍照畸变等非规则文档形态,首次让"歪文档"实现稳定、可规模化解析。该技术解决了传统OCR模型在移动拍照、扫描件变形、复杂光照等真实场景中因文档形变导致的识别失败问题,可广泛应用于金融票据处理、档案数字化、政务文档流转等场景。

PaddleOCR-VL-1.5 基于文心大模型进行开发,在 OmniDocBench V1.5多个关键指标上取得领先表现。其中,表格结构理解(92.8 分)和阅读顺序预测(95.8 分)两项核心指标上均位列第一,分别领先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2--5 分不等。在文档阅读顺序预测任务中,其版面逻辑解析错误率仅为同类其他模型约一半。这表明,PaddleOCR-VL-1.5 在复杂文档结构还原与版面逻辑理解方面具备更高稳定性,在合同、财报等高复杂度业务场景中拥有更高可用性。

2025年10月16日,百度首次发布并开源 PaddleOCR-VL模型,在 OmniDocBench V1.5 榜单中取得全球SOTA成绩,并连续五天登顶 HuggingFace全球模型总趋势榜与ModelScope全球模型总趋势榜双榜第一。

相比于上代,在功能层面,PaddleOCR-VL-1.5 进一步集成印章识别、文本检测与识别等任务能力,关键指标持续领跑;同时针对特殊场景与多语种识别进行系统优化,在生僻字、古籍文献、多语种表格、下划线与复选框等复杂结构识别方面显著提升,并新增对藏语、孟加拉语等语种的支持。模型还支持跨页表格自动合并与跨页段落标题识别,有效解决长文档解析中的结构断裂问题。

近半年来,全球主流模型厂商密集布局 OCR 领域。1月27日,深度求索发布新一代 OCR 模型 DeepSeek-OCR-2,引入"因果流查询"机制,并将语言模型融入视觉编码,在OmniDocBench V1.5中实现91.09%精度。与此同时,Mistral AI、字节跳动、腾讯等企业也相继推出新一代 OCR 模型,行业竞争持续加剧。

业内分析认为,随着大模型加速进入金融、政务、制造等高复杂度业务流程,文档解析能力正从"能用"走向"稳定可规模化落地"。PaddleOCR-VL-1.5 在精度、复杂场景适应性与工程化能力上的系统突破,有望进一步降低产业应用门槛,推动 OCR 技术在真实生产环境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面开源,开发者可通过GitHub、Hugging Face获取,并在 PaddleOCR 官网进行在线体验或通过百度智能云千帆平台调用API接口。

· 在线使用/API:https://www.paddleocr.com

· 开源项目地址:https://github.com/PaddlePaddle/PaddleOCR

· 模型下载地址:https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

相关推荐
王杨游戏养站系统1 天前
王杨游戏蜘蛛养站系统:提交百度站长工具平台教程!
游戏·百度·游戏下载站养站系统·游戏养站系统
全栈前端老曹2 天前
【前端地图】多地图平台适配方案——高德、百度、腾讯、Google Maps SDK 差异对比、封装统一地图接口
前端·javascript·百度·dubbo·wgs84·gcj-02·bd09
superstarsupers2 天前
宫庭海出席2026横琴-澳门国际数字艺术博览会 畅谈AI虚拟偶像产业新生态
人工智能·百度
S1998_1997111609•X2 天前
iOS栈被恶意篡改变成开发者模式漏洞裸露内核系统核心功能栈被泄露于政府黑客集团泄漏安全系统置门的犯罪行为原理
数据库·网络协议·百度·ssh·开闭原则
华科大胡子2 天前
百度搜索算法逆向思考
百度
新芒3 天前
大湾区人工智能应用研究院AI+游戏白皮书:重塑游戏价值理解框架
百度
sinat_367104563 天前
claude code 接入 百度搜索 mcp
百度·mcp·claude code
S1998_1997111609•X3 天前
论next/js在打击省份及犯罪行为集团的系统分析[特殊字符]设计
网络·数据库·百度·ssh·开闭原则
S1998_1997111609•X4 天前
login:/-system.web,dex.dmp,b-scode:app·%
网络·数据库·百度·facebook·twitter
S1998_1997111609•X5 天前
滄集/㞯鎩.赫量被恶意篡改?|\^*仺\~:sall,sql=㶏齾bci.ji.app_sql=-heart{TCP.box}‘雧……㞋
网络·数据库·网络协议·百度·微信