
软件名称:PaddleOCR-VL
操作系统支持:Windows(主流版本均兼容,无需复杂配置)
软件介绍:PaddleOCR-VL 是百度飞桨推出的视觉 - 语言多模态文档解析模型,相比传统 OCR,它不仅能识别印刷体,还能精准搞定手写体、数学公式、表格等复杂内容,参数仅 0.9 亿,低配电脑也能流畅运行;搭配整合包,新手双击脚本就能启动,零编程基础也能上手。

PaddleOCR-VL 的出色功能
PaddleOCR-VL 就像 "OCR 界的全能选手",把传统 OCR 的短板全补上:
- 「精准到离谱」:印刷体识别零误差,手写体哪怕是连笔字、潦草笔记,都能像人工誊写一样准;
- 「公式杀手」:不管是微积分、线性代数还是几何公式,识别准确率 99%,仅偶尔符号小偏差,比手动敲公式快 10 倍;
- 「隐私拉满」:全程本地运行,图片不用上传任何服务器,身份证、合同、隐私笔记识别都放心;
- 「零门槛启动」:不用配环境、装依赖,整合包解压后双击脚本,自动下载模型、启动服务,5 分钟搞定部署。

实用场景
场景 1:学生党论文 / 课件制作
- 痛点:写论文时手写公式转电子版费时间,在线 OCR 要么识别错,要么按次收费;课件里的印刷体资料想提取文字,反复复制粘贴眼睛累。
- 爽点:把手写公式图片拖进 PaddleOCR-VL,10 秒出电子版公式,直接复制到 Word;印刷体资料一键识别成文本,再也不用手动打字,做课件效率翻倍。
场景 2:职场办公报销 / 文档整理
- 痛点:财务整理手写报销单,数字识别错了要返工;行政整理多语种合同,在线 OCR 识别乱码,还担心合同隐私泄露。
- 爽点:本地运行 PaddleOCR-VL 识别报销单,手写数字 / 金额零误差;多语种合同识别精准,全程不上传,隐私合同绝对安全。
场景 3:小型团队异地协作
- 痛点:设计师给客户传设计稿里的文字,本地 OCR 只能自己用,客户要识别得反复传图;团队成员不在同一办公室,没法共用 OCR 工具。
- 爽点:用 cpolar 穿透后,生成公网地址,客户 / 同事不管用手机还是异地电脑,直接访问就能用 PaddleOCR-VL 识别,不用传图,协作超丝滑。

cpolar 内网穿透技术带来的便利
原本 PaddleOCR-VL 只能在自己电脑上用,就像 "把好用的工具锁在自家书房",而 cpolar 内网穿透直接给这扇门装了 "万能钥匙",便利多到数不过来:
- 跨设备自由用:在家用电脑部署好 PaddleOCR-VL,出门用手机、平板、公司电脑,只要能上网,就能访问自己的私人 OCR 平台,地铁上也能识别图片文字;
- 固定域名不折腾:免费版随机域名 24 小时换一次,升级 cpolar 后能设固定二级子域名,不用每天记新地址,收藏一次就能永久用;
- 安全访问不翻车:给 cpolar 隧道加访问授权验证,设置账号密码,只有知道凭证的人能访问,再也不怕陌生人蹭用你的 OCR 服务;
- 零路由器配置:不用懂端口映射、公网 IP,cpolar 一键穿透,哪怕是租房、公司内网,也能轻松把本地 OCR 服务放到公网;
- 团队共用超方便:小团队不用每人都部署 PaddleOCR-VL,只要一台电脑部署好,用 cpolar 穿透后,全团队都能远程使用,节省时间和电脑资源;
- 隐私 + 便利双在线:既保留了 PaddleOCR-VL 本地运行的隐私性,又实现了公网访问的便利性,不用在 "安全" 和 "方便" 之间二选一。

总结
PaddleOCR-VL 彻底解决了 "在线 OCR 收费 / 限次 / 隐私差、传统 OCR 识别不准" 的痛点,堪称免费 OCR 工具的 "天花板";而 cpolar 内网穿透则给这个天花板装上了 "升降梯",把只能在本地用的优质 OCR 服务,变成了跨设备、跨地域、随时随地能用的私人神器。
不用花一分钱,不用懂编程,半小时就能搭建好 "专属私人 OCR 平台":既能精准识别印刷体、手写体、数学公式,又能安全跨设备使用,不管是学生、职场人还是小团队,都能告别 OCR 的各种糟心事,真正实现 "识文字自由"。
免费还好用不香吗?香就按照下面的教程安装起来吧!
这一篇,就带你从零开始,用 PaddleOCR-VL + cpolar 搭建属于你自己的"私人OCR平台"。
一步步走完,你也能拥有一套随时在线、完全掌控的AI识图系统。
1 什么是PaddleOCR-VL?

PaddleOCR‑VL 是 PaddleOCR 3.x 系列中的一款 视觉‑语言多模态文档解析模型 ,专门面向复杂文档场景设计。相比传统 OCR 仅能识别文字,PaddleOCR‑VL 通过融合视觉编码器与语言模型,实现了从"文字识别"到"图文理解"的跨模态能力。它不仅可以精准识别文字,还能理解文字在文档中的结构和语义,例如表格、公式、图表以及多栏排版内容。
该模型参数规模适中(约 0.9 亿 ),兼顾高精度和资源效率,因此既适合本地部署,也可在私有云或远程环境中使用。更重要的是,PaddleOCR‑VL 支持多语言文本识别(超过 100 种语言),在处理多语种混排文档时表现出色。凭借其跨模态能力,它不仅可以完成大批量文档解析,还能为知识抽取、智能问答等后续任务提供结构化输入,成为现代智能文档处理系统的核心技术。
简而言之,PaddleOCR‑VL 是一款专业的多模态文档理解模型,突破了传统 OCR 的局限,实现了文字识别、版式理解与语义分析的有机结合。
2 PaddleOCR‑VL下载及启动
由于官方的开源代码方式部署环境较为复杂不适宜新手小白入门上手,所以本教程演示的将使用**@十字鱼**提供的整合包,让新手小白入门上手变得更加简单!
整合包可以访问123网盘获取:
123云盘永久链接:https://www.123865.com/s/3jOKVv-wrNzH?pwd=1314#
提取码:1314

将整合包 下载下来后,进行解压,解压后,进入解压后的目录内,双击执行01运行程序.bat脚本:

执行脚本后,会打开cmd窗口,检测你的电脑配置情况,以及下载模型:

启动完成后,会出现URL地址:

且会自动在浏览器中打开,如果没有打开,手动访问如下地址即可:
shell
http://127.0.0.1:7891

出现如上页面,PaddleOCR‑VL整合包就启动完成啦!
3 简单使用PaddleOCR‑VL
PaddleOCR‑VL 可以用来识别各种类型的文字,本部分将演示 印刷体、手写体和数学公式,其他类型就不一一全部演示了,通过这几个示例让你快速了解模型的核心功能和基本使用方法。
3.1 印刷体OCR识别
首先,准备一张要识别的图片,这里使用的如下图片:

在页面上点击上传区域,或者直接把图片拖入上传区域种进行上传:

文件上传后,点击下方的开始生成 按钮:

点击开始后,可以按快捷键Ctrl + shift +esc键打开任务管理器,然后查看GPU的负载:

可以看到,当前用的RTX2080ti显卡占用达到了83%,如果占用降下去了,说明OCR已经识别完成了,可以回到页面查看:

页面提示完整下载请去outputs文件夹,下载md文件和对应的imgs文件夹 ,我们可以打开项目目录,进入outputs 目录下:

进入后可以看到一个文件夹,里面的子目录可以看到生成的文件和图片,参考如下图:

可以通过原图和OCR识别后的图片进行对比查看:

基本上没有发现什么识别错误,完美的识别出了印刷体图片上的英文内容!
3.2 手写体OCR识别
前面演示了印刷体识别,可能有的小伙伴会说,这个太正常了。那我们接下来识别一下手写体的图片,这里准备了如下一张图片:

让我们看看PaddleOCR‑VL 是否能够识别出来吧!由于上传和生成步骤一直,这里就不做逐步演示了,直接展示结果吧:

可以看到,完美的把内容识别出来了,而且竟然没有任何错误!
3.3 数学公式OCR识别
前面演示了印刷体 和手写体识别,可以看到,效果非常好,接下来我们来试试数学公式,看看能否识别出来,这里准备的图片如下:

直接来看看效果对比一下吧:

可以发现,除了原图种的回车符号,显示成了句号以外,以及开口方向的表格列和原图不符合 ,其他的文字 以及数学公式完成正确!准确率极高!
4 下载cpolar内网穿透
在前面,我们已经成功启动了 PaddleOCR-VL 项目,也可以正常通过 http://127.0.0.1:7891/ 这样的地址进行访问,并实现图片识别功能。
但是细心的你可能已经发现了------这个地址只能在本地设备 访问,一旦换到其他电脑、手机,或者想让朋友远程体验时,就完全打不开了。
这其实是因为本地服务默认只在你的计算机内部运行,没有对外网络入口。
接下来,我们就来解决这个问题:通过 cpolar 内网穿透,让 PaddleOCR-VL 也能像在线网站一样被外部访问。
4.1 什么是cpolar?

- cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。
- 广泛支持 Windows、macOS、Linux、树莓派、群晖 NAS 等平台,并提供一键安装脚本方便部署。
4.2 下载cpolar
打开cpolar官网的下载页面:https://www.cpolar.com/download
点击立即下载 64-bit按钮,下载cpoalr的安装包:

下来下来是一个压缩包,解压后执行目录种的应用程序,一路默认安装即可,安装完成后,打开cmd窗口输入如下命令确认安装:
shell
cpolar version

出现如上版本即代表安装成功!
4.3 注册及登录cpolar web ui管理界面
4.3.1 注册cpolar
访问cpolar官网,点击免费注册按钮,进行账号注册

进入到如下的注册页面进行账号注册:

4.3.2 访问web ui管理界面
注册完成后,在浏览器中输入如下地址访问 web ui管理界面:
shell
http://127.0.0.1:9200

输入刚才注册好的cpolar账号登录即可进入后台页面:

5 穿透PaddleOCR-VL项目以支持公网访问
5.1 随机域名方式(免费方案)
随机域名方式适合预算有限的用户。使用此方式时,系统会每隔 24 小时 左右自动更换一次域名地址。对于长期访问的不太友好,但是该方案是免费的,如果您有一定的预算,可以查看大纲5.2 的固定域名方式 ,且访问更稳定。
点击左侧菜单栏的隧道管理,展开进入隧道列表页面,页面下默认会有 2 个隧道:
- remoteDesktop隧道,指向3389端口,tcp协议
- website隧道,指向8080端口,http协议(http协议默认会生成2个公网地址,一个是http,另一个https,免去配置ssl证书的繁琐步骤)

点击编辑website的隧道,修改成我们PaddleOCR-VL需要的信息:

注意:每个用户创建的隧道显示的公网地址都不一样!
接着,点击左侧菜单的状态菜单,接着点击在线隧道列表菜单按钮,可以看到有2个PaddleOCR-VL-7891的隧道,一个为http协议,另一个为https协议:

接下来在浏览器中访问PaddleOCR-VL-7891隧道生成的公网地址(http和https皆可),这里以https为例:

可以看到成功访问啦!
5.2 固定域名方式(升级任意套餐皆可)
通过前面的配置,我们已经成功实现了PaddleOCR-VL的远程访问,但免费随机域名方案 的局限性也逐渐显现:每24小时左右 自动更换域名地址,意味着你需要频繁更新书签、重新分享链接,甚至可能因为忘记更新而无法访问。固定域名方案 正是为了解决这些痛点而生,让你拥有一个永久不变的专属地址,真正实现稳定可靠的OCR在线工作台。
好啦,接下来开始固定保留二级子域名教程!
首先,进入官网的预留页面:
shell
https://dashboard.cpolar.com/reserved
选择预留菜单,即可看到保留二级子域名项,填写其中的地区、名称、描述(可不填)项,然后点击保留按钮,操作步骤图如下:

列表中显示了一条已保留的二级子域名记录:
- 地区:显示为
China Top。 - 二级域名:显示为
pdocr。
注:二级域名是唯一的,每个账号都不相同,请以自己设置的二级域名保留的为主
接着,进入侧边菜单栏的隧道管理下的隧道列表,可以看到名为PaddleOCR-VL-7891的隧道,点击编辑按钮进入编辑页面:

修改域名类型为二级子域名,然后填写前面配置好的子域名,点击更新按钮:

来到状态菜单下的在线隧道列表可以看到隧道名称为PaddleOCR-VL-7891的公网地址已经变更为二级子域名+固定域名主体及后缀的形式了:

这里以https协议做访问测试(加载稍慢,需耐心等待一下):

访问成功!这样一来,你就拥有了一个永久不变的专属域名,再也不用担心24小时域名更换的问题。
6 为 PaddleOCR-VL 添加访问授权验证
在完成公网部署后,你会发现 PaddleOCR-VL 默认是无需登录即可访问 的。虽然这便于快速使用,但在家庭共享网络或团队协作场景下,可能会带来安全隐患。 例如:他人可通过公网地址随意提交图片识别任务,甚至查看配置信息,存在滥用资源的风险。 为了保障系统安全,我们可以借助 cpolar 内置的访问授权验证功能,为公网隧道添加密码保护,确保只有知道凭证的用户才能访问你的 PaddleOCR-VL 实例。
6.1 配置访问授权验证
首先,打开cpolar管理界面,进入隧道管理 → 隧道列表,找到PaddleOCR-VL-7891隧道,点击编辑按钮:

在编辑页面中,点击高级按钮展开高级配置选项,按照下图进行设置:
在HttpAuth这一栏,输入admin:123456 其中【admin】为你想要设置的账号,中间的冒号是英文的(不是中文),【123456】为想要给admin用户设置的密码

6.2 验证授权效果
重新访问你的公网地址,会发现浏览器弹出登录验证框:

输入刚才设置的用户名和密码,即可正常访问PaddleOCR-VL 的 Web 界面。通过这一道简单的访问验证,你的视频生成平台就具备了基础的安全防护,在享受远程访问便利的同时,有效保障了本地内容、AI 配置与 API 资源的安全。
总结
本教程带你从零搭建了一个基于 PaddleOCR-VL 的私人 OCR 平台 ,实现了本地图片识别、手写体与数学公式识别,并通过 cpolar 内网穿透让服务支持公网访问,同时还演示了访问授权验证保障安全。
- 使用 PaddleOCR-VL 进行多类型文字识别,包括印刷体、手写体和数学公式
- 通过 cpolar 内网穿透实现公网访问,支持随机域名和固定域名方案
- 配置访问授权验证,保障公网访问安全,防止滥用和未经授权的访问
通过本教程,你可以快速搭建一个随时在线、完全掌控的 OCR 系统,既方便自己使用,也能分享给团队或朋友。
感谢阅读本文,欢迎留言交流。cpolar官网 -- 安全的内网穿透工具 | 无需公网IP | 远程访问 | 搭建网站