我用 PaddleOCR + OpenClaw 搭了一套发票自动管理系统

我用 PaddleOCR + OpenClaw 搭了一套发票自动管理系统

给我的小龙虾安排了个狠活,现在我只需要丢一张发票给他,就能自动利用 PaddleOCR Skills 解析,然后传入到飞书多维表格,做了一套发票自动管理系统。

给大家做个分享。

背景

每个月报销发票都是个头疼事,一张一张手动录入太痛苦了。正好看到 PaddleOCR 上了 ClawHub,就想着能不能自动化一下。(听说 PaddleOCR Skills 目前是全球唯一免费高精度阅读 PDF 的技能,必须得试试)

做了什么

简单来讲,我现在只需要把发票 PDF 发给 OpenClaw,它就能:

自动解析 - 用 PaddleOCR Skills 提取发票信息(号码、日期、金额、税率这些)

自动上传 - 把 PDF 存到飞书云空间

自动录入 - 把所有字段写入飞书多维表格

全程不用手动填表,30秒搞定一张发票。

技术栈

PaddleOCR Skills- 文档解析能力,基于文心大模型体系训练

OpenClaw - Agent 编排和自动化执行

飞书多维表格 - 数据存储和管理

实际效果

录了两张发票测试,识别准确率 100%,连表格结构都能完整提取。最爽的是,以后只要扔文件就行,剩下的事 OpenClaw 全包了。

如何搭建

1、安装 PaddleOCR Skills

给你的小龙虾 OpenClaw 说:

帮我下载这个技能:clawhub.ai/Bobholamovi...

他就会自动安装这个技能:

2、配置一下 API

可以直接问 OpenClaw 怎么配置:

其实核心就是去官网申请个 KEY 和填入个API_URL。

打开 PaddleOCR 官网后,选择上传一个发票 PDF 附件:

解析后,点击左上角这里的 API:

需要简单填写手机号验证,然后就可以看到API_URL 和 TOKEN 了。

复制这 2,然后到小龙虾中让他帮你自动配置:

接下来,你上传个 PDF 发票,就能解析了,PaddleOCR的准确率贼高,几乎识别出他能识别到的,并以 JSON 的形式给返回,然后 openclaw 会转为结构化数据给我。

接下来输入这一串提示词,让 openclaw 把这些字段传入到飞书多维表格中,建立发票系统:

帮我将该信息存入到飞书多维表格,我希望有的字段是:发票号码、发票类型、开票日期、开票人、购买方名称、购买方统一社会信用代码、销售方名称、销售方统一社会信用代码、开户银行、银行账号、合计费用项目名称、合计费用单价、合计费用数量、合计费用金额、合计费用税率、合计费用税额,以及上传发票附件到附件字段。

需要简单授权,就能创建哈飞书多维表格

这个时候会有一些字段不符合要求,特别是附件,他没法直接上传,需要先传到飞书,再以超链接传过去。你自己稍微手动改下,就 ok 了。

然后跟 openclaw 说,让他以后传发票,都解析后传入到这个系统。

我整体修改了下《发票管理》 多为表中的字段类型和名称,请你以后按照这个要求,我只需要上传发票附件给你,你就借助PaddleOCR 技能帮我做解析后,把相应字段对应的存储到《发票管理》这个飞书多维表格,ok 吗?

以后,你只需要往 openclaw 丢一个发票,他就自动解析后放入发票管理系统了。

太方便了。

一点感想

以前觉得文档解析这种能力要自己调 API、写代码,现在发现 PaddleOCR 已经以 Skill 的形式直接上架了 ClawHub,在 openclaw 直接传个发票就能用。

这种「能力即插即用」的感觉挺棒的------文心大模型的能力正在通过 Skill 进入开发者工具链,变成可以直接调用的组件。

如果你也在用 OpenClaw,推荐试试这个 Skill:👉 clawhub.ai/Bobholamovi...

我也把该技能放在了我的《OpenClaw 从入门到精通指南》开源知识库,大家也可以在上面查看完整教程。

相关推荐
K姐研究社1 小时前
MaxClaw部署教程 – 10秒云端搭建OpenClaw,免服务器接入钉钉飞书
人工智能·钉钉·飞书
小成C1 小时前
别再把 Claude Code 用乱了:CLAUDE.md、Rules、Skills、Hooks 到底怎么分工?
前端·人工智能·面试
TechFind1 小时前
实战:用 OpenClaw 把企业微信变成 AI Agent 工作台
人工智能·agent
Kel1 小时前
这就是编程:Pi Monorepo 源码深度--解析一个工业级 AI Agent 框架的设计哲学
人工智能·设计模式·架构
郑同学zxc1 小时前
机器学习16-tensorflow1.4 使用
人工智能·机器学习
数据中穿行1 小时前
液体火箭发动机试验仿真系统设计实现
人工智能
咚咚王者2 小时前
人工智能之语言领域 自然语言处理 第四章 文本表示方法
人工智能·自然语言处理·easyui
deephub2 小时前
LangGraph vs Semantic Kernel:状态图与内核插件的两条技术路线对比
人工智能·python·深度学习·大语言模型·agent
文心快码 Baidu Comate2 小时前
Comate 4.0的自我进化:后端“0帧起手”写前端、自己修自己!
前端·人工智能·后端·ai编程·文心快码·ai编程助手