我用 PaddleOCR + OpenClaw 搭了一套发票自动管理系统

我用 PaddleOCR + OpenClaw 搭了一套发票自动管理系统

给我的小龙虾安排了个狠活,现在我只需要丢一张发票给他,就能自动利用 PaddleOCR Skills 解析,然后传入到飞书多维表格,做了一套发票自动管理系统。

给大家做个分享。

背景

每个月报销发票都是个头疼事,一张一张手动录入太痛苦了。正好看到 PaddleOCR 上了 ClawHub,就想着能不能自动化一下。(听说 PaddleOCR Skills 目前是全球唯一免费高精度阅读 PDF 的技能,必须得试试)

做了什么

简单来讲,我现在只需要把发票 PDF 发给 OpenClaw,它就能:

自动解析 - 用 PaddleOCR Skills 提取发票信息(号码、日期、金额、税率这些)

自动上传 - 把 PDF 存到飞书云空间

自动录入 - 把所有字段写入飞书多维表格

全程不用手动填表,30秒搞定一张发票。

技术栈

PaddleOCR Skills- 文档解析能力,基于文心大模型体系训练

OpenClaw - Agent 编排和自动化执行

飞书多维表格 - 数据存储和管理

实际效果

录了两张发票测试,识别准确率 100%,连表格结构都能完整提取。最爽的是,以后只要扔文件就行,剩下的事 OpenClaw 全包了。

如何搭建

1、安装 PaddleOCR Skills

给你的小龙虾 OpenClaw 说:

帮我下载这个技能:clawhub.ai/Bobholamovi...

他就会自动安装这个技能:

2、配置一下 API

可以直接问 OpenClaw 怎么配置:

其实核心就是去官网申请个 KEY 和填入个API_URL。

打开 PaddleOCR 官网后,选择上传一个发票 PDF 附件:

解析后,点击左上角这里的 API:

需要简单填写手机号验证,然后就可以看到API_URL 和 TOKEN 了。

复制这 2,然后到小龙虾中让他帮你自动配置:

接下来,你上传个 PDF 发票,就能解析了,PaddleOCR的准确率贼高,几乎识别出他能识别到的,并以 JSON 的形式给返回,然后 openclaw 会转为结构化数据给我。

接下来输入这一串提示词,让 openclaw 把这些字段传入到飞书多维表格中,建立发票系统:

帮我将该信息存入到飞书多维表格,我希望有的字段是:发票号码、发票类型、开票日期、开票人、购买方名称、购买方统一社会信用代码、销售方名称、销售方统一社会信用代码、开户银行、银行账号、合计费用项目名称、合计费用单价、合计费用数量、合计费用金额、合计费用税率、合计费用税额,以及上传发票附件到附件字段。

需要简单授权,就能创建哈飞书多维表格

这个时候会有一些字段不符合要求,特别是附件,他没法直接上传,需要先传到飞书,再以超链接传过去。你自己稍微手动改下,就 ok 了。

然后跟 openclaw 说,让他以后传发票,都解析后传入到这个系统。

我整体修改了下《发票管理》 多为表中的字段类型和名称,请你以后按照这个要求,我只需要上传发票附件给你,你就借助PaddleOCR 技能帮我做解析后,把相应字段对应的存储到《发票管理》这个飞书多维表格,ok 吗?

以后,你只需要往 openclaw 丢一个发票,他就自动解析后放入发票管理系统了。

太方便了。

一点感想

以前觉得文档解析这种能力要自己调 API、写代码,现在发现 PaddleOCR 已经以 Skill 的形式直接上架了 ClawHub,在 openclaw 直接传个发票就能用。

这种「能力即插即用」的感觉挺棒的------文心大模型的能力正在通过 Skill 进入开发者工具链,变成可以直接调用的组件。

如果你也在用 OpenClaw,推荐试试这个 Skill:👉 clawhub.ai/Bobholamovi...

我也把该技能放在了我的《OpenClaw 从入门到精通指南》开源知识库,大家也可以在上面查看完整教程。

相关推荐
明志数科3 分钟前
机器人长尾场景数据采集:实操方法论与成本控制
大数据·人工智能
lifallen10 分钟前
第六章 MCP:把能力接入协议化
人工智能·ai·语言模型·ai编程
code 小楊13 分钟前
AI Agent记忆系统全解析:从基础到前沿
人工智能
niuniuyi~13 分钟前
科研阶段记录2-下
人工智能·知识图谱
workflower14 分钟前
医院核心竞争力的四大重构
人工智能·安全·设计模式·重构·动态规划·scrum
zhangfeng113315 分钟前
车载gpu 飞地 只保存密钥 不保存 权重 Orin确实有TEE安全飞地(TSEC/OP-TEE)
服务器·网络·人工智能·安全·transformer·芯片
Drgfd15 分钟前
长期主义者汪进进:能效电气重构充电桩行业价值逻辑
人工智能·重构
YOLO数据集集合16 分钟前
配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检
运维·人工智能·深度学习·yolo·目标检测·视觉检测
zhangfeng113322 分钟前
google gmini大语言模型 的数据预训练 flan等方法 介绍下
人工智能·transformer
用户51914958484531 分钟前
WordPress File Upload 插件路径遍历漏洞利用工具 (CVE-2024-9047)
人工智能·aigc