OpenClaw 的文档处理核心是三大内置技能:PDF全能处理、Office自动化、文本批量处理,搭配本地OCR与数据提取,用自然语言即可驱动批量转换、数据抓取与格式规整,无需编程。
一、核心技能总览(内置/免费)
1. PDF全能处理(pdf-smart-tool-cn)
-
格式转换:PDF ↔ Word/Excel/Text/图片
-
批量操作:合并、拆分、加水印、加密、提取图片
-
OCR识别:扫描件/图片PDF文字提取(中文/英文)
-
数据提取:表格识别、关键词定位、发票/合同结构化抓取
常用指令
plain
把桌面所有PDF合并为"汇总.pdf"
将"发票文件夹"PDF转Excel并提取金额
OCR识别"扫描件.pdf"并保存为可编辑Word
2. Office/WPS自动化(office-document-specialist-suite)
-
Word:生成合同/周报、批量替换文字、统一字体/排版、段落重组
-
Excel:数据筛选、公式计算、多表合并、生成图表、批量汇总
-
模板驱动:按模板批量生成简历/报告/公文
常用指令
plain
生成一份标准劳动合同(A4、宋体小四)
把文档中所有"旧公司"替换为"新公司"
合并"销售数据"下所有Excel并计算总和
3. 文本批量处理(text-processor)
-
内容清洗:去重、去空行、繁简转换、中英互译
-
摘要/大纲:长文自动提炼重点、生成思维导图
-
格式转换:TXT/MD/HTML互转,清理冗余标签
二、高级技能(推荐安装)
1. 结构化数据提取(data-extractor)
-
模板定义:框选固定位置(锚点/区域),指定字段类型(文本/数字/日期)
-
批量抓取:发票、订单、流水、入职表等统一格式文档
-
输出:直接存Excel/CSV,可导入数据库
2. 文档对比与修订(doc-compare)
-
差异高亮:Word/PDF/文本间对比,标注增删改
-
版本合并:多版本文档一键合并,保留修订痕迹
三、技能启用与配置
-
打开OpenClaw → 技能商店 → 搜索技能名 → 启用
-
基础必开:pdf-smart-tool-cn、office-document-specialist-suite、text-processor
-
高级可选:data-extractor、doc-compare、ocr-local
四、实战组合案例
案例1:财务发票批量处理
plain
使用pdf-smart-tool-cn处理"桌面/发票"下所有PDF:
1. 提取发票号码、日期、不含税金额、销售方
2. 用office-document-specialist-suite生成Excel并汇总
3. 保存为"2026-04发票汇总.xlsx"
案例2:合同批量生成与修订
plain
1. 用office-document-specialist-suite生成10份劳动合同(替换员工姓名)
2. 用doc-compare对比新旧版本,高亮修改处
3. 批量转PDF并加盖水印"内部专用"
五、常见问题
-
扫描PDF无法提取文字:启用ocr-local技能,需联网下载模型
-
Excel复杂表格识别不准:优先用data-extractor定义模板,精度更高
-
技能加载失败:检查~/.openclaw/skills权限,重启客户端
六、最佳实践
-
批量任务优先用自然语言组合指令,减少手动操作
-
固定格式文档(发票/订单)提前做提取模板,重复使用
-
大文件(>100MB)分批处理,避免内存溢出
(注:文档部分内容可能由 AI 生成)