OpenClaw PDF处理

eastyuxiao2026-04-30 8:45

OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用，覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景，本地处理、无需上传。

一、核心 PDF 技能（必装）

1. PDF 全能处理（anthropics/pdf）

能力：合并、拆分、旋转、删除页面；提取文本 / 表格 / 图片；PDF↔Word / 图片；添加水印、加密；OCR 扫描件。
安装：openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。

2. ComPDF Editor（企业级）

能力：精准编辑、表单填写、批量水印、权限控制，支持 Win/Mac 本地处理。

3. PDF 分析工具（原生）

能力：多文件（≤10 个）输入、页面筛选（如 1-5,7）、自定义提示词分析，默认 10MB / 文件、20 页 / 次。

二、依赖安装（首次必备）

bash

运行

复制代码

pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例（直接对话）

合并：把 1.pdf、2.pdf 合并为 all.pdf
拆分：将 report.pdf 按每5页拆分，保存到 output 文件夹
提取表格 ：提取 invoice.pdf 第2页表格，转 Excel
OCR 扫描件 ：OCR 识别 scan.pdf，输出可编辑文本
加密 + 水印 ：给 contract.pdf 添加"机密"水印并设密码 123456

四、高级工作流（学术 / 办公）

文献整理 ：监控 ~/Downloads，新PDF自动解析→提取标题/作者→按年份分类归档
合同比对 ：解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

最大文件：默认 10MB / 个，可在配置调大；单次处理≤20 页。
扫描件：必须用 OCR 技能，纯文本提取无效。
格式错乱：优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。

上一篇：ReAct范式实战：让Agent学会边想边做

下一篇：复杂业务系统架构：CQRS 读写分离与 ES/RabbitMQ 基础指南

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……