OpenClaw PDF处理

OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用,覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景,本地处理、无需上传。


一、核心 PDF 技能(必装)

1. PDF 全能处理(anthropics/pdf)
  • 能力:合并、拆分、旋转、删除页面;提取文本 / 表格 / 图片;PDF↔Word / 图片;添加水印、加密;OCR 扫描件。
  • 安装:openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。
2. ComPDF Editor(企业级)
  • 能力:精准编辑、表单填写、批量水印、权限控制,支持 Win/Mac 本地处理。
3. PDF 分析工具(原生)
  • 能力:多文件(≤10 个)输入、页面筛选(如 1-5,7)、自定义提示词分析,默认 10MB / 文件、20 页 / 次。

二、依赖安装(首次必备)

bash

运行

复制代码
pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例(直接对话)

  1. 合并把 1.pdf、2.pdf 合并为 all.pdf
  2. 拆分将 report.pdf 按每5页拆分,保存到 output 文件夹
  3. 提取表格提取 invoice.pdf 第2页表格,转 Excel
  4. OCR 扫描件OCR 识别 scan.pdf,输出可编辑文本
  5. 加密 + 水印给 contract.pdf 添加"机密"水印并设密码 123456

四、高级工作流(学术 / 办公)

  1. 文献整理监控 ~/Downloads,新PDF自动解析→提取标题/作者→按年份分类归档
  2. 合同比对解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

  • 最大文件:默认 10MB / 个,可在配置调大;单次处理≤20 页。
  • 扫描件:必须用 OCR 技能,纯文本提取无效。
  • 格式错乱:优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。
相关推荐
冬奇Lab2 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab2 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾2 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒4 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术6 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu12276 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队6 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇6 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端
Token炼金师7 小时前
去噪扩散:从随机噪声到高保真图像的数学之路
人工智能·aigc