OpenClaw PDF处理

OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用,覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景,本地处理、无需上传。


一、核心 PDF 技能(必装)

1. PDF 全能处理(anthropics/pdf)
  • 能力:合并、拆分、旋转、删除页面;提取文本 / 表格 / 图片;PDF↔Word / 图片;添加水印、加密;OCR 扫描件。
  • 安装:openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。
2. ComPDF Editor(企业级)
  • 能力:精准编辑、表单填写、批量水印、权限控制,支持 Win/Mac 本地处理。
3. PDF 分析工具(原生)
  • 能力:多文件(≤10 个)输入、页面筛选(如 1-5,7)、自定义提示词分析,默认 10MB / 文件、20 页 / 次。

二、依赖安装(首次必备)

bash

运行

复制代码
pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例(直接对话)

  1. 合并把 1.pdf、2.pdf 合并为 all.pdf
  2. 拆分将 report.pdf 按每5页拆分,保存到 output 文件夹
  3. 提取表格提取 invoice.pdf 第2页表格,转 Excel
  4. OCR 扫描件OCR 识别 scan.pdf,输出可编辑文本
  5. 加密 + 水印给 contract.pdf 添加"机密"水印并设密码 123456

四、高级工作流(学术 / 办公)

  1. 文献整理监控 ~/Downloads,新PDF自动解析→提取标题/作者→按年份分类归档
  2. 合同比对解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

  • 最大文件:默认 10MB / 个,可在配置调大;单次处理≤20 页。
  • 扫描件:必须用 OCR 技能,纯文本提取无效。
  • 格式错乱:优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。
相关推荐
云烟成雨TD15 分钟前
Agent Scope Java 2.x 系列【3】从零构建 ReActAgent
java·人工智能·agent
❀抽抽19 分钟前
证件照制作API接入指南:700+规格一键生成
大数据·网络·人工智能
Promise微笑21 分钟前
绝缘油介损(油介损)测试仪的深层机理、技术演进与精准诊断策略
大数据·网络·人工智能
开发者小布25 分钟前
Claude Code 国内配置完整指南:通过中转 API 实现稳定访问(macOS / Linux / Windows)
人工智能
大C聊AI32 分钟前
通用大模型纷纷收费,垂直场景AI工具的价值正在被重估
大数据·人工智能·机器学习·办公效率·ai 工具·智标领航·ai 辅助办公
苏州邦恩精密36 分钟前
2026江苏GOM三维扫描仪定制厂家找哪家?企业数字化转型视角
人工智能·机器学习·3d·自动化·制造
python-码博士37 分钟前
PyTorch 从零实现 Flow Matching:训练、采样、画图一条龙
人工智能·pytorch·python
砍光二叉树40 分钟前
一文打通 AI 认知:LLM、Agent、MCP、Skill 完整体系
人工智能·llm·agent·skill·mcp
努力写A题的小菜鸡1 小时前
PyTorch 图像预处理 transforms 与 TensorBoard 可视化 (自己学习记录)
人工智能·pytorch·学习