OpenClaw PDF处理

OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用,覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景,本地处理、无需上传。


一、核心 PDF 技能(必装)

1. PDF 全能处理(anthropics/pdf)
  • 能力:合并、拆分、旋转、删除页面;提取文本 / 表格 / 图片;PDF↔Word / 图片;添加水印、加密;OCR 扫描件。
  • 安装:openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。
2. ComPDF Editor(企业级)
  • 能力:精准编辑、表单填写、批量水印、权限控制,支持 Win/Mac 本地处理。
3. PDF 分析工具(原生)
  • 能力:多文件(≤10 个)输入、页面筛选(如 1-5,7)、自定义提示词分析,默认 10MB / 文件、20 页 / 次。

二、依赖安装(首次必备)

bash

运行

复制代码
pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例(直接对话)

  1. 合并把 1.pdf、2.pdf 合并为 all.pdf
  2. 拆分将 report.pdf 按每5页拆分,保存到 output 文件夹
  3. 提取表格提取 invoice.pdf 第2页表格,转 Excel
  4. OCR 扫描件OCR 识别 scan.pdf,输出可编辑文本
  5. 加密 + 水印给 contract.pdf 添加"机密"水印并设密码 123456

四、高级工作流(学术 / 办公)

  1. 文献整理监控 ~/Downloads,新PDF自动解析→提取标题/作者→按年份分类归档
  2. 合同比对解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

  • 最大文件:默认 10MB / 个,可在配置调大;单次处理≤20 页。
  • 扫描件:必须用 OCR 技能,纯文本提取无效。
  • 格式错乱:优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。
相关推荐
lilihuigz8 小时前
易服客工作室:WordPress 7.0 “Armstrong”发布
人工智能
美团技术团队8 小时前
美团跑腿 Skill:一句话,骑手来帮忙
人工智能
五度易链-区域产业数字化管理平台8 小时前
招商尽调报告自动化实战:五度妙笔AI模块的技术与场景解析
人工智能
Agent手记8 小时前
安全生产巡检全流程自动化与隐患预警方案:2026工业Agent落地实战指南
数据库·人工智能·安全·ai·自动化
SEO_juper8 小时前
语音搜索 GEO 优化,口语化英文短句布局玩法
人工智能·seo·geo·谷歌优化·2026·谷歌算法更新·口语化
szxinmai主板定制专家8 小时前
RK3568 + CODESYS+实时系统运动控制器PLC,支持 AI 视觉目标检测,预测性维护,混合多系统部署,多路模拟量采集
arm开发·人工智能·嵌入式硬件·fpga开发
大囚长8 小时前
自由能原理与预测处理的理论解析及其跨领域启示
人工智能·数学建模
Want5958 小时前
数字人场景落地:企业展厅 / 指挥大屏从展示到服务
人工智能·数字人
工业机器人销售服务8 小时前
伯朗特机器人集成智能料库,为多台激光切割机提供24小时不间断的板材上下料服务
人工智能
前端若水8 小时前
从零开始学习AI Agent的实战路线图
人工智能·学习