OpenClaw PDF处理

OpenClaw 的 PDF 处理核心是安装对应 Skill + 自然语言指令调用,覆盖合并 / 拆分 / 转格式 / 提取 / OCR / 加密水印等全场景,本地处理、无需上传。


一、核心 PDF 技能(必装)

1. PDF 全能处理(anthropics/pdf)
  • 能力:合并、拆分、旋转、删除页面;提取文本 / 表格 / 图片;PDF↔Word / 图片;添加水印、加密;OCR 扫描件。
  • 安装:openclaw skills install anthropics/pdf 或在 ClawHub 搜索安装。
2. ComPDF Editor(企业级)
  • 能力:精准编辑、表单填写、批量水印、权限控制,支持 Win/Mac 本地处理。
3. PDF 分析工具(原生)
  • 能力:多文件(≤10 个)输入、页面筛选(如 1-5,7)、自定义提示词分析,默认 10MB / 文件、20 页 / 次。

二、依赖安装(首次必备)

bash

运行

复制代码
pip install pypdf pdfplumber reportlab  # 处理/提取/生成
pip install pdfjs-dist @napi-rs/canvas   # 渲染与OCR依赖

三、常用指令示例(直接对话)

  1. 合并把 1.pdf、2.pdf 合并为 all.pdf
  2. 拆分将 report.pdf 按每5页拆分,保存到 output 文件夹
  3. 提取表格提取 invoice.pdf 第2页表格,转 Excel
  4. OCR 扫描件OCR 识别 scan.pdf,输出可编辑文本
  5. 加密 + 水印给 contract.pdf 添加"机密"水印并设密码 123456

四、高级工作流(学术 / 办公)

  1. 文献整理监控 ~/Downloads,新PDF自动解析→提取标题/作者→按年份分类归档
  2. 合同比对解析 A/B 合同PDF→提取关键条款→生成差异对比表

五、关键注意事项

  • 最大文件:默认 10MB / 个,可在配置调大;单次处理≤20 页。
  • 扫描件:必须用 OCR 技能,纯文本提取无效。
  • 格式错乱:优先用 ComPDF 或 MinerU 解析为 Markdown/JSON 再处理。
相关推荐
懂AI的老郑1 小时前
离线语音识别系统全解析(支持专业词汇训练)
人工智能·语音识别
黑客说1 小时前
2026 AI 游戏热度排行榜|游戏推荐
人工智能·科技·游戏·娱乐
旦莫1 小时前
AI生成测试用例:一个Prompt模板让AI从Excel模板生成自动化脚本
人工智能·python·测试开发·自动化·prompt·测试用例
Jmayday1 小时前
Pytorch:CNN进行图象分类案例
人工智能·pytorch·cnn
机器觉醒时代1 小时前
芯驰发布具身智能全栈芯片:大脑R1、小脑D9与E3-R系列执行MCU
人工智能·具身智能·ai芯片·人形机器人·世界模型
东北洗浴王子讲AI1 小时前
从零搭建AI文学创作助手:基于API聚合站+Flask实现智能写诗、小说生成神器
人工智能·python·flask
andafaAPS1 小时前
安达发|医疗器械行业APS排程软件:重构生产效能的生命线
大数据·人工智能·制造·aps排程软件·安达发aps·计划排产软件
财经资讯数据_灵砚智能1 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月28日
大数据·人工智能·python·信息可视化·自然语言处理
武科大许志伟2 小时前
课题组学习南京大学陈贵海教授“自演进异构融合的边缘智能计算”的专题学术报告
人工智能