在Linux系统中搜索当前路径及其子目录下所有PDF文件中是否包含特定字符串

目录标题


方法一:pdfgrep

sh 复制代码
pdfgrep -ri "rockchip" .

方法二:使用findxargspdftotext(将PDF转换为文本)组合,然后用grep搜索

这里是一个示例命令,显示了如何将这些工具组合起来搜索字符串"rockchip":

sh 复制代码
find . -name "*.pdf" -exec sh -c 'pdftotext "{}" - | grep -H --label="{}" "rockchip"' \;

这条命令将:

  • 使用find命令在当前目录及子目录中查找所有扩展名为.pdf的文件。
  • 对每个找到的PDF文件,执行sh -c启动一个新的shell来处理以下命令:
    • 使用pdftotext将PDF文件转换为文本并将结果直接传递给grep
    • 使用grep搜索"rockchip"字符串,其中-H选项会打印文件名,--label会确保在输出中使用原始的PDF文件名,即使文本是通过管道传递的。
相关推荐
qq_2290580120 小时前
Docker常用命令
linux·服务器·docker
Vect__20 小时前
基于抢票系统的线程互斥详解
linux
是个西兰花20 小时前
进程间通信:匿名管道
linux·运维·服务器
爱吃泡芙的小白白20 小时前
使用Cursor来进行连接SSH远程主机中出现的问题(自用)
服务器·学习·ssh·cursor
小北方城市网20 小时前
Spring Cloud Gateway 生产级微内核架构设计与可插拔过滤器开发
java·大数据·linux·运维·spring boot·redis·分布式
wacpguo20 小时前
Ubuntu 24.04 安装 Docker
linux·ubuntu·docker
Lenyiin20 小时前
Linux 进程控制
linux·运维·服务器
春日见21 小时前
Git 相关操作大全
linux·人工智能·驱动开发·git·算法·机器学习
述清-架构师之路21 小时前
vmWare的CentOS系统网路连不上处理记录
linux·运维·centos
ElasticPDF-新国产PDF编辑器21 小时前
基于 PDF.js 的 PDF 文字编辑解决方案,纯前端 SDK,跨平台、框架无关、Web 原生
前端·javascript·pdf