在Linux系统中搜索当前路径及其子目录下所有PDF文件中是否包含特定字符串

目录标题


方法一:pdfgrep

sh 复制代码
pdfgrep -ri "rockchip" .

方法二:使用findxargspdftotext(将PDF转换为文本)组合,然后用grep搜索

这里是一个示例命令,显示了如何将这些工具组合起来搜索字符串"rockchip":

sh 复制代码
find . -name "*.pdf" -exec sh -c 'pdftotext "{}" - | grep -H --label="{}" "rockchip"' \;

这条命令将:

  • 使用find命令在当前目录及子目录中查找所有扩展名为.pdf的文件。
  • 对每个找到的PDF文件,执行sh -c启动一个新的shell来处理以下命令:
    • 使用pdftotext将PDF文件转换为文本并将结果直接传递给grep
    • 使用grep搜索"rockchip"字符串,其中-H选项会打印文件名,--label会确保在输出中使用原始的PDF文件名,即使文本是通过管道传递的。
相关推荐
百炼成神 LV@菜哥2 小时前
Kylin Linux V10 aarch64 安装启动 TigerVNC-Server
linux·服务器·kylin
m0_737302582 小时前
百度智能云边缘云服务器,端云协同赋能全域智能场景
服务器
Anastasiozzzz2 小时前
LeetCode Hot100 295. 数据流的中位数 MedianFinder
java·服务器·前端
佑白雪乐2 小时前
<Linux基础11集>电流+二极管+晶体管+存储器
linux
嵌入式郑工2 小时前
RK3566 LubanCat 开发板 USB Gadget 配置完整复盘
linux·驱动开发·ubuntu
Exquisite.3 小时前
Nginx
服务器·前端·nginx
one____dream3 小时前
【网安】Reverse-非常规题目
linux·python·安全·网络安全·ctf
j_xxx404_3 小时前
Linux:进程程序替换
linux·运维·服务器
祁鱼鱼鱼鱼鱼3 小时前
Keepalived实验环境设定
linux·服务器·网络
Genie cloud3 小时前
VPS 网络连接故障诊断与排查实用指南
linux·服务器·ssh