在Linux系统中搜索当前路径及其子目录下所有PDF文件中是否包含特定字符串

目录标题


方法一:pdfgrep

sh 复制代码
pdfgrep -ri "rockchip" .

方法二:使用findxargspdftotext(将PDF转换为文本)组合,然后用grep搜索

这里是一个示例命令,显示了如何将这些工具组合起来搜索字符串"rockchip":

sh 复制代码
find . -name "*.pdf" -exec sh -c 'pdftotext "{}" - | grep -H --label="{}" "rockchip"' \;

这条命令将:

  • 使用find命令在当前目录及子目录中查找所有扩展名为.pdf的文件。
  • 对每个找到的PDF文件,执行sh -c启动一个新的shell来处理以下命令:
    • 使用pdftotext将PDF文件转换为文本并将结果直接传递给grep
    • 使用grep搜索"rockchip"字符串,其中-H选项会打印文件名,--label会确保在输出中使用原始的PDF文件名,即使文本是通过管道传递的。
相关推荐
未来之窗软件服务13 小时前
幽冥大陆(十七)手机摄像头注册到电脑——东方仙盟炼气期
服务器·智能手机·电脑·服务器运维·东方仙盟·东方仙盟sdk
9ilk13 小时前
【基于one-loop-per-thread的高并发服务器】--- 项目测试
运维·服务器·c++·后端·中间件
DeeplyMind13 小时前
虚拟化hypervisor:Xen简介
linux·virtualization·xen
property-13 小时前
服务器开荒:安装宝塔面板
运维·服务器
教练、我想打篮球13 小时前
05 2个路由器配置dhcp服务器+dhcp中继器配置两个子网的dhcp服务
运维·服务器
adnyting13 小时前
【Linux日新月异(二)】CentOS 7用户与用户组管理深度指南:保障系统安全的基石
linux·运维·centos
渡我白衣13 小时前
深入理解 OverlayFS:用分层的方式重新组织 Linux 文件系统
android·java·linux·运维·服务器·开发语言·人工智能
waves浪游13 小时前
进程概念(上)
linux·运维·服务器·开发语言·c++
顾安r13 小时前
11.15 脚本算法 加密网页
服务器·算法·flask·html·同态加密
不会kao代码的小王14 小时前
从局域网到全网可用!PDFMathTranslate 翻译工具的进阶使用法
linux