如何在 deepin文件夹中搜索包含特定内容、关键字的 Word 文档

在 deepin 系统中,搜索包含特定内容或关键字的 Word 文档是一项常见需求。以下是一个详细的步骤指南,帮助你在文件夹中高效地完成这项任务。

一、安装依赖工具

要搜索 Word 文档,首先需要安装一些必要的工具。这些工具包括 catdocdocx2txticonvgrep。它们分别用于处理不同格式的 Word 文档、字符编码转换和文本搜索。

在终端执行以下命令安装这些工具:

bash 复制代码
sudo apt install catdoc docx2txt libc-bin grep

如果系统中已安装这些工具,命令将提示无需重复安装。

二、编写搜索脚本

(一)只搜索 Word 文档(.doc/.docx)

以下是一个 Bash 脚本示例,用于搜索包含特定关键字的 Word 文档:

bash 复制代码
#!/bin/bash
# 安装依赖
hash catdoc docx2txt iconv grep || {
    echo "缺少依赖命令,正在尝试自动安装"
    sudo apt install catdoc docx2txt libc-bin grep

    hash catdoc docx2txt iconv grep && {
        echo
        echo "依赖安装成功"
        echo
    } || {
        echo
        echo "依赖安装失败,脚本无法运行"
        echo "请点击终端上的[X]关闭该窗口"
        while true; do read; done
        exit
    }
}

# 读取参数
while true; do
    echo -n "请输入搜索文件夹:"
    read dir

    # 去除开头的file://
    dir="${dir/#file:\/\//}"

    # 未输入文件夹,搜索当前文件夹
    if [ "$dir" = "" ]; then
        dir="$(realpath "$PWD")"
    fi

    if [ -e "$dir" ]; then
        break
    else
        echo "搜索文件夹不存在"
    fi
done

while true; do
    echo -n "请输入搜索关键字:"
    read keyword

    if [ "$keyword" = "" ]; then
        echo "搜索关键词不能为空"
    else
        break
    fi
done

echo
echo "在 \"$dir\" 中寻找包含 \"$keyword\" 的word文件"
echo

find "$dir" -type f | while read f; do
    content=`
        cat "$f" | docx2txt 2>/dev/null | grep -ai "$keyword"
        catdoc "$f" 2>/dev/null | grep -ai "$keyword"
    `
    if [ "$content" != "" ]; then
        found="true"
        echo -------------------------------------------------------------
        echo "$f"
        echo
        echo "$content" | head
        echo
    fi
done

echo
echo "搜索完毕"
echo "可点击终端上的[X]关闭该窗口"

# 防止终端自动关闭,用户可点击[X]关闭终端
while true; do read; done

(二)同时搜索 Word 文档(.doc/.docx)和纯文本(.txt)

如果你还需要同时搜索纯文本文件,可以使用以下脚本:

bash 复制代码
#!/bin/bash
# 安装依赖
hash catdoc docx2txt iconv grep || {
    echo "缺少依赖命令,正在尝试自动安装"
    sudo apt install catdoc docx2txt libc-bin grep

    hash catdoc docx2txt iconv grep && {
        echo
        echo "依赖安装成功"
        echo
    } || {
        echo
        echo "依赖安装失败,脚本无法运行"
        echo "请点击终端上的[X]关闭该窗口"
        while true; do read; done
        exit
    }
}

# 读取参数
while true; do
    echo -n "请输入搜索文件夹:"
    read dir

    # 去除开头的file://
    dir="${dir/#file:\/\//}"

    # 未输入文件夹,搜索当前文件夹
    if [ "$dir" = "" ]; then
        dir="$(realpath "$PWD")"
    fi

    if [ -e "$dir" ]; then
        break
    else
        echo "搜索文件夹不存在"
    fi
done

while true; do
    echo -n "请输入搜索关键字:"
    read keyword

    if [ "$keyword" = "" ]; then
        echo "搜索关键词不能为空"
    else
        break
    fi
done

echo
echo "在 \"$dir\" 中寻找包含 \"$keyword\" 的word文件"
echo

find "$dir" -type f | while read f; do
    content=`
        cat "$f" | docx2txt 2>/dev/null | grep -Ii "$keyword"
        catdoc "$f" 2>/dev/null | grep -Ii "$keyword"
        cat "$f" | grep -Ii "$keyword"
        cat "$f" | iconv -f gb18030 -t utf-8 2>/dev/null | grep -Ii "$keyword"
        cat "$f" | iconv -f big5 -t utf-8 2>/dev/null | grep -Ii "$keyword"
    `
    if [ "$content" != "" ]; then
        found="true"
        echo -------------------------------------------------------------
        echo "$f"
        echo
        echo "$content" | head
        echo
    fi
done

echo
echo "搜索完毕"
echo "可点击终端上的[X]关闭该窗口"

# 防止终端自动关闭,用户可点击[X]关闭终端
while true; do read; done

三、运行脚本

  1. 将上述脚本保存为一个文件,例如 search_word.sh
  2. 右击脚本文件,选择"属性",在"权限管理"中勾选"允许以程序执行".
  3. 双击脚本文件,选择"在终端运行",或者在终端直接输入 ./search_word.sh 运行脚本.
  4. 按照脚本提示输入搜索文件夹和关键字,脚本将自动搜索并显示包含关键字的 Word 文档及其部分内容.

四、注意事项

  • 如果首次启动脚本时自动安装依赖失败,请手动使用 sudo apt install catdoc docx2txt 命令安装.
  • 脚本会显示搜索结果的文件路径和部分内容,方便你快速定位和查看.
  • 你可以根据需要修改脚本中的搜索参数和处理逻辑,以适应不同的搜索需求.

希望本文章可以在 Linux 文件夹中高效地搜索包含特定内容或关键字的 Word 文档,提高工作效率和文件管理能力.
支持ing
阅读更多

相关推荐
朝新_1 小时前
【多线程初阶】阻塞队列 & 生产者消费者模型
java·开发语言·javaee
立莹Sir1 小时前
Calendar类日期设置进位问题
java·开发语言
CoderIsArt2 小时前
C#中的CLR属性、依赖属性与附加属性
c#
风逸hhh2 小时前
python打卡day46@浙大疏锦行
开发语言·python
火兮明兮3 小时前
Python训练第四十三天
开发语言·python
ascarl20104 小时前
准确--k8s cgroup问题排查
java·开发语言
Gaoithe4 小时前
ubuntu 端口复用
linux·运维·ubuntu
fpcc4 小时前
跟我学c++中级篇——理解类型推导和C++不同版本的支持
开发语言·c++
德先生&赛先生4 小时前
Linux编程:1、文件编程
linux
莱茵菜苗4 小时前
Python打卡训练营day46——2025.06.06
开发语言·python