如何在 deepin文件夹中搜索包含特定内容、关键字的 Word 文档

在 deepin 系统中,搜索包含特定内容或关键字的 Word 文档是一项常见需求。以下是一个详细的步骤指南,帮助你在文件夹中高效地完成这项任务。

一、安装依赖工具

要搜索 Word 文档,首先需要安装一些必要的工具。这些工具包括 catdocdocx2txticonvgrep。它们分别用于处理不同格式的 Word 文档、字符编码转换和文本搜索。

在终端执行以下命令安装这些工具:

bash 复制代码
sudo apt install catdoc docx2txt libc-bin grep

如果系统中已安装这些工具,命令将提示无需重复安装。

二、编写搜索脚本

(一)只搜索 Word 文档(.doc/.docx)

以下是一个 Bash 脚本示例,用于搜索包含特定关键字的 Word 文档:

bash 复制代码
#!/bin/bash
# 安装依赖
hash catdoc docx2txt iconv grep || {
    echo "缺少依赖命令,正在尝试自动安装"
    sudo apt install catdoc docx2txt libc-bin grep

    hash catdoc docx2txt iconv grep && {
        echo
        echo "依赖安装成功"
        echo
    } || {
        echo
        echo "依赖安装失败,脚本无法运行"
        echo "请点击终端上的[X]关闭该窗口"
        while true; do read; done
        exit
    }
}

# 读取参数
while true; do
    echo -n "请输入搜索文件夹:"
    read dir

    # 去除开头的file://
    dir="${dir/#file:\/\//}"

    # 未输入文件夹,搜索当前文件夹
    if [ "$dir" = "" ]; then
        dir="$(realpath "$PWD")"
    fi

    if [ -e "$dir" ]; then
        break
    else
        echo "搜索文件夹不存在"
    fi
done

while true; do
    echo -n "请输入搜索关键字:"
    read keyword

    if [ "$keyword" = "" ]; then
        echo "搜索关键词不能为空"
    else
        break
    fi
done

echo
echo "在 \"$dir\" 中寻找包含 \"$keyword\" 的word文件"
echo

find "$dir" -type f | while read f; do
    content=`
        cat "$f" | docx2txt 2>/dev/null | grep -ai "$keyword"
        catdoc "$f" 2>/dev/null | grep -ai "$keyword"
    `
    if [ "$content" != "" ]; then
        found="true"
        echo -------------------------------------------------------------
        echo "$f"
        echo
        echo "$content" | head
        echo
    fi
done

echo
echo "搜索完毕"
echo "可点击终端上的[X]关闭该窗口"

# 防止终端自动关闭,用户可点击[X]关闭终端
while true; do read; done

(二)同时搜索 Word 文档(.doc/.docx)和纯文本(.txt)

如果你还需要同时搜索纯文本文件,可以使用以下脚本:

bash 复制代码
#!/bin/bash
# 安装依赖
hash catdoc docx2txt iconv grep || {
    echo "缺少依赖命令,正在尝试自动安装"
    sudo apt install catdoc docx2txt libc-bin grep

    hash catdoc docx2txt iconv grep && {
        echo
        echo "依赖安装成功"
        echo
    } || {
        echo
        echo "依赖安装失败,脚本无法运行"
        echo "请点击终端上的[X]关闭该窗口"
        while true; do read; done
        exit
    }
}

# 读取参数
while true; do
    echo -n "请输入搜索文件夹:"
    read dir

    # 去除开头的file://
    dir="${dir/#file:\/\//}"

    # 未输入文件夹,搜索当前文件夹
    if [ "$dir" = "" ]; then
        dir="$(realpath "$PWD")"
    fi

    if [ -e "$dir" ]; then
        break
    else
        echo "搜索文件夹不存在"
    fi
done

while true; do
    echo -n "请输入搜索关键字:"
    read keyword

    if [ "$keyword" = "" ]; then
        echo "搜索关键词不能为空"
    else
        break
    fi
done

echo
echo "在 \"$dir\" 中寻找包含 \"$keyword\" 的word文件"
echo

find "$dir" -type f | while read f; do
    content=`
        cat "$f" | docx2txt 2>/dev/null | grep -Ii "$keyword"
        catdoc "$f" 2>/dev/null | grep -Ii "$keyword"
        cat "$f" | grep -Ii "$keyword"
        cat "$f" | iconv -f gb18030 -t utf-8 2>/dev/null | grep -Ii "$keyword"
        cat "$f" | iconv -f big5 -t utf-8 2>/dev/null | grep -Ii "$keyword"
    `
    if [ "$content" != "" ]; then
        found="true"
        echo -------------------------------------------------------------
        echo "$f"
        echo
        echo "$content" | head
        echo
    fi
done

echo
echo "搜索完毕"
echo "可点击终端上的[X]关闭该窗口"

# 防止终端自动关闭,用户可点击[X]关闭终端
while true; do read; done

三、运行脚本

  1. 将上述脚本保存为一个文件,例如 search_word.sh
  2. 右击脚本文件,选择"属性",在"权限管理"中勾选"允许以程序执行".
  3. 双击脚本文件,选择"在终端运行",或者在终端直接输入 ./search_word.sh 运行脚本.
  4. 按照脚本提示输入搜索文件夹和关键字,脚本将自动搜索并显示包含关键字的 Word 文档及其部分内容.

四、注意事项

  • 如果首次启动脚本时自动安装依赖失败,请手动使用 sudo apt install catdoc docx2txt 命令安装.
  • 脚本会显示搜索结果的文件路径和部分内容,方便你快速定位和查看.
  • 你可以根据需要修改脚本中的搜索参数和处理逻辑,以适应不同的搜索需求.

希望本文章可以在 Linux 文件夹中高效地搜索包含特定内容或关键字的 Word 文档,提高工作效率和文件管理能力.
支持ing
阅读更多

相关推荐
头发还没掉光光23 分钟前
Linux网络之IP协议
linux·运维·网络·c++·tcp/ip
2501_944424121 小时前
Flutter for OpenHarmony游戏集合App实战之连连看路径连线
android·开发语言·前端·javascript·flutter·游戏·php
一个平凡而乐于分享的小比特1 小时前
Linux内核中的container_of宏详解
linux·container_of
C系语言1 小时前
python用pip生成requirements.txt
开发语言·python·pip
燃于AC之乐1 小时前
深入解剖STL Vector:从底层原理到核心接口的灵活运用
开发语言·c++·迭代器·stl·vector·源码分析·底层原理
lcreek8 小时前
Linux信号机制详解:阻塞信号集与未决信号集
linux·操作系统·系统编程
星火开发设计8 小时前
C++ 数组:一维数组的定义、遍历与常见操作
java·开发语言·数据结构·c++·学习·数组·知识
shandianchengzi8 小时前
【记录】Tailscale|部署 Tailscale 到 linux 主机或 Docker 上
linux·运维·docker·tailscale
TTGGGFF9 小时前
控制系统建模仿真(一):掌握控制系统设计的 MAD 流程与 MATLAB 基础运算
开发语言·matlab
2501_944424129 小时前
Flutter for OpenHarmony游戏集合App实战之贪吃蛇食物生成
android·开发语言·flutter·游戏·harmonyos