【Linux 运维】告别 cat:如何按“时间段”优雅地截取日志文件?

前言

做后端开发或运维的同学,一定都经历过这样的场景:

线上服务出了 Bug,老板让你查一下今天上午 10:00 到 11:00 到底发生了什么。你登录服务器一看,app.log 已经跑到了 10GB

这时候如果你直接 vim 打开,服务器可能会卡死;如果你用 cattail 慢慢翻,眼睛都要看瞎。

其实,在 CentOS(以及绝大多数 Linux 发行版)下,我们完全不需要写复杂的脚本,只需要一行命令,就能把指定时间段 的日志另存为一个新的文件。

今天就分享三种最常用的姿势,由浅入深,总有一款适合你。


准备工作

假设我们的日志文件名为 app.log,格式如下(标准的日期开头):

Plaintext

复制代码
2023-10-27 10:00:01 [INFO] User login success
2023-10-27 10:00:05 [WARN] Database query slow
...

我们的目标是:将 10:00 到 11:00 的日志,另存为 bug_report.log


姿势一:sed ------ 简单粗暴(推荐日志连续的情况)

sed 是流编辑器,它非常适合处理这种"从 A 开始,到 B 结束"的任务。

命令模板:

Bash

复制代码
sed -n '/开始时间/,/结束时间/p' 原日志 > 新日志

实战操作:

Bash

复制代码
sed -n '/2023-10-27 10:00:00/,/2023-10-27 11:00:00/p' app.log > bug_report.log

✅ 优点:

  • 命令简单,好记。

  • 处理速度极快。

⚠️ 缺点(非常重要):

sed 是完全匹配字符串。如果你的日志里正好没有 10:00:00 这一秒的记录(比如那一秒没人访问),sed 就会找不到开始标记,导致截取失败。


姿势二:awk ------ 精准打击(最稳健的方案)

如果你担心日志中间有断档(比如某一秒没有日志),awk 是最佳选择。它不看字符串是否相等,而是把时间当做字符进行比较(大于/小于)

只要日志行首是时间,它就能精确捕捉范围。

命令模板:

Bash

复制代码
awk '$0 >= "开始时间" && $0 <= "结束时间"' 原日志 > 新日志

(注:$0 代表整行内容,如果只需要比较第2列时间,可以用 $2)

实战操作:

Bash

复制代码
awk '$0 >= "2023-10-27 10:00:00" && $0 <= "2023-10-27 11:00:00"' app.log > bug_report.log

✅ 优点:

  • 容错率高:即使日志里没有 10:00:00 这一行,它也会从 10:00:01 开始截取。

  • 逻辑清晰,支持复杂的过滤条件。


姿势三:grep ------ 模糊搜索(适合"按小时"抓取)

如果你不需要精确到秒,只是想把"10 点这一小时"的所有日志都拉出来看看,grep 是最快的。

命令模板:

Bash

复制代码
grep "^时间前缀" 原日志 > 新日志

实战操作(抓取 10 点段所有日志):

Bash

复制代码
grep "^2023-10-27 10:" app.log > 10_am_logs.log

✅ 优点:

  • 几乎没有心智负担,最常用的命令。

  • 适合快速排查故障范围。


总结与建议

方案 命令关键字 适用场景 稳健性
方案一 sed 确定起始时间点一定存在时 ⭐⭐⭐
方案二 awk 生产环境首选,时间点可能不连续 ⭐⭐⭐⭐⭐
方案三 grep 只需要按小时/按分钟模糊查询 ⭐⭐⭐⭐

老司机建议:

如果你在写自动化脚本来备份日志,请务必使用 方案二 (awk),因为它不会因为某一秒日志的缺失而导致脚本失效。


希望这篇小技巧能帮你从海量日志中从容脱身!

相关推荐
素素.陈1 小时前
根据图片中的起始位置的特殊内容将图片进行分组
java·linux·windows
xiucai_cs1 小时前
实战:用 Claude Code 打造 AI 运维工程师
运维·人工智能
阿干tkl1 小时前
基于nginx服务文件上传及下载
运维·nginx
❀͜͡傀儡师1 小时前
docker部署orion-ops一站式智能运维管理平台
运维·docker·容器·orion-ops
闻道且行之1 小时前
Ubuntu 20.04 下 NVIDIA Tesla P40 驱动安装指南(核显桌面 + 计算卡分离方案)
linux·运维·ubuntu·nvidia·p40
oMcLin1 小时前
Ubuntu 24.04 使用 systemd 时 Nginx 服务无法启动的原因分析与解决
linux·nginx·ubuntu
大布布将军1 小时前
☁️ 自动化交付:CI/CD 流程与云端部署
运维·前端·程序人生·ci/cd·职场和发展·node.js·自动化
RisunJan1 小时前
Linux命令-htpasswd命令(创建和管理用于 HTTP 基本认证(Basic Authentication)的密码文件)
linux·运维·http
我可以将你更新哟1 小时前
在Ubuntu 22.04上安装C++编译工具
linux·c++·ubuntu