【Linux 运维】告别 cat:如何按“时间段”优雅地截取日志文件?

前言

做后端开发或运维的同学,一定都经历过这样的场景:

线上服务出了 Bug,老板让你查一下今天上午 10:00 到 11:00 到底发生了什么。你登录服务器一看,app.log 已经跑到了 10GB

这时候如果你直接 vim 打开,服务器可能会卡死;如果你用 cattail 慢慢翻,眼睛都要看瞎。

其实,在 CentOS(以及绝大多数 Linux 发行版)下,我们完全不需要写复杂的脚本,只需要一行命令,就能把指定时间段 的日志另存为一个新的文件。

今天就分享三种最常用的姿势,由浅入深,总有一款适合你。


准备工作

假设我们的日志文件名为 app.log,格式如下(标准的日期开头):

Plaintext

复制代码
2023-10-27 10:00:01 [INFO] User login success
2023-10-27 10:00:05 [WARN] Database query slow
...

我们的目标是:将 10:00 到 11:00 的日志,另存为 bug_report.log


姿势一:sed ------ 简单粗暴(推荐日志连续的情况)

sed 是流编辑器,它非常适合处理这种"从 A 开始,到 B 结束"的任务。

命令模板:

Bash

复制代码
sed -n '/开始时间/,/结束时间/p' 原日志 > 新日志

实战操作:

Bash

复制代码
sed -n '/2023-10-27 10:00:00/,/2023-10-27 11:00:00/p' app.log > bug_report.log

✅ 优点:

  • 命令简单,好记。

  • 处理速度极快。

⚠️ 缺点(非常重要):

sed 是完全匹配字符串。如果你的日志里正好没有 10:00:00 这一秒的记录(比如那一秒没人访问),sed 就会找不到开始标记,导致截取失败。


姿势二:awk ------ 精准打击(最稳健的方案)

如果你担心日志中间有断档(比如某一秒没有日志),awk 是最佳选择。它不看字符串是否相等,而是把时间当做字符进行比较(大于/小于)

只要日志行首是时间,它就能精确捕捉范围。

命令模板:

Bash

复制代码
awk '$0 >= "开始时间" && $0 <= "结束时间"' 原日志 > 新日志

(注:$0 代表整行内容,如果只需要比较第2列时间,可以用 $2)

实战操作:

Bash

复制代码
awk '$0 >= "2023-10-27 10:00:00" && $0 <= "2023-10-27 11:00:00"' app.log > bug_report.log

✅ 优点:

  • 容错率高:即使日志里没有 10:00:00 这一行,它也会从 10:00:01 开始截取。

  • 逻辑清晰,支持复杂的过滤条件。


姿势三:grep ------ 模糊搜索(适合"按小时"抓取)

如果你不需要精确到秒,只是想把"10 点这一小时"的所有日志都拉出来看看,grep 是最快的。

命令模板:

Bash

复制代码
grep "^时间前缀" 原日志 > 新日志

实战操作(抓取 10 点段所有日志):

Bash

复制代码
grep "^2023-10-27 10:" app.log > 10_am_logs.log

✅ 优点:

  • 几乎没有心智负担,最常用的命令。

  • 适合快速排查故障范围。


总结与建议

方案 命令关键字 适用场景 稳健性
方案一 sed 确定起始时间点一定存在时 ⭐⭐⭐
方案二 awk 生产环境首选,时间点可能不连续 ⭐⭐⭐⭐⭐
方案三 grep 只需要按小时/按分钟模糊查询 ⭐⭐⭐⭐

老司机建议:

如果你在写自动化脚本来备份日志,请务必使用 方案二 (awk),因为它不会因为某一秒日志的缺失而导致脚本失效。


希望这篇小技巧能帮你从海量日志中从容脱身!

相关推荐
梦里不知身是客113 小时前
flink中checkpoint的重启策略
大数据·服务器·flink
zl_dfq4 小时前
Linux 之 【进程等待】
linux
遇见火星4 小时前
Linux性能调优:理解CPU中的平均负载和使用率
linux·运维·服务器·cpu
Chennnng5 小时前
Ubuntu 安装过程的 6 大常见问题类型
linux·运维·ubuntu
阿干tkl5 小时前
传统网络与NetworkManager对比
linux·网络
Evan芙6 小时前
Linux 进程状态与进程管理命令
linux·运维·服务器
doris6106 小时前
2025年设备管理系统:智能运维成新标杆
运维
qsjming7 小时前
EXT4文件系统特性说明
运维
码农12138号7 小时前
Bugku HackINI 2022 Whois 详解
linux·web安全·ctf·命令执行·bugku·换行符