【Linux 运维】告别 cat:如何按“时间段”优雅地截取日志文件?

前言

做后端开发或运维的同学,一定都经历过这样的场景:

线上服务出了 Bug,老板让你查一下今天上午 10:00 到 11:00 到底发生了什么。你登录服务器一看,app.log 已经跑到了 10GB

这时候如果你直接 vim 打开,服务器可能会卡死;如果你用 cattail 慢慢翻,眼睛都要看瞎。

其实,在 CentOS(以及绝大多数 Linux 发行版)下,我们完全不需要写复杂的脚本,只需要一行命令,就能把指定时间段 的日志另存为一个新的文件。

今天就分享三种最常用的姿势,由浅入深,总有一款适合你。


准备工作

假设我们的日志文件名为 app.log,格式如下(标准的日期开头):

Plaintext

复制代码
2023-10-27 10:00:01 [INFO] User login success
2023-10-27 10:00:05 [WARN] Database query slow
...

我们的目标是:将 10:00 到 11:00 的日志,另存为 bug_report.log


姿势一:sed ------ 简单粗暴(推荐日志连续的情况)

sed 是流编辑器,它非常适合处理这种"从 A 开始,到 B 结束"的任务。

命令模板:

Bash

复制代码
sed -n '/开始时间/,/结束时间/p' 原日志 > 新日志

实战操作:

Bash

复制代码
sed -n '/2023-10-27 10:00:00/,/2023-10-27 11:00:00/p' app.log > bug_report.log

✅ 优点:

  • 命令简单,好记。

  • 处理速度极快。

⚠️ 缺点(非常重要):

sed 是完全匹配字符串。如果你的日志里正好没有 10:00:00 这一秒的记录(比如那一秒没人访问),sed 就会找不到开始标记,导致截取失败。


姿势二:awk ------ 精准打击(最稳健的方案)

如果你担心日志中间有断档(比如某一秒没有日志),awk 是最佳选择。它不看字符串是否相等,而是把时间当做字符进行比较(大于/小于)

只要日志行首是时间,它就能精确捕捉范围。

命令模板:

Bash

复制代码
awk '$0 >= "开始时间" && $0 <= "结束时间"' 原日志 > 新日志

(注:$0 代表整行内容,如果只需要比较第2列时间,可以用 $2)

实战操作:

Bash

复制代码
awk '$0 >= "2023-10-27 10:00:00" && $0 <= "2023-10-27 11:00:00"' app.log > bug_report.log

✅ 优点:

  • 容错率高:即使日志里没有 10:00:00 这一行,它也会从 10:00:01 开始截取。

  • 逻辑清晰,支持复杂的过滤条件。


姿势三:grep ------ 模糊搜索(适合"按小时"抓取)

如果你不需要精确到秒,只是想把"10 点这一小时"的所有日志都拉出来看看,grep 是最快的。

命令模板:

Bash

复制代码
grep "^时间前缀" 原日志 > 新日志

实战操作(抓取 10 点段所有日志):

Bash

复制代码
grep "^2023-10-27 10:" app.log > 10_am_logs.log

✅ 优点:

  • 几乎没有心智负担,最常用的命令。

  • 适合快速排查故障范围。


总结与建议

方案 命令关键字 适用场景 稳健性
方案一 sed 确定起始时间点一定存在时 ⭐⭐⭐
方案二 awk 生产环境首选,时间点可能不连续 ⭐⭐⭐⭐⭐
方案三 grep 只需要按小时/按分钟模糊查询 ⭐⭐⭐⭐

老司机建议:

如果你在写自动化脚本来备份日志,请务必使用 方案二 (awk),因为它不会因为某一秒日志的缺失而导致脚本失效。


希望这篇小技巧能帮你从海量日志中从容脱身!

相关推荐
ID_1800790547313 小时前
淘宝平台商品详情API(item_get)深度解析
java·服务器·前端
Q168496451513 小时前
Linux-周期任务易错问题
linux·运维·服务器
Leo July13 小时前
Docker全解析:从入门到企业级实战
运维·docker·容器
sxgzzn13 小时前
风电无人机巡检平台:如何用无人机与AI实现风机智能运维?
运维·人工智能·无人机
梦想的旅途213 小时前
从句柄操作到内存指令:企微外部群自动化推送的底层演进
运维·自动化·企业微信
运维有小邓@13 小时前
如何分析 Linux 系统登录失败事件
linux·运维·服务器
物联网软硬件开发-轨物科技13 小时前
技术白皮书:AI驱动下的光伏电站智能化运维新范式
运维·人工智能·物联网
江湖有缘13 小时前
PicoShare + Docker 实战:打造极简自托管文件分享系统
运维·docker·容器
负二代0.013 小时前
系统引导过程及修复
linux·运维·服务器
kft131413 小时前
SkyWalking10.3.0-性能监控管理工具部署教程-Docker模式(二)-保姆级教程
运维·docker·容器