【Linux系列】AWK 使用指南

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。💝💝💝 ✨✨ 欢迎订阅本专栏 ✨✨

博客目录

AWK 是一种强大的文本处理工具,它起源于 Unix 系统,用于模式扫描和处理语言。AWK 的名称来源于其创始人 Alfred Aho、Peter Weinberger 和 Brian Kernighan 的姓氏首字母。AWK 特别适合于处理结构化数据,如 CSV 或 TSV 文件,以及任何行和列的文本数据。

AWK 的基本用法

AWK 的基本语法如下:

bash 复制代码
awk 'pattern {action}' file

其中,pattern 是一个条件表达式,action 是当模式匹配时执行的代码块,file 是要处理的文件。如果没有指定文件,AWK 将从标准输入读取数据。

打印所有行

最简单的 AWK 命令是打印文件的所有行:

bash 复制代码
awk '{print}' file.txt

打印特定列

假设我们有一个 CSV 文件,我们想要打印第二列:

bash 复制代码
awk '{print $2}' file.csv

这里,$2 表示第二个字段。

打印特定行

如果我们只想打印第 10 行,可以使用:

bash 复制代码
awk 'NR == 10' file.txt

NR 是一个内置变量,表示当前处理的是第几行。

模式匹配

AWK 允许使用正则表达式进行模式匹配。例如,如果我们想要匹配包含单词 "error" 的行,可以这样做:

bash 复制代码
awk '/error/' file.log

内置变量

AWK 提供了一些内置变量,这些变量在处理文本时非常有用:

  • $1, $2, ...:这些变量代表当前行的字段,由 FS(字段分隔符)分隔。
  • NF:表示当前行的字段总数。
  • NR:表示当前处理的行号。
  • FNR:表示当前文件的行号。
  • FS:字段分隔符,默认为空格或制表符。
  • RS:记录分隔符,默认为换行符。
  • ORS:输出记录分隔符,默认为换行符。
  • OFS:输出字段分隔符,默认为空格。

高级技巧

多模式匹配

AWK 允许在同一命令中使用多个模式:

bash 复制代码
awk '/error/, /warning/' file.log

这将打印包含 "error" 或 "warning" 的行。

条件和动作

我们可以在 AWK 中使用 if-else 语句和其他控制结构:

bash 复制代码
awk '{if ($1 == "error") print "Error: " $0; else if ($1 == "warning") print "Warning: " $0}' file.log

这段代码会根据第一个字段的值打印不同的信息。

自定义函数

AWK 允许用户定义函数,这使得处理复杂的文本更加灵活:

bash 复制代码
awk '
  function is_error(line) {
    return line ~ /error/;
  }
  {
    if (is_error($0)) print "Error: " $0;
  }
' file.log

处理多个文件

AWK 可以同时处理多个文件,只需将它们作为参数传递:

bash 复制代码
awk '{print FILENAME, $0}' file1.txt file2.txt

这将打印每个文件的名称和内容。

内置数组

AWK 支持数组,这使得数据的存储和检索变得简单:

bash 复制代码
awk '{arr[$1] += $2} END {for (key in arr) print key, arr[key]}' file.csv

这段代码将计算 CSV 文件中每个唯一字段的总和。

觉得有用的话点个赞 👍🏻 呗。

❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍

🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

相关推荐
SAP工博科技6 分钟前
SAP 公有云 ERP 多工厂多生产线数据统一管理技术实现解析
大数据·运维·人工智能
YongCheng_Liang8 分钟前
从零开始学虚拟化:桌面虚拟化(VDI)入门指南(架构 + 产品 + 部署)
运维·云计算
杜子不疼.15 分钟前
【Linux】库制作与原理(二):动态库的制作与使用
linux·运维·服务器
森焱森18 分钟前
嵌入式硬件工程师应知 白银快速分析报告
linux·c语言·arm开发·嵌入式硬件·去中心化
小白电脑技术22 分钟前
飞牛漏洞焦虑?别瞎折腾WAF了!用Lucky五步搞定“防爬墙”
服务器·网络·安全
消失的旧时光-194323 分钟前
Nginx 是什么?为什么它不写在代码里?——从 0 认识 Nginx
运维·服务器·nginx
BJ_Bonree24 分钟前
4月17日,博睿数据受邀出席GOPS全球运维大会2026 · 深圳站!
大数据·运维·人工智能
RisunJan25 分钟前
Linux命令-lpq(查看打印队列状态)
linux·运维·服务器
山君爱摸鱼26 分钟前
Linux-服务进程
linux·运维·服务器
阿乐艾官27 分钟前
【linux文件系统重要目录及命令解释】
linux·运维·服务器