awk命令——功能强大的文本处理工具

目录

什么是awk命令

awk命令,是一个功能强大的文本处理工具,他的名字是由它的三位创始人------Alfred A ho, Peter W einberger和Brian Kernighan的首字母组合而来的,通过awk命令,可以是文本的处理变得轻松自如。

awk命令处理文本的方式

awk命令处理文本时,他会遍历文本的每一行,让每一行跟匹配条件进行匹配,如果匹配成功,就执行匹配条件后面的命令,否则就略过匹配条件后面的命令。直到遍历结束,awk命令才停止处理。

awk命令的语法

awk命令,它的核心就在于它自带的awk命令的语法和内置变量。

awk自带的命令语法,主要由正则构成的匹配条件及命令本身结合而成,像这样的组合可以有多个,并且可以直接拼接到一起。

bash 复制代码
awk '[匹配条件]{命令本身}...' 文件

awk的命令,跟我们学到的编程语言非常的相似。 只要你入了IT的大门,那么你就可以大概的学会它的命令。比如awk命令里的for循环,他几乎跟C/C++中的for循环一样,再比如awk命令里的**运算符,它跟python里的**运算符的功能也一样。

awk命令的内置变量

关于awk命令,唯一要好好记的则是awk命令的内置变量,因为通过内置变量,你可以轻松自如地得到某个文件的信息。

内置变量 意义 记巧
ARGC 当前执行的awk命令参数个数,适用于统计被处理文件数量
ARGV awk命令参数数组
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk命令处理到的文件名 FILENAME的中文是"文件名"
FNR 当前处理行对应在文件中的行号 FNR = File + NR
FS 输入域分隔符,等同于awk命令的选项-F,默认为空格 FS = field spilt(fieid的意思是区域)
NF 当前行处理的输入域的个数 NF = num field
NR 已处理的行数 NR = num rows
OFS 输出域分隔符 OFS = output field spilt
ORS 输出行分隔符 ORS = output rows spilt
RS 被处理行的分隔符 RS = rows spilt
$n $0表示读取到的整一行,$1表示行的第一个输入域,$2表示行的第一个输入域,往后你也能推导出来 awk命令中的$n ≈ shell中的$n
$NF 被处理行的最后一个输入域 $NF = $number finally

awk命令的选项

关于awk命令的选项,主要有这两种。

选项 意义 记巧
-v 定义变量 -v -> variable
-F 设置输入域的分隔符 -F -> field split

其中还要注意的是,这些选项是区分大小写的 ,你如果把-F写成-f了,那么就会awk命令报错。

awk命令的具体实例

学完awk命令之后,接下来就以下面的t.txt文本文件来举几个例子吧。

复制代码
a b cd efg
1234567890 ~!@#$%^&*()_+   
/ //* *- *- //* */ -* / *-- -* 
joy it 66666666666666666666666666666666   
the the is the the      
awk is good ^v^  

1. 读取t.txt文件每行第一个被空格分开的列

bash 复制代码
awk '{print $1}' t.txt

2. 显示t.txt文件每一行的行号

bash 复制代码
awk '{print NR, $0}' t.txt

3. 查询t.txt文件带有字符t-z的行

bash 复制代码
awk '{print $1}' t.txt

4. 显示t.txt文件的第一行

bash 复制代码
awk '{if(1 == NR){print $0}}' t.txt

5. 在第一行前面插入"//t.txt"

bash 复制代码
awk '{if(1 == NR){printf("//%s\n", FILENAME)}print $0}' t.txt

6. 输出t.txt文件中被*分割开的第3行的第1-3列

bash 复制代码
awk -F* '{if(3 == NR){print $1, $2, $3}}' t.txt

7. 输出t.txt文件每一行5遍

bash 复制代码
awk -v i=0 '{for (i=0;i<5;i++){print $0}}' t.txt

下篇预告

sort命令------排序必定好用的命令

相关推荐
Zevalin爱灰灰2 小时前
makefile从入门到实战 第一章 认识makefile(一)
linux·makefile
Shadow(⊙o⊙)2 小时前
进程间通信0.0-pipe()匿名管道,详细分析进程池调度队列执行逻辑,进程池模拟实现。
linux·运维·服务器·开发语言·c++
CQU_JIAKE2 小时前
6.6aaaaaa
linux·运维·服务器
Apibro3 小时前
【Linux】Qt Creator 中文输入法
linux·qt
smallswan3 小时前
第十四 算数运算
linux·服务器·前端
丑过三八线3 小时前
Umi 配置文件 .umirc.ts 详解
linux·运维·ubuntu·react.js
zh路西法3 小时前
【rosbridge-websocket】跨网络的ROS1与ROS2通讯法(上)
linux·网络·c++·python·websocket·网络协议
zincsweet3 小时前
Linux线程原理深度剖析:从CPU调度到pthread实现
linux·服务器
老陈头聊SEO3 小时前
优化长尾关键词,提升SEO效果的创新思路与实践方法
其他·搜索引擎·seo优化
A_humble_scholar3 小时前
Linux(三)深入理解 Makefile:自动变量、增量编译原理与文件时间属性
linux·服务器·c++·makefile