【Linux】gawk编辑器二

一、变量

gawk编程语言支持两种变量:内建变量和自定义变量。

1、内建变量

gawk使用内建变量来引用一些特殊的功能。

字段和记录分隔符变量

数据字段变量

此变量允许使用**美元符号()**和字段在记录中的位置值来引用对应的字段。要引用记录中的第一个数据字段,就用变量 1,要引用第二个数据字段,就用变量 $2,以此类推。

数据字段由字段分隔符划定。默认情况下,字段分隔符是一个空白字符:空格或制表符 。可以通过使用命令行选项 -F ,或者使用特殊的内建变量 FS 修改字段分隔符。

|-----------------|---------------------------|
| FIELDWIDTHS | 由空格分隔的一列数字,定义了每个数据字段的确切宽度 |
| FS | 输入字段分隔符 |
| RS | 输入记录分隔符 |
| OFS | 输出字段分隔符 |
| ORS | 输出记录分隔符 |
[gawk数据字段和记录变量]

默认情况下,gawk会将OFS变量的值设置为一个空格。print命令会自动将OFS变量的值置于输出的每个字段之间。

bash 复制代码
gawk 'BEGIN{FS=","} {print $1,$2,$3}' test2.txt

可以通过设置0FS变量,可以在输出中用任意字符串来分隔字段。

bash 复制代码
gawk 'BEGIN{FS=","; OFS="*"} {print $1,$2,$3}' test2.txt

FIELDWIDTHS变量可以不通过字段分隔符读取记录。一旦设置了此变量,gawk就会忽略FS变量,并根据提供的字段宽度计算字段。

bash 复制代码
gawk 'BEGIN{FIELDWIDTHS="2 4 5 3"} {print $1,$2,$3,$4}' test3.txt

变量RSORS定义了gawk对数据流中记录的处理方式。默认情况下,gawk会将RS和ORS设置为换行符。

默认的RS值表明,输入数据流中的每行文本就是一条记录。

包含地址和电话号码的数据中,占据了多行

可以把FS变量设置成换行符,这样就表明数据流中的每一行都是一个单独的字段,行内的所有数据都属于同一个数据字段。同时把RS变量设置成空字符串,然后在数据记录之间留一个空行。gawk就会把每一个空行视为记录分隔符。

bash 复制代码
 gawk 'BEGIN{FS="\n"; RS=""} {print $1,$3}' test3.txt

gawk将文件中的每一行都视为一个字段,同时将空行作为记录分隔符。

数据变量

ENVIRON变量使用关联数组来提取shell环境变量,其中关联数组用文本而非数值作为数组索引。

如下所示,可以用这种方法从shell中提取任何环境变量的值,以宫gawk脚本使用。

bash 复制代码
gawk '
BEGIN{
print ENVIRON["HOME"]
print ENVIRON["PATH"]
}'
相关推荐
平行云几秒前
实时云渲染预启动技术解析:UE数字孪生应用的延迟优化机制(一)
linux·ue5·webgl·数字孪生·云渲染·实时云渲染·像素流
都在酒里12 分钟前
Linux字符设备驱动开发(三):引入并发控制——使用mutex保护共享数据
linux·运维·驱动开发
盟接之桥15 分钟前
什么是电子数据交换(EDI)|AS2 协议详解
运维·服务器·网络·安全·低代码·汽车·制造
慵懒的猫mi26 分钟前
从 Windows 到 deepin:Electron 软件无损移植实战
linux·windows·deepin
我命由我1234526 分钟前
VSCode - VSCode 自定义折叠区域
前端·javascript·ide·vscode·前端框架·编辑器·js
网安情报局27 分钟前
抗 DDoS 的核心:黑白名单、限速、流量牵引技术对比分析
运维·服务器·网络
坤昱29 分钟前
cfs调度类深入解刨——最新内核细节分析1
linux·cfs·cfs调度·linux 7.1·eevdf·核心调度结构·linux最新调度分析
huohaiyu36 分钟前
深入解析JVM核心原理与运行机制
运维·服务器·jvm
MC皮蛋侠客38 分钟前
Perf 火焰图深度实战:CPU 性能分析与异常排查完全指南
linux·c++·性能分析·perf·火焰图
风曦Kisaki38 分钟前
Nginx代理与LVS(NAT/DR)全方位对比
运维·nginx·lvs