【Linux】gawk编辑器二

一、变量

gawk编程语言支持两种变量:内建变量和自定义变量。

1、内建变量

gawk使用内建变量来引用一些特殊的功能。

字段和记录分隔符变量

数据字段变量

此变量允许使用**美元符号()**和字段在记录中的位置值来引用对应的字段。要引用记录中的第一个数据字段,就用变量 1,要引用第二个数据字段,就用变量 $2,以此类推。

数据字段由字段分隔符划定。默认情况下,字段分隔符是一个空白字符:空格或制表符 。可以通过使用命令行选项 -F ,或者使用特殊的内建变量 FS 修改字段分隔符。

|-----------------|---------------------------|
| FIELDWIDTHS | 由空格分隔的一列数字,定义了每个数据字段的确切宽度 |
| FS | 输入字段分隔符 |
| RS | 输入记录分隔符 |
| OFS | 输出字段分隔符 |
| ORS | 输出记录分隔符 |
[gawk数据字段和记录变量]

默认情况下,gawk会将OFS变量的值设置为一个空格。print命令会自动将OFS变量的值置于输出的每个字段之间。

bash 复制代码
gawk 'BEGIN{FS=","} {print $1,$2,$3}' test2.txt

可以通过设置0FS变量,可以在输出中用任意字符串来分隔字段。

bash 复制代码
gawk 'BEGIN{FS=","; OFS="*"} {print $1,$2,$3}' test2.txt

FIELDWIDTHS变量可以不通过字段分隔符读取记录。一旦设置了此变量,gawk就会忽略FS变量,并根据提供的字段宽度计算字段。

bash 复制代码
gawk 'BEGIN{FIELDWIDTHS="2 4 5 3"} {print $1,$2,$3,$4}' test3.txt

变量RSORS定义了gawk对数据流中记录的处理方式。默认情况下,gawk会将RS和ORS设置为换行符。

默认的RS值表明,输入数据流中的每行文本就是一条记录。

包含地址和电话号码的数据中,占据了多行

可以把FS变量设置成换行符,这样就表明数据流中的每一行都是一个单独的字段,行内的所有数据都属于同一个数据字段。同时把RS变量设置成空字符串,然后在数据记录之间留一个空行。gawk就会把每一个空行视为记录分隔符。

bash 复制代码
 gawk 'BEGIN{FS="\n"; RS=""} {print $1,$3}' test3.txt

gawk将文件中的每一行都视为一个字段,同时将空行作为记录分隔符。

数据变量

ENVIRON变量使用关联数组来提取shell环境变量,其中关联数组用文本而非数值作为数组索引。

如下所示,可以用这种方法从shell中提取任何环境变量的值,以宫gawk脚本使用。

bash 复制代码
gawk '
BEGIN{
print ENVIRON["HOME"]
print ENVIRON["PATH"]
}'
相关推荐
CingSyuan6 分钟前
Linux服务器数据盘初始化与盘符漂移解决方案:标准分区、LVM逻辑卷、XFS格式化、fstab配置与UUID持久化挂载实战
linux·运维·服务器
Dxy12393102169 分钟前
DNS负载均衡:看似简单,实则暗藏玄机
运维·负载均衡
jingling55514 分钟前
从零到一:用 Aholo Viewer 在浏览器里渲染 3D 高斯泼溅小熊
linux·前端·ubuntu·3d
张青贤23 分钟前
centos7内核kernel升级
linux·centos·内核·kernel
珠海西格电力29 分钟前
西格电力零碳园区管理系统的技术架构是怎样的?
大数据·运维·人工智能·物联网·架构·能源
MAHATMA玛哈特科技30 分钟前
矫平机的液压系统是干什么的?压下精度背后的控制逻辑
运维·服务器·校平机·矫平机·整平机
打码人的日常分享37 分钟前
信息化数据安全管理制度办法(Word)
大数据·运维·网络·云计算·制造
Kingairy1 小时前
vi(vim)常用命令汇总
linux·编辑器·vim
li35741 小时前
深入理解 Linux eBPF 技术——从内核观测到可编程网络
linux·网络
电商API_180079052471 小时前
技术分享:如何实现批量自动化获取淘宝商品视频主图API
运维·爬虫·数据挖掘·自动化