awk的应用

步骤一:awk的基本用法

1)基本操作方法

格式1:awk 选项 '条件{指令}' 文件

格式2:前置指令 | awk 选项 '条件{指令}'

其中,print 是最常用的编辑指令;若有多条编辑指令,可用分号分隔。

处理文本时,默认将空格、制表符作为分隔符。

条件可以用/ /的方式,与sed类似

awk常用内置变量:

$0 文本当前行的全部内容

$1 文本的第1列

$2 文件的第2列

$3 文件的第3列,依此类推

NR 文件当前行的行号

NF 文件当前行的列数(有几列)

  1. root@svr5 \~# cat abc.txt
  2. hello the world
  3. welcome to beijing
  4. awk '{print}' abc.txt #输出所有
  5. awk '/to/{print}' abc.txt #输出有to的那行
  6. awk '{print $2}' abc.txt #输出所有行的第2列
  7. awk '/to/{print $1}' abc.txt #输出有to的那行的第1列
  8. awk '{print $0}' abc.txt #输出所有行所有列
  9. awk '{print 0,1}' abc.txt #输出所有行所有列,第1列
  10. awk '{print NR}' abc.txt #输出所有行的行号
  11. awk '{print NR,$0}' abc.txt #输出所有行的行号,所有列
  12. awk '{print NR,NF}' abc.txt #输出所有行的行号,列号(有几列)

选项 -F 可指定分隔符

  1. awk -F: '{print $1}' user #文档中如果没有空格,可以用F修改分隔符
  2. awk -F: '{print 1,6}' user #使用冒号作为列的分隔符,显示第1、6列

awk的print指令不仅可以打印变量,还可以打印常量

  1. awk -F: '{print 1" 的家目录是 "6}' user #输出常量,加双引号即可

格式化输出信息

  1. awk 选项 '条件{指令}' 文件
  2. awk 选项 'BEGIN{指令} {指令} END{指令}' 文件
  • BEGIN{ } 行前处理,读取文件内容前执行,指令执行1次
  • { } 逐行处理,读取文件过程中执行,指令执行n次
  • END{ } 行后处理,读取文件结束后执行,指令执行1次
  • awk -F: 'BEGIN{print "start"}{print $1}END{print "over"}' user
  • awk 'BEGIN{print NR}{print NR}END{print NR}' user

输出信息时,可以使用"\t"显示Tab制表位:

  1. awk -F: 'BEGIN{print "User\tUID\tHome"}{print 1"\\t"3"\t"$6}END{print "总计"NR"行"}' user #合在一起写

步骤一:认识awk处理条件的设置

使用正则设置条件

/正则/ ~ 包含 !~不包含

  1. awk -F: '$6~/root/{print}' user #输出第6列包含root的行
  2. awk -F: '$6~/bin/{print}' user #输出第6列包含bin的行
  3. awk -F: '$6!~/bin/{print}' user #输出第6列不包含bin的行

定义数组的格式:数组名下标=元素值

调用数组的格式:数组名下标awk 'BEGIN{a"abc"="abcabc";a"xyz"="xyzxyz";print a"xyz"}'

复制代码
  1. awk '{a$1++}END{for(i in a){print i,ai}}' shu.txt #使用逐行任务与数组收集文档shu.txt中的信息,然后在END任务中使用for循环显示所有数组a的下标与值

:统计Web访问量排名

通过awk提取信息时,利用IP地址作为数组下标,每遇到一个重复值就将此数组元素递增1,最终就获得了这个IP地址出现的次数。

针对文本排序输出可以采用sort命令,相关的常见选项为-r、-n、-k。其中-n表示按数字顺序升序排列,而-r表示反序,-k可以指定按第几个字段来排序

awk '{ip$1++}END{for(i in ip){print ipi,i}}' /var/log/httpd/access_log | sort -nr

/var/log/secure是安全日志,如果有人登陆时输入错误密码的话信息会记录下来,这种信息可以用awk抓取出来,方法如下:

  1. awk '/Failed password for root/{ip$11++}END{for(i in ip){print i,ipi}}' /var/log/secure #统计安全日志中访问root账户且密码输入错误的ip地址与次数
相关推荐
A小辣椒8 小时前
TShark:Wireshark CLI 功能
linux
A小辣椒12 小时前
TShark:基础知识
linux
AlfredZhao14 小时前
OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G?
linux·oci
AlfredZhao1 天前
vi 删除指定范围的行,不用再反复按 dd
linux·vi
用户9718356334661 天前
银河麒麟 KY10 申威(SW64) 安装 nginx-1.16.1-2.p01.ky10.sw_64.rpm 详细步骤
linux
猪脚踏浪2 天前
linux 拷贝文件或目录到指定的位置
linux
大树882 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠2 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
霸道流氓气质2 天前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务
bush42 天前
嵌入式linux学习记录十四、术语
linux·嵌入式