awk做wordcount

使用awk进行wordcount

被处理数据在文件access_2024-1-21.log(一个单词一行)中,内容如下:

复制代码
word
coutn
wm
sapce
US
china
WORD
WORD
wode
wode
1
2
3333
zzzz
space
spaceX
china
word

执行如下命令可以统计出每个单词出现次数:

复制代码
```bash
 awk '{S[$1]++}END{for(k in S) print S[k],k}' access_2024-1-21.log

结果如下:

root@Oler wm# awk '{S$1++}END{for(k in S) print Sk,k}' access_2024-1-21.log

1 spaceX

1 3333

1 zzzz

1 sapce

1 coutn

1 wm

1 space

1 1

1 2

2 china

2 wode

2 WORD

1 US

2 word

命令解释:

此处的S变量表示一个数组,该数组的索引为每个不重复的单词,值就是S$1,$1代表单词那一列。awk是每都一行执行一次动作。 此处就是每读一行,同一个key对应的值就增加一。从0开始计算。当统计完,最后,也就是END对应的内容,就是循环打印出存储了统计结果的数组的key和值。

相关推荐
ulias2123 分钟前
深挖进程间通信的奥秘
java·linux·服务器·开发语言·c++·算法
AOwhisky11 分钟前
MySQL 学习笔记(第三期):SQL 语言之数据操作与单表查询
linux·运维·笔记·sql·学习·mysql·云计算
luj_176811 分钟前
局部两极分析破解数学建模难题
服务器·c语言·开发语言·经验分享·算法
技术不好的崎鸣同学16 分钟前
x64汇编之前篇内容复习(上)
运维·服务器
hj28625127 分钟前
Linux磁盘存储原理(扇区/Block/Inode)+ 软硬链接 + 日志系统 完整版笔记(含案例+面试题)
服务器·网络·数据库
键盘上的猫头鹰1 小时前
【Linux 基础教程(四)】文件内容查看、打包压缩与搜索、重定向管道及环境变量
linux·服务器·python
FenceRain1 小时前
Nginx 升级,平滑升级不停服务
服务器·网络·nginx
tellmewhoisi1 小时前
linux 基础知识(文件权限相关)
linux·运维·服务器
jiayong231 小时前
Claude Code 常见操作实战指南
linux·服务器·网络·ai·claude·claude code
醇氧1 小时前
【Linux 】sudo、sudo -i、su、su - 完整区别总结
linux·运维·服务器