awk做wordcount

使用awk进行wordcount

被处理数据在文件access_2024-1-21.log(一个单词一行)中,内容如下:

复制代码
word
coutn
wm
sapce
US
china
WORD
WORD
wode
wode
1
2
3333
zzzz
space
spaceX
china
word

执行如下命令可以统计出每个单词出现次数:

复制代码
```bash
 awk '{S[$1]++}END{for(k in S) print S[k],k}' access_2024-1-21.log

结果如下:

root@Oler wm\]# awk '{S\[$1\]++}END{for(k in S) print S\[k\],k}' access_2024-1-21.log 1 spaceX 1 3333 1 zzzz 1 sapce 1 coutn 1 wm 1 space 1 1 1 2 2 china 2 wode 2 WORD 1 US 2 word 命令解释: 此处的S变量表示一个数组,该数组的索引为每个不重复的单词,值就是S\[$1\],$1代表单词那一列。awk是每都一行执行一次动作。 此处就是每读一行,同一个key对应的值就增加一。从0开始计算。当统计完,最后,也就是END对应的内容,就是循环打印出存储了统计结果的数组的key和值。

相关推荐
郝开4 分钟前
Docker Compose 本地环境搭建:nacos
运维·docker·容器
charlie1145141914 分钟前
嵌入式Linux开发(6-前置)——IDE 配置指南 - VSCode + clangd 驱动开发环境搭建
linux·ide·驱动开发·vscode
Lugas Luo16 分钟前
如何利用AI Agent自动分析Linux BSP(Board Support Package)驱动和内核日志
linux·人工智能·嵌入式硬件
Mr数据杨16 分钟前
AIGC工具平台-Tarui2.x智能工具桌面错误解决办法
运维·服务器·aigc
Shepherd061919 分钟前
【IT 实战】使用 Tenant Configuration Management API 完成微软租户备份自动化
运维·microsoft·自动化
磊 子22 分钟前
守护进程(精灵进程)
linux·运维·服务器
Suhan4224 分钟前
新版本Docker Desktop 自定义安装路径和下载镜像地址路径修改(附must be owned by an elevated account问题解决)
运维·docker·容器·eureka
拓朗工控25 分钟前
工控机上电开机:工业自动化的脉搏启动瞬间
运维·自动化·工控机
|_⊙26 分钟前
Linux 进程地址空间
linux·运维·服务器