Linux 的 comm 命令

Linux 的 comm 命令是一个用于逐行比较两个已排序文件的强大文本处理工具。它能够精确识别文件间的差异和共同点,特别适合系统管理员和开发人员进行文本分析。

基本语法:

复制代码
comm [选项] 文件1 文件2

功能详解:

  1. 第一列输出:仅在文件1中出现的行(使用示例:找出file1特有的配置项)
  2. 第二列输出:仅在文件2中出现的行(使用示例:发现file2新增的日志条目)
  3. 第三列输出:两个文件共有的行(使用示例:确认两个版本共用的函数定义)

常用选项详解:

  • -1:隐藏第一列输出,例如comm -1 a.txt b.txt只显示b特有和共有的行
  • -2:隐藏第二列输出,适合快速找出a文件特有内容
  • -3:隐藏第三列输出,用于只查看差异部分
  • --check-order:严格检查输入文件是否已排序,发现未排序会报错
  • --nocheck-order:跳过排序检查(默认),但可能导致错误结果

使用前提注意事项:

典型应用场景扩展:

  1. 配置文件差异分析:

    先备份并排序配置文件

    cp httpd.conf httpd.conf.bak
    sort httpd.conf > httpd.sorted
    sort httpd.conf.bak > httpd.bak.sorted

    找出修改过的配置项

    comm -3 httpd.sorted httpd.bak.sorted

  2. 日志文件分析进阶:

    找出两个时间段都出现的错误(交集)

    comm -12 morning_errors.log.sorted evening_errors.log.sorted

    使用进程替换避免中间文件

    comm -12 <(sort log1.txt) <(sort log2.txt)

  3. 用户管理系统示例:

    找出新添加的用户

    comm -13 /etc/passwd.old.sorted /etc/passwd.new.sorted

    找出被删除的用户

    comm -23 /etc/passwd.old.sorted /etc/passwd.new.sorted

高级技巧:

  1. 结合grep过滤结果:comm file1 file2 | grep -v '^\t'
  2. 使用-i选项进行大小写不敏感比较(需要GNU comm)
  3. 处理制表符:comm --output-delimiter=',' 更改分隔符
  4. 性能优化:对大文件使用sort -u先去除重复行

注意事项补充:

  • 制表符(\t)用于分隔输出列,可能影响可视化
  • 空行会被视为有效内容参与比较
  • 在脚本中使用时建议总是显式指定--check-order
  • 可以搭配diff命令进行更复杂的比较
相关推荐
莫回首�2 小时前
ubuntu 20.04 多网卡配置,遇到问题总结
linux·网络·ubuntu
网络安全许木2 小时前
自学渗透测试第11天(Linux压缩解压与磁盘管理)
linux·网络安全·渗透测试
wuweijianlove4 小时前
算法性能的渐近与非渐近行为对比的技术4
算法
_dindong4 小时前
cf1091div2 C.Grid Covering(数论)
c++·算法
AI成长日志4 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
航Hang*4 小时前
Windows Server 配置与管理——第3章:文件系统管理
运维·服务器·windows·vmware
黎阳之光5 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
lifewange5 小时前
Linux ps 进程查看命令详解
linux·运维·服务器
skywalker_115 小时前
力扣hot100-3(最长连续序列),4(移动零)
数据结构·算法·leetcode
6Hzlia5 小时前
【Hot 100 刷题计划】 LeetCode 17. 电话号码的字母组合 | C++ 回溯算法经典模板
c++·算法·leetcode