【Linux 命令】文件比较 diff

diff 命令是 Unix 和类 Unix 系统(如 Linux 和 macOS)中用于比较文件内容差异的一个非常有用的命令行工具。它可以逐行比较两个文件的内容,并输出它们之间的差异。这些差异通常以行为单位显示,并且会标记出哪些行是唯一的、添加的或删除的。

基本用法

bash 复制代码
diff [选项] 文件1 文件2
  • 文件1文件2 是你想要比较的两个文件。
  • 选项 可以是多个,用于控制 diff 命令的输出格式或行为。

常用选项

  • -c:显示差异的同时,还会显示差异周围的几行内容,使得差异更容易理解。
  • -u:生成统一格式(Unified format)的输出,这种格式经常被版本控制系统(如 Git)使用来显示文件之间的差异。
  • -i:忽略大小写差异。
  • -b:忽略行尾尾随的空格差异。
  • -B:忽略空行的差异。
  • -w:忽略所有的空格差异(包括空格、制表符等)。
  • --side-by-side:以并排的方式显示两个文件的差异,便于直观比较。

示例

假设有两个文件 file1.txtfile2.txt,我们想比较它们之间的差异。

  1. 基本比较

    bash 复制代码
    diff file1.txt file2.txt

    这将直接显示两个文件之间的差异。

  2. 使用 -c 选项

    bash 复制代码
    diff -c file1.txt file2.txt

    这会以更易读的格式显示差异,包括差异所在的行号,以及差异前后几行的内容。

  3. 使用 -u 选项

    bash 复制代码
    diff -u file1.txt file2.txt

    生成统一格式的输出,这种格式非常适合在版本控制系统中使用。

  4. 并排显示差异

    bash 复制代码
    diff --side-by-side file1.txt file2.txt

    这会以并排的方式显示两个文件的差异,对于快速查看两个文件之间的细微差别非常有用。

输出格式

当使用diff命令比较两个文件并发现它们不一致时,输出的信息格式取决于所使用的选项,但通常会包含差异的位置(如行号)、差异的类型(如添加、删除或修改)以及差异的具体内容。以下是一个清晰的格式说明,并附带举例说明。

输出的基本格式

不使用任何特定选项时,diff命令的输出可能类似于以下格式(但请注意,实际输出可能会因diff的版本和操作系统的不同而略有差异):

  • 行号差异 :使用xcy格式,其中xy分别是两个文件中发生变化的行号范围。如果只有一个文件中的行发生变化(如添加或删除),则可能使用xaddya格式,其中a表示添加(addition),d表示删除(deletion),xy是行号。
  • 差异内容 :差异内容前会有<>标记,<表示该行在第一个文件中,>表示该行在第二个文件中。

举例说明

假设有两个文件file1.txtfile2.txt,内容分别如下:

file1.txt:

bash 复制代码
This is line 1. 
This is line 2. 
This is line 3. 
This is line 4. 
This is line 5 in file1. 
This line is only in file1.

file2.txt:

bash 复制代码
This is line 1. 
This is line 2. 
This is line 3. 
This is line 4. 
This is line 5 in file2. 
This line is only in file2.

使用diff file1.txt file2.txt命令后,可能会得到如下输出(注意:实际输出可能因diff版本而异):

bash 复制代码
5c5 
< This is line 5 in file1. 
--- 
> This is line 5 in file2. 
7d6 
< This line is only in file1. 
9a9 
> This line is only in file2.
  • 5c5 :表示两个文件的第5行内容不同。< This is line 5 in file1.表示这一行在file1.txt中,> This is line 5 in file2.表示这一行在file2.txt中。
  • 7d6 :表示file1.txt的第7行在file2.txt中不存在(即file1.txt的第7行被删除了),对应的内容是This line is only in file1.
  • 9a9 :表示file2.txt的第9行在file1.txt中不存在(即file2.txt的第9行是新添加的),对应的内容是This line is only in file2.

使用-c选项的输出格式

如果使用-c选项(上下文模式),输出将包含更多上下文信息,以便于理解差异。输出将包括文件名、时间戳(如果可用)、差异前后的几行内容以及差异本身。但请注意,由于篇幅限制,这里不展开完整的上下文模式输出示例。

使用-u选项的输出格式

-u选项(统一格式)的输出与-c选项类似,但更适合于版本控制系统(如Git)的补丁文件。它也会包含文件名、时间戳(如果可用)以及差异前后的几行内容,但格式略有不同,特别是文件头部分。

相关推荐
A小辣椒3 小时前
TShark:基础知识
linux
AlfredZhao6 小时前
OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G?
linux·oci
AlfredZhao20 小时前
vi 删除指定范围的行,不用再反复按 dd
linux·vi
用户9718356334661 天前
银河麒麟 KY10 申威(SW64) 安装 nginx-1.16.1-2.p01.ky10.sw_64.rpm 详细步骤
linux
猪脚踏浪1 天前
linux 拷贝文件或目录到指定的位置
linux
大树882 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠2 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
霸道流氓气质2 天前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务
bush42 天前
嵌入式linux学习记录十四、术语
linux·嵌入式
载数而行5202 天前
Linux 11 动态监控指令top
linux