2412git,gitdiff与编码

原文

除了git命令行工具外,还有其他工具或服务可让你查看git历史记录中的更改.最有趣的是那些按拉请的一部分更改的情况,因为这些是你正在审查和批准的更改.

一个常见的问题是,它们给你展示的可能不是实际改变的内容.

我把讨论限制在我有经验的服务和工具上,即它是git命令行,AzureDevOps,GitHubVS.欢迎你共享你使用的其他服务的细节,尤其是用来审查代码的服务.

首先,考虑一个更改文件编码的提交.即,假设文件如下:

cpp 复制代码
I just checked.
It costs A31.

其中A3表示0xA3十六进制值的单个字节.这在Windows1252代码页中,是的表示.

假设你按UTF-8更改此文件的编码:

cpp 复制代码
It costs C2A31.

如果在命令行中用git show查看它,你会得到:

cpp 复制代码
  I just checked.
- It costs <A3>1.
+ It costs £1.

命令行版本显示以前有个0xA3字节但现在有一个£符.

接着是GitHub.它的差异

cpp 复制代码
  I just checked.
- It costs  1.
- It costs £1.

GitHub假设所有文件都是UTF-8的,因此它按非法的UTF-8代码单元序列解释A3,并使用U+FFFD替换符表示.
接着TeamFoundationServices,VisualStudioOnline,VisualStudioTeamServices,AzureDevOps.AzureDevOps.就是该名字.AzureDevOps.

下面是AzureDevOps显示的内容:

cpp 复制代码
 The file differs only in whitespace.

如果你展开文件并允许(显示空白更改),它不会显示更改,甚至不会显示空格更改!

cpp 复制代码
I just checked.
It costs £1.

非常令人担忧,因为即,如果你更改了文件的文本,且还更改了编码,AzureDevOps高亮更改文本,但不会告诉你,已更改编码!

如,也许有人更改了第一行文本,并意外地按UTF-81252更改编码.AzureDevOps显示它为

cpp 复制代码
I just checked.
I just looked.
It costs £1.

愉快地给你展示更改文本,但完全忽略了编码更改.
该编码更改可能会导致你无意中更改了资源脚本中的一组串这里,从而导致错编码.

如果要求VS查看差异,它表示已修改(M)文件,但是当你要求查看差异时,它会显示"0更改",且不会高亮内容.

现在考虑在文件开头插入UTF-8BOM的提交.

在使用git的命令行中,可得到如下:

cpp 复制代码
- I just checked.
+  I just checked.

按一个空格显示BOM.不是很好,但至少有一个+/-来告诉你有什么变化,如果第一行不是空白的,则移动的内容告诉你在文件开头插入了些东西.

GitHub,差异如下:

cpp 复制代码
- I just checked.
- I just checked.

高亮告诉你该行有了一些变化,但是你看不到变化.更改必然是不可见的,但至少告诉你了,该行有更改;只是你看不到它.

最后,AzureDevOps:

cpp 复制代码
 The file differs only in whitespace.

如前,即使你展开文件并允许"显示空白更改",你也看不见更改.

cpp 复制代码
I just checked.
It costs £1.

因此,AzureDevOps会告诉你文件有空格更改,但你查看它时,不会显示更改.

如果要求VS查看差异,它会再次指示已修改(M)文件,但是当你要求查看差异时,它会显示"0更改",且不会高亮内容.

我怀疑,在GitHub,AzureDevOpsVS没有显示可见更改时,大多数用户只会认为,"一定是个错误",而没有发现,实际上,那里有你看不到的变化.

因此,按一个表格总结这些结果.

= git命令行 GitHub AzureDevOps VS
代码页 UTF-8格式 UTF-8格式
更改编码 差异显示 差异显示 不显示更改 不显示更改
更改BOM 按空格显示 不可见 同上 同上

结论,如果使用这些系统中的一个工作,在处理包含7位美标集外的符时需要密切注意,因为很难发现编码或BOM的变化,甚至完全不可见.

即使它极大改变了文件内容.

相关推荐
一只大袋鼠10 小时前
Git 进阶(二):分支管理、暂存栈、远程仓库与多人协作
java·开发语言·git
我叫张小白。18 小时前
Git 分支管理与团队协作
git
DogDaoDao19 小时前
Windows 下 Git 报错:`touch` 无法识别 —— 原因分析与 7 种解决方案(从入门到精通)
windows·git·程序员·npm·powershell·cmd·touch
caicai_xiaobai19 小时前
Ubuntu上Git安装步骤
linux·git·ubuntu
come1123420 小时前
git 区分是 Git 分支还是 worktree 路径名
git
憧憬成为java架构高手的小白21 小时前
git多人工作之个人规范使用【ai+个人理解】
git
CVer儿21 小时前
git简单操作
git
Andya_net21 小时前
Git | Git 核心命令深入解析:从原理到实战
大数据·git·elasticsearch
wh_xia_jun1 天前
给小白的 Maven 命令行执行测试 完整指南
git·maven·intellij-idea
专业白嫖怪1 天前
H3C UniServer R4950 G5 服务器压测实战:13根内存条24小时压力测试全流程
git