2412git,gitdiff与编码

原文

除了git命令行工具外,还有其他工具或服务可让你查看git历史记录中的更改.最有趣的是那些按拉请的一部分更改的情况,因为这些是你正在审查和批准的更改.

一个常见的问题是,它们给你展示的可能不是实际改变的内容.

我把讨论限制在我有经验的服务和工具上,即它是git命令行,AzureDevOps,GitHubVS.欢迎你共享你使用的其他服务的细节,尤其是用来审查代码的服务.

首先,考虑一个更改文件编码的提交.即,假设文件如下:

cpp 复制代码
I just checked.
It costs A31.

其中A3表示0xA3十六进制值的单个字节.这在Windows1252代码页中,是的表示.

假设你按UTF-8更改此文件的编码:

cpp 复制代码
It costs C2A31.

如果在命令行中用git show查看它,你会得到:

cpp 复制代码
  I just checked.
- It costs <A3>1.
+ It costs £1.

命令行版本显示以前有个0xA3字节但现在有一个£符.

接着是GitHub.它的差异

cpp 复制代码
  I just checked.
- It costs  1.
- It costs £1.

GitHub假设所有文件都是UTF-8的,因此它按非法的UTF-8代码单元序列解释A3,并使用U+FFFD替换符表示.
接着TeamFoundationServices,VisualStudioOnline,VisualStudioTeamServices,AzureDevOps.AzureDevOps.就是该名字.AzureDevOps.

下面是AzureDevOps显示的内容:

cpp 复制代码
 The file differs only in whitespace.

如果你展开文件并允许(显示空白更改),它不会显示更改,甚至不会显示空格更改!

cpp 复制代码
I just checked.
It costs £1.

非常令人担忧,因为即,如果你更改了文件的文本,且还更改了编码,AzureDevOps高亮更改文本,但不会告诉你,已更改编码!

如,也许有人更改了第一行文本,并意外地按UTF-81252更改编码.AzureDevOps显示它为

cpp 复制代码
I just checked.
I just looked.
It costs £1.

愉快地给你展示更改文本,但完全忽略了编码更改.
该编码更改可能会导致你无意中更改了资源脚本中的一组串这里,从而导致错编码.

如果要求VS查看差异,它表示已修改(M)文件,但是当你要求查看差异时,它会显示"0更改",且不会高亮内容.

现在考虑在文件开头插入UTF-8BOM的提交.

在使用git的命令行中,可得到如下:

cpp 复制代码
- I just checked.
+  I just checked.

按一个空格显示BOM.不是很好,但至少有一个+/-来告诉你有什么变化,如果第一行不是空白的,则移动的内容告诉你在文件开头插入了些东西.

GitHub,差异如下:

cpp 复制代码
- I just checked.
- I just checked.

高亮告诉你该行有了一些变化,但是你看不到变化.更改必然是不可见的,但至少告诉你了,该行有更改;只是你看不到它.

最后,AzureDevOps:

cpp 复制代码
 The file differs only in whitespace.

如前,即使你展开文件并允许"显示空白更改",你也看不见更改.

cpp 复制代码
I just checked.
It costs £1.

因此,AzureDevOps会告诉你文件有空格更改,但你查看它时,不会显示更改.

如果要求VS查看差异,它会再次指示已修改(M)文件,但是当你要求查看差异时,它会显示"0更改",且不会高亮内容.

我怀疑,在GitHub,AzureDevOpsVS没有显示可见更改时,大多数用户只会认为,"一定是个错误",而没有发现,实际上,那里有你看不到的变化.

因此,按一个表格总结这些结果.

= git命令行 GitHub AzureDevOps VS
代码页 UTF-8格式 UTF-8格式
更改编码 差异显示 差异显示 不显示更改 不显示更改
更改BOM 按空格显示 不可见 同上 同上

结论,如果使用这些系统中的一个工作,在处理包含7位美标集外的符时需要密切注意,因为很难发现编码或BOM的变化,甚至完全不可见.

即使它极大改变了文件内容.

相关推荐
GISer_Jing13 分钟前
Git协作开发:feature分支、拉取最新并合并
大数据·git·elasticsearch
高山莫衣6 小时前
git rebase多次触发冲突
大数据·git·elasticsearch
码农藏经阁6 小时前
工作中常用的Git操作命令(一)
git
kobe_OKOK_6 小时前
【团队开发】git 操作流程
git·elasticsearch·团队开发
码农垦荒笔记6 小时前
Git 安装闭坑指南(仅 Windows 环境)
windows·git
CC码码16 小时前
管理你的多个 Git 密钥(多平台多账号)
git·gitlab·github
CC码码16 小时前
管理你的多个 Git 密钥(单平台多账号)
git·gitlab·github
大卫小东(Sheldon)16 小时前
GIM 1.5发布了! 支持Windows系统了
git·ai·rust
flying jiang16 小时前
将大仓库拆分为多个小仓库
git
李boyang10 天前
Git(四):远程操作
git