大小端字节序

目录

摘要:

一:现象及例题

1:现象

2:例题

二:大小端概念

1:概念

2:读取大小端

三:验证大小端的两种方式

1:验证的思路

2:整形验证

3:联合体验证


摘要:

本文旨在彻底理解大小端模式的含义,并且讲解两种验证大小端模式的方法

一:现象及例题

1:现象

cpp 复制代码
#include <stdio.h>

int main()
{
	int a = 0x11223344;

	return 0;
}

调试以一行四列和一行一列查看&a:

解释:

**①:**int a = 0x11223344 换算成32位就是:00010001 00100010 00110011 01000100,所以其中的8个二进制位是一个字节(00010001),两个16进制位是一个字节(11),其中的44(01000100)叫做32位中的低位字节,11(00010001)叫做32位中的高位字节

**②:**而现象是7C,7D,7E,7F呈递增的内存空间,分别存储的44,33,22,11,也就代表着一个四字节的整形,在内存中的存储是低位字节44存储在低地址处7C,高位字节11存储在高地址处7F

2:例题

cpp 复制代码
#include <stdio.h>
// x86 
int main()
{
	int a[4] = { 1, 2, 3, 4 };
	int* ptr = (int*)((int)a + 1);

	printf("%x", *ptr);
	return 0;
}

解释:

**①:**a为数组名,代表数组首元素的地址,被强转为int整形,然后+1,代表此时地址+1,然后再被强转为int*整形指针类型,此时求*ptr,等同于求元素1的第2个字节开始往后的4个字节,如图:

**②:**因为之前调试和该题是在相同环境下的,所以仍然是,一个整形内的地位字节存储在低地址处,高位字节存储在高地址处,所以要求的这四个字节的值如下图:

**③:**所以*ptr的值, *ptr2 = 0x2000000,所以值为2000000,当然4个人字节是8个16进制为,这里的2000000只有7位是因为把最前面的0省略了,如果以%p形式打印,则不会省略:

二:大小端概念

1:概念

其实超过⼀个字节的数据在内存中存储的时候,就有存储顺序的问题,按照不同的存储顺序,我们分为大端字节序存储和小端字节序存储,下⾯是具体的概念:

大端(存储)模式:

是指数据的低位字节内容保存在内存的⾼地址处,而数据的⾼位字节内容,保存在内存的低地址处。
小端(存储)模式:

是指数据的低位字节内容保存在内存的低地址处,而数据的⾼位字节内容,保存在内存的⾼地址处。

所以上述的调试现象和例题,都是低位字节存储在低地址处,高位字节存储在高地址处,博主的环境就是小端模式!反之就是大端存储!

2:读取大小端

在初次学习大小端的时候,会有一个常见的误区,那就是一个整形在大端和小端的模式下,读取的时候,会不会值不同呢?

整形1在大端和小端下的存储:

Q:会不会大端下读取到的1的补码为:00000000 00000000 00000000 00000001;而小端下读取到的补码为:00000001 00000000 00000000 00000000;这样前者为1,后者不为1(16777216)?

A:当然不会!

CPU会抹去大小端下存储机制的差异化,让我们读取到的值都一样!CPU会把内存中的字节重新组合成正确的数值,所以无论大端还是小端,读取到的补码都是:00000001 00000000 00000000 00000000。大端和小端的差异只存在于内存存储层面,CPU 读取后都会转换成统一的二进制格式(高位在左),所以数值永远一样。

而上文中的例题中的图为:

Q:此时可能会误以为为什么读取到的不是0x00000002?

A:此时按地址从低到高排列:00 00 00 02,CPU会将其恢复为高位在左,低位在右,也就是02000000,这才是这四个字节所存储的值,所以打印为2000000,

三:验证大小端的两种方式

1:验证的思路

面试中,验证大小端是一个常见的问题,我将介绍两种方式验证大小端

首先,需要知道一个char*指针去取地址的时候,在大小端取到的地址虽然相同,但是该字节的内容不相同!这是因为:

比如:

Q:CPU不是会重新组合比特位的顺序吗 为什么char*在大小端取到的还不一样?

A:在大端和小端中,一个字节的内容存储在一个地址处,这是恒定的!所谓的组合顺序,也不会改变每个地址中的存储的内容!此外,须知CPU 只在读取才做组合成正确数值这一操作

所以,验证大小端的思路就是我们利用整形1,整形1只有低位的那一个字节为1,其余中间都是0,所以如果我们单独利用char*取出整形存储在低地址处的那一个字节,如果*解引用验证为1,代表为小端,反之为0则大端

2:整形验证

cpp 复制代码
#include <stdio.h>
int check_sys()
{
	int i = 1;
	return (*(char*)&i);
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

**解释:**对整形i进行取地址,此时取到的就是整形i的起始地址,也就是存储在低地址处的那个字节的地址,然后进行强转char*,在*解引用,得到了该字节的值,为1则小端,反之大端

3:联合体验证

cpp 复制代码
#include <stdio.h>

int check_sys()
{
	union
	{
		int i;
		char c;
	}un;
	un.i = 1;
	return un.c;
}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

解释:

①: 联合体的成员变量占据同一块内存,所以读取 char 就是读取 int 的第一个字节。小端下整形该字节是 1,大端下整形该字节是 0,由此判断字节序。

**②:**所以需要把成员变量i置为1,再用c的值去判断

📌 [ 作者 ] shylyly
📃 [ 首次发布 ] 2026.5.16
❌ [ 最新修改 ] 无
📜 [ 声明 ] 由于笔者水平有限,文中难免有疏漏或不妥之处,还望读者不吝赐教。

相关推荐
mmz12071 小时前
深度优先搜索DFS3(c++)
c++·算法·深度优先
水蓝烟雨1 小时前
3373. 连接两棵树后最大目标节点数目 II
算法·leetcode
故事和你911 小时前
洛谷-【图论2-1】树6
开发语言·数据结构·c++·算法·深度优先·动态规划·图论
sali-tec1 小时前
C# 基于OpenCv的视觉工作流-章73-点-线距离
图像处理·人工智能·opencv·算法·计算机视觉
不知名的老吴1 小时前
在C++中不用宏怎么打日志的使用建议
开发语言·c++·算法
YL200404261 小时前
044二叉搜索树中第K小的元素
数据结构·leetcode
图码1 小时前
生命游戏的优雅解法:从O(mn)空间到O(1)空间的进阶之旅
数据结构·算法·游戏·矩阵·空间计算
2301_800895102 小时前
蓝桥杯第十二届b组国赛真题--备战国赛版h
算法·蓝桥杯
手写码匠2 小时前
手写 AI Prompt Injection 防护系统:从零实现 LLM 安全边界
人工智能·深度学习·算法·aigc