C语言大小端格式详解
🔥作者简介: 一个平凡而乐于分享的小比特,中南民族大学通信工程专业研究生,研究方向无线联邦学习
🎬擅长领域:驱动开发,嵌入式软件开发,BSP开发
❄️作者主页:一个平凡而乐于分享的小比特的个人主页
✨收录专栏:c语言重要知识点总结,本专栏旨在总结C语言学习过程中的易错点,通过调试代码,分析原理,对重要知识点有更清晰的理解
欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖💖

一、什么是大小端格式
大小端指的是多字节数据在内存中的存储顺序。
1. 小端格式 (Little Endian)
- 低字节 存放在低地址
- 高字节存放在高地址
- 像Intel x86/x64、ARM(默认)使用小端
c
#include <stdio.h>
int main() {
int num = 0x12345678; // 十六进制数
unsigned char *p = (unsigned char *)#
printf("值: 0x%x\n", num);
printf("内存布局(低地址->高地址):\n");
for(int i = 0; i < sizeof(int); i++) {
printf("地址 %p: 0x%x\n", p+i, *(p+i));
}
return 0;
}
在小端机器上输出:
text
值: 0x12345678
内存布局(低地址->高地址):
地址 0x7ffe...: 0x78 // 最低字节
地址 0x7ffe...: 0x56
地址 0x7ffe...: 0x34
地址 0x7ffe...: 0x12 // 最高字节
2. 大端格式 (Big Endian)
- 高字节 存放在低地址
- 低字节存放在高地址
- 像PowerPC、网络字节序使用大端
c
// 假设在大端机器上运行上述代码,输出为:
值: 0x12345678
内存布局(低地址->高地址):
地址 0x7ffe...: 0x12 // 最高字节
地址 0x7ffe...: 0x34
地址 0x7ffe...: 0x56
地址 0x7ffe...: 0x78 // 最低字节
二、如何检测大小端
方法1:使用联合体
c
#include <stdio.h>
union EndianTest {
int i;
char c[sizeof(int)];
};
int isLittleEndian() {
union EndianTest test;
test.i = 1;
return test.c[0] == 1; // 如果最低地址字节是1,则是小端
}
int main() {
if (isLittleEndian()) {
printf("这是小端机器\n");
} else {
printf("这是大端机器\n");
}
return 0;
}
方法2:使用指针
c
int isLittleEndian() {
int num = 1;
return *(char *)&num == 1;
}
三、字节序转换函数
网络编程中经常需要转换:
c
#include <arpa/inet.h> // Linux
// 或 #include <winsock2.h> // Windows
uint32_t htonl(uint32_t hostlong); // 主机->网络(32位)
uint16_t htons(uint16_t hostshort); // 主机->网络(16位)
uint32_t ntohl(uint32_t netlong); // 网络->主机(32位)
uint16_t ntohs(uint16_t netshort); // 网络->主机(16位)
// 示例:
uint32_t host_value = 0x12345678;
uint32_t network_value = htonl(host_value); // 转换为网络字节序
四、什么情况下使用哪种格式
使用小端格式的情况:
- x86/x64架构的CPU(Intel、AMD)
- ARM处理器(默认小端,可切换)
- Windows/Linux桌面系统
- 多数嵌入式系统
- 本地数据存储(当不需要跨平台时)
优点:
- 数学运算方便(从低字节开始处理)
- 类型转换简单
使用大端格式的情况:
- 网络协议(TCP/IP规定使用大端)
- PowerPC架构
- 某些旧版SPARC、MIPS系统
- Java虚拟机内部(大端)
- 图像文件格式(如BMP、JPEG)
- 某些硬件设备的寄存器
优点:
- 人类阅读友好(与书写顺序一致)
- 容易判断数值正负(符号位在最低地址)
五、实际应用示例
示例1:网络数据包解析
c
#include <stdio.h>
#include <stdint.h>
// 模拟从网络接收的数据(大端格式)
void parseNetworkPacket(const uint8_t *packet) {
// 前4字节是大端的IP地址
uint32_t ip = (packet[0] << 24) |
(packet[1] << 16) |
(packet[2] << 8) |
packet[3];
// 使用ntohl转换成本机字节序
ip = ntohl(*(uint32_t*)packet); // 更标准的做法
printf("IP地址: %u.%u.%u.%u\n",
(ip >> 24) & 0xFF,
(ip >> 16) & 0xFF,
(ip >> 8) & 0xFF,
ip & 0xFF);
}
示例2:文件格式处理
c
// 读取BMP文件头(大端格式)
#pragma pack(push, 1)
typedef struct {
uint16_t signature; // "BM",大端
uint32_t fileSize; // 大端
uint16_t reserved1;
uint16_t reserved2;
uint32_t dataOffset; // 大端
} BMPHeader;
#pragma pack(pop)
void readBMP(const char *filename) {
FILE *file = fopen(filename, "rb");
BMPHeader header;
fread(&header, sizeof(header), 1, file);
// 转换字节序
header.signature = ntohs(header.signature);
header.fileSize = ntohl(header.fileSize);
header.dataOffset = ntohl(header.dataOffset);
fclose(file);
}
六、编写跨平台代码的建议
- 使用标准转换函数(htonl/ntohl等)
- 避免直接内存拷贝不同字节序的数据
- 明确数据格式在文档中说明
- 测试时考虑字节序
- 使用固定宽度整数类型(uint8_t, uint32_t等)
c
// 安全的字节序无关的读取
uint32_t readUint32BigEndian(const uint8_t *buffer) {
return (buffer[0] << 24) |
(buffer[1] << 16) |
(buffer[2] << 8) |
buffer[3];
}
uint32_t readUint32LittleEndian(const uint8_t *buffer) {
return buffer[0] |
(buffer[1] << 8) |
(buffer[2] << 16) |
(buffer[3] << 24);
}
总结
- 小端:低字节在低地址,常见于Intel CPU
- 大端:高字节在低地址,用于网络和某些硬件
- 网络通信必须使用大端
- 本地存储通常使用本机字节序
- 跨平台开发要注意字节序转换
理解大小端对网络编程、文件格式解析、硬件交互等至关重要!