彻底理解 C 语言的数组在内存中到底是怎么存放的!

在C语言中,数组是经常被用到的重要数据类型,但在实际使用时,往往有很多工程师会出现各种各样的问题,如内存越界、错误的访问、初始化不当等。这其中有很大一个原因是没有彻底理解数组的存储机制,出现了一些非法地址或者非预期元素的访问和引用。因此,今天就来详细讲一下在C语言中,数组到底是怎么存储的。

首先我们来看一个一维数组:

cpp 复制代码
int array[10] = {0};

这是最简单的数组,其内存结构也是最容易理解的,编译器会在内存中划出一段连续的空间用于存储这个数组的元素,并且对于 int 类型来说,每个元素占用的大小为 4 字节。因此,其内存排列如下:

我们可以用下面一段代码验证一下:

cpp 复制代码
#include <stdio.h>

int main() {
    int array[10] = {0};

    for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++) {
        printf("array[%d] - %p - %ld\r\n", i, &array[i], (&array[i] - array) * 4);
    }

    return 0;
}

上面这段代码会将数组每个元素的元素名,实际地址和相对地址偏移打印出来,我们将其运行,并得到如下结果:

cpp 复制代码
jay@jaylinuxlenovo:~/test$ ./test2 
array[0] - 0x7ffc729ca960 - 0
array[1] - 0x7ffc729ca964 - 4
array[2] - 0x7ffc729ca968 - 8
array[3] - 0x7ffc729ca96c - 12
array[4] - 0x7ffc729ca970 - 16
array[5] - 0x7ffc729ca974 - 20
array[6] - 0x7ffc729ca978 - 24
array[7] - 0x7ffc729ca97c - 28
array[8] - 0x7ffc729ca980 - 32
array[9] - 0x7ffc729ca984 - 36

可以看到输出结果与我们分析的一致,array 数组在内存中处于连续排列,其中下标0为低地址,随着下标的增大,内存地址增大,每次增大的步长为一个元素所占的大小,在这里就是整形大小4个字节。

当然,上面只是一种最简单的情况,相信无须讲解大家都能理解。那么接下来上正题:

多维数组在内存中的排布是什么样的呢?

实践是检验真理的唯一标准,我们直接来写一段代码测试一下:

cpp 复制代码
#include <stdio.h>

int main() {
    int array[4][3] = {0};

    for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++) {
        for (int j = 0; j < sizeof(array[0]) / sizeof(array[0][0]); j++) {
            printf("array[%d][%d] - %p - %ld\r\n", i, j, &array[i][j], (&array[i][j] - &array[0][0]) * 4);
        }
    }
    return 0;
}

以上程序定义了一个四行三列的二维数组:

测试代码中我们以行为主序,依次打印出每一行中每一列的元素信息,到行结尾后再次从下一行开始,直到结束。可以看到运行结果如下:

cpp 复制代码
jay@jaylinuxlenovo:~/test$ ./test2 
array[0][0] - 0x7fff25495070 - 0
array[0][1] - 0x7fff25495074 - 4
array[0][2] - 0x7fff25495078 - 8
array[1][0] - 0x7fff2549507c - 12
array[1][1] - 0x7fff25495080 - 16
array[1][2] - 0x7fff25495084 - 20
array[2][0] - 0x7fff25495088 - 24
array[2][1] - 0x7fff2549508c - 28
array[2][2] - 0x7fff25495090 - 32
array[3][0] - 0x7fff25495094 - 36
array[3][1] - 0x7fff25495098 - 40
array[3][2] - 0x7fff2549509c - 44

很巧,我们选用的打印顺序竟然就是数组内存中排列的顺序!可以看到这里的内存递增方式和一开始的一维数组一样,是按照一个整形元素的大小递增的。当然为了严谨起见,我们调换一下程序中的打印顺序,按列为主序打印:

cpp 复制代码
#include <stdio.h>

int main() {
    int array[4][3] = {0};

    for (int j = 0; j < sizeof(array) / sizeof(array[0]); j++) {
        for (int i = 0; i < sizeof(array[0]) / sizeof(array[0][0]); i++) {
            printf("array[%d][%d] - %p - %ld\r\n", i, j, &array[i][j], (&array[i][j] - &array[0][0]) * 4);
        }
    }
    return 0;
}

可以看到与上例的程序相比,i 和 j 的位置对调了。此时我们看一下运行结果:

cpp 复制代码
jay@jaylinuxlenovo:~/test$ ./test2 
array[0][0] - 0x7ffccc482230 - 0
array[1][0] - 0x7ffccc48223c - 12
array[2][0] - 0x7ffccc482248 - 24
array[0][1] - 0x7ffccc482234 - 4
array[1][1] - 0x7ffccc482240 - 16
array[2][1] - 0x7ffccc48224c - 28
array[0][2] - 0x7ffccc482238 - 8
array[1][2] - 0x7ffccc482244 - 20
array[2][2] - 0x7ffccc482250 - 32
array[0][3] - 0x7ffccc48223c - 12
array[1][3] - 0x7ffccc482248 - 24
array[2][3] - 0x7ffccc482254 - 36

不出所料,此时内存的偏移值不再是顺序增加。并且仔细计算可以发现,同一列的元素如 array[0][0] 和 array[1][0] 之间差了3个整形元素所占的大小 - 12字节,而这正好是一行元素的整体大小。

显然,我们可以得到一个结论:在二维数组中,数组元素是按照行的主序来存储的,也就是内存按行分配,一行分配完再分配下一行,并且是连续的。分配的过程我们可以用下图来形象的表示:

分配完成后即可得到最终的内存排列:

实际上,这种存储方式有一种专业的名词:行优先存储(Row-major order)**** 。如果仔细观察上面的元素地址偏移,可以发现这种存储方式最显著的特点就是先把位于右侧的下标排满

这个特点可以让我们拓展到更高维的数组存储方式。

如果我们定义一个三维数组 array[x][y][z],那么其在内存中的排列方式就是先将z维排满,再将y维排满,最后将x维排满。为了加深理解,我们再结合实际的代码:

cpp 复制代码
#include <stdio.h>

int main() {
    int array[2][3][4] = {0};

    for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++) {
        for (int j = 0; j < sizeof(array[0]) / sizeof(array[0][0]); j++) {
            for (int k = 0; k < sizeof(array[0][0]) / sizeof(array[0][0][0]); k++) {
                printf("array[%d][%d][%d] - %p - %ld\r\n", i, j, k, &array[i][j][k],
                       (&array[i][j][k] - &array[0][0][0]) * 4);
            }
        }
    }

    return 0;
}

代码中拓展到了一个三维数组,其内存结构如下:

cpp 复制代码
jay@jaylinuxlenovo:~/test$ ./test2 
array[0][0][0] - 0x7fffef296740 - 0
array[0][0][1] - 0x7fffef296744 - 4
array[0][0][2] - 0x7fffef296748 - 8
array[0][0][3] - 0x7fffef29674c - 12
array[0][1][0] - 0x7fffef296750 - 16
array[0][1][1] - 0x7fffef296754 - 20
array[0][1][2] - 0x7fffef296758 - 24
array[0][1][3] - 0x7fffef29675c - 28
array[0][2][0] - 0x7fffef296760 - 32
array[0][2][1] - 0x7fffef296764 - 36
array[0][2][2] - 0x7fffef296768 - 40
array[0][2][3] - 0x7fffef29676c - 44
array[1][0][0] - 0x7fffef296770 - 48
array[1][0][1] - 0x7fffef296774 - 52
array[1][0][2] - 0x7fffef296778 - 56
array[1][0][3] - 0x7fffef29677c - 60
array[1][1][0] - 0x7fffef296780 - 64
array[1][1][1] - 0x7fffef296784 - 68
array[1][1][2] - 0x7fffef296788 - 72
array[1][1][3] - 0x7fffef29678c - 76
array[1][2][0] - 0x7fffef296790 - 80
array[1][2][1] - 0x7fffef296794 - 84
array[1][2][2] - 0x7fffef296798 - 88
array[1][2][3] - 0x7fffef29679c - 92

掌握了上述方法后,即使是四维,五维甚至更高维的数组,也能立刻搞明白其内存排列的方式。相信在后续处理数组的场合中,大家能够根据数组内存的排列方式写出更高效、稳健的代码。

相关推荐
wangjing_052236 分钟前
C语言练习.if.else语句.strstr
c语言·开发语言
Tony_long748339 分钟前
Python学习——字符串操作方法
开发语言·c#
SoraLuna1 小时前
「Mac玩转仓颉内测版26」基础篇6 - 字符类型详解
开发语言·算法·macos·cangjie
出逃日志2 小时前
JS的DOM操作和事件监听综合练习 (具备三种功能的轮播图案例)
开发语言·前端·javascript
前端青山2 小时前
React事件处理机制详解
开发语言·前端·javascript·react.js
black0moonlight3 小时前
ISAAC Gym 7. 使用箭头进行数据可视化
开发语言·python
时光の尘4 小时前
C语言菜鸟入门·关键字·int的用法
c语言·开发语言·数据结构·c++·单片机·链表·c
sjsjs114 小时前
【数据结构-表达式解析】【hard】力扣224. 基本计算器
数据结构·算法·leetcode
手握风云-4 小时前
数据结构(Java版)第一期:时间复杂度和空间复杂度
java·数据结构
坊钰4 小时前
【Java 数据结构】时间和空间复杂度
java·开发语言·数据结构·学习·算法