浅谈C++ const

引入

分别考虑以下代码:

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    const int a = 1;
    const_cast<int &>(a) = 42;
    std::printf("%d\n", a);
}
cpp 复制代码
#include <bits/stdc++.h>

int main() {
    const int a = std::rand();
    const_cast<int &>(a) = 42;
    std::printf("%d\n", a);
}

请问两次代码分别会输出什么?

运行后不难发现,前者会输出42,后者则输出1。事实上,两者逻辑几乎一致:

  1. 定义一个常量a并初始化
  2. 强制修改a的值
  3. 输出a

那为什么行为上存在差异呢?

汇编分析

我们通过Compiler Explorer查看二者的汇编代码(省略部分代码),如下:

plain 复制代码
main:
        ; ...
        lea     rdi, [rip + .L.str] ; 传递printf第一个参数
        mov     esi, 1 ; 传递printf的第二个参数
        xor     eax, eax  ; 将eax寄存器清零,便于printf调用
        call    printf ; 调用printf
        ; 以上代码相当于printf("%d\n", 1);
        ; ...

.L.str:
        .asciz  "%d\n"
plain 复制代码
main:
        ; ...
        call    rand ; 调用rand函数
        lea     rdi, [rip + .L.str] ; 传递printf第一个参数
        mov     esi, 42 ; 传递printf的第二个参数
        xor     eax, eax ; 将eax寄存器清零,便于printf调用
        call    printf ; 调用printf
        ; 以上代码相当于printf("%d\n, 42);
        ; ...

.L.str:
        .asciz  "%d\n" ; 定义格式化字符串

观察到,编译器忽略了a的内存分配,并直接使用Magic Number作为A的值。

符号表替换

我们先分析代码A。通过查阅资料可知,编译器会进行符号表替换 优化,具体来说,会将所有编译期常量替换为Magic Number,如以下代码:

cpp 复制代码
const int a = 114514;
int b[a];

会被优化为

cpp 复制代码
int b[114514];

这一优化发生在AST阶段,位于预处理之后,汇编之前。那么回到刚才的代码,

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    const int a = 1;
    const_cast<int &>(a) = 42;
    std::printf("%d\n", a);
}

显然,按照刚才的逻辑,程序会被优化成这样:

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    const int a = 1;
    const_cast<int &>(a) = 42;
    std::printf("%d\n", 1);
}

那么,此时显然

cpp 复制代码
const int a = 1;
const_cast<int &>(a) = 42;

已经没有任何意义,那么编译器会根据as-if原则(编译器可以自由地改变程序,只要可观察行为与原始程序一致。,这段代码就会被优化。

最终被优化为:

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    std::printf("%d\n", 1);
}

代码B分析

接下来考虑代码B。我们知道,符号表替换适用于编译期常量,显然对于代码B不适用。接下来,编译器会考虑将变量a分配至**.rodata段(只读数据段)**。然而很不幸,上述方法不适用于局部变量。因此,编译器只能像普通变量一样处理a,只不过在编译器进行检查。

但是,const_cast会拒绝编译器检查,相当于告诉编译器"我保证这段代码是安全的"。于是,编译器检查通过后,源代码

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    const int a = std::rand();
    const_cast<int &>(a) = 42;
    std::printf("%d\n", a);
}

会被处理为像这样:

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    int a = std::rand();
    a = 42;
    std::printf("%d\n", a);
}

此时,编译器会进行数据流分析 最后发现:

唯一一次获取a的值,即printf时,a的值是确定的,为42。因此,编译器会认为a是没有意义的,优化成这样:

cpp 复制代码
#include <bits/stdc++.h>

int main() {
    std::rand();
    std::printf("%d\n", 42);
}

请注意,此处的std::rand是有副作用的,也就是说,执行std::rand会改变程序状态。因此,编译器不会删除std::rand的调用,但是会忽略其返回值。

写在最后

永远不要尝试修改一个常量!这在C++中是未定义行为,也就是说,这种操作的结果是不确定的,编译器可以对未定义行为进行任何处理。上述分析只是当前主流编译器的普遍优化方法。

参考

  1. ISO/IEC 14882:2024
  2. https://godbolt.org/
  3. https://chat.deepseek.com/
相关推荐
沐怡旸18 分钟前
【C++基础知识】深入剖析C和C++在内存分配上的区别
c++
studytosky18 分钟前
C语言数据结构之双向链表
c语言·数据结构·c++·算法·链表·c
沐怡旸22 分钟前
【底层机制】malloc 在实现时为什么要对大小内存采取不同策略?
c++
HABuo1 小时前
【C++进阶篇】学习C++就看这篇--->多态超详解
c语言·开发语言·c++·后端·学习
1白天的黑夜11 小时前
哈希表-1.两数之和-力扣(LeetCode)
c++·leetcode·哈希表
哼?~2 小时前
list模拟实现
开发语言·c++
春花秋月夏海冬雪2 小时前
代码随想录刷题Day47
c++·平衡二叉树的构建·二叉树中序遍历·代码随想录刷题
深耕AI3 小时前
【MFC应用创建后核心文件详解】项目名.cpp、项目名.h、项目名Dlg.cpp 和 项目名Dlg.h 的区别与作用
c++·mfc
风和先行4 小时前
MFC应用防止多开
c++·mfc
hansang_IR4 小时前
【题解 | 两种做法】洛谷 P4208 [JSOI2008] 最小生成树计数 [矩阵树/枚举]
c++·算法·dfs·题解·枚举·最小生成树·矩阵树定理