C++核心技术深度剖析：从底层原理到工程实践

本文不是入门教程。我们假设你已经了解C++的基本语法，关注的是：为什么这样设计、底层怎么实现、生产环境怎么踩坑、面试官会怎么追问。

一、对象模型与内存布局

1.1 虚函数表（vtable）与虚表指针（vptr）------面试必考

很多开发者知道"虚函数通过vtable实现"，但面试官追问的细节往往暴露知识盲区。

底层机制：

编译器为每个含有虚函数的类生成一个虚函数表（vtable），存储在该类的只读数据段（.rodata）。每个对象实例在内存开头（通常是开头，但标准不要求）插入一个隐藏的虚表指针（vptr），指向所属类的vtable。

复制代码

内存布局示例（64位，指针8字节）：

class Base {
    virtual void foo();
    virtual void bar();
    int x;
};

Base对象实例:
┌──────────┐
│  vptr    │ ──→ Base::vtable: [ &Base::foo, &Base::bar ]
├──────────┤
│  x       │
└──────────┘

class Derived : public Base {
    void foo() override;     // 替换vtable[0]
    virtual void baz();      // 追加到vtable末尾
    int y;
};

Derived对象实例:
┌──────────┐
│  vptr    │ ──→ Derived::vtable: [ &Derived::foo, &Base::bar, &Derived::baz ]
├──────────┤
│  x       │
├──────────┤
│  y       │
└──────────┘

面试高频追问：

cpp 复制代码

// Q1: 构造函数可以是虚函数吗？
// 不可以。对象构造期间vptr尚未初始化完成，虚函数机制尚未建立。
// 构造函数执行时，vptr指向当前正在构造的类（而非最终派生类），
// 所以在基类构造函数中调用虚函数，调用的是基类版本------多态被截断。

class Base {
public:
    Base() { init(); }          // ⚠️ 不会调用Derived::init()
    virtual void init() { std::cout << "Base::init\n"; }
};

class Derived : public Base {
public:
    void init() override { std::cout << "Derived::init\n"; }
};

Derived d;  // 输出 "Base::init" 而非 "Derived::init"

cpp 复制代码

// Q2: 析构函数为什么必须是虚函数？底层发生了什么？
// delete基类指针时，通过vptr查找vtable，找到正确的析构函数。
// 如果析构函数非虚，则静态绑定，只调用Base::~Base()，Derived部分永远不被析构。

// Q3: 虚函数调用的开销？
// 一次虚函数调用 = 一次指针间接寻址（读vptr）+ 一次数组偏移寻址（读vtable[slot]）
// 现代CPU的分支预测器对虚函数调用预测准确率很高，实际开销通常 < 5ns
// 但虚函数阻止了内联，在热路径中代价可能显著

生产踩坑：虚函数与ABI兼容性

cpp 复制代码

// 场景：动态库（.so/.dll）导出的类增加了新的虚函数
// 旧版本 vtable: [foo, bar]          --- slot 0, 1
// 新版本 vtable: [foo, bar, baz]      --- slot 0, 1, 2
// 如果新虚函数插在中间：[foo, baz, bar] --- 所有下游模块的vtable偏移全错！
// 这就是ABI兼容性问题。解决方案：在vtable末尾追加，或者使用Pimpl模式隔离

1.2 对象切片（Object Slicing）------隐蔽的Bug来源

cpp 复制代码

class Base {
public:
    virtual void who() { std::cout << "Base\n"; }
    int base_data = 0;
};

class Derived : public Base {
public:
    void who() override { std::cout << "Derived\n"; }
    int derived_data = 1;
};

void badCode() {
    Derived d;
    Base b = d;  // ⚠️ 对象切片！只拷贝Base部分，Derived部分被截断
    b.who();     // 输出 "Base"------多态性丢失
    
    // b的sizeof == sizeof(Base)，derived_data被截断
    // vptr被覆盖为Base的vtable指针
}

// 正确做法：使用指针或引用
void goodCode() {
    Derived d;
    Base& ref = d;
    ref.who();  // 输出 "Derived"------多态性保留
    
    Base* ptr = &d;
    ptr->who(); // 输出 "Derived"
}

// 更隐蔽的切片场景：容器
std::vector<Base> vec;      // ⚠️ 存值类型，必然切片
vec.push_back(Derived());   // Derived被切片为Base存储
vec[0].who();               // 永远是 "Base"

// 正确做法
std::vector<std::unique_ptr<Base>> vec2;
vec2.push_back(std::make_unique<Derived>());
vec2[0]->who();             // "Derived"

1.3 多重继承与菱形继承

cpp 复制代码

// 菱形继承问题
class Animal { public: int age; };
class Mammal : public Animal {};
class Bird : public Animal {};
class Bat : public Mammal, public Bird {};

Bat bat;
bat.age = 5;     // ⚠️ 歧义！Mammal::age 还是 Bird::age？
bat.Mammal::age = 5;  // 必须显式指定

// 底层：Bat对象中有两个Animal子对象
// Bat内存布局: [Mammal部分(含Animal)] [Bird部分(含Animal)]
// sizeof(Bat) 包含两份age

// 解决方案：虚继承
class Animal { public: int age; };
class Mammal : virtual public Animal {};
class Bird : virtual public Animal {};
class Bat : public Mammal, public Bird {};

// 底层：Bat对象中只有一个Animal子对象
// 通过虚基类表（vbtable）间接访问共享的Animal子对象
// bat.age = 5;  // 不再歧义

虚继承的底层代价：

复制代码

非虚继承的Bat内存布局（两个Animal子对象）:
┌─────────────────────┐
│ Mammal::vptr        │
│ Animal::age         │ ← 第一份
├─────────────────────┤
│ Bird::vptr          │
│ Animal::age         │ ← 第二份（冗余！）
└─────────────────────┘

虚继承的Bat内存布局（一个共享Animal子对象）:
┌─────────────────────┐
│ Mammal::vptr        │
│ Mammal::vbptr ──────┼─→ 偏移量指向共享Animal
├─────────────────────┤
│ Bird::vptr          │
│ Bird::vbptr ────────┼─→ 偏移量指向共享Animal
├─────────────────────┤
│ Animal::age         │ ← 只有一份
└─────────────────────┘

代价：访问共享基类成员需要通过vbptr间接寻址，多一次指针解引用

1.4 内存对齐与填充（Padding）

cpp 复制代码

struct Bad {
    char a;     // 1 byte + 7 bytes padding
    double b;   // 8 bytes (对齐到8)
    char c;     // 1 byte + 7 bytes padding
};
// sizeof(Bad) = 24

struct Good {
    double b;   // 8 bytes
    char a;     // 1 byte
    char c;     // 1 byte + 6 bytes padding
};
// sizeof(Good) = 16

// 规则：
// 1. 成员偏移量必须是该成员对齐要求的整数倍
// 2. 结构体总大小必须是最大对齐要求的整数倍
// 3. 对齐要求 = min(成员的自然对齐要求, 编译器指定的最大对齐)

生产场景：网络协议和文件格式

cpp 复制代码

// 网络协议头部必须取消填充
#pragma pack(push, 1)  // 1字节对齐，取消填充
struct TcpHeader {
    uint16_t srcPort;
    uint16_t dstPort;
    uint32_t seqNum;
    // ...
};
#pragma pack(pop)
// 否则不同编译器/平台可能产生不同的padding，导致协议不兼容

// alignas指定对齐（SIMD优化场景）
struct alignas(16) SimdData {
    float x, y, z, w;  // 16字节对齐，便于SSE指令加载
};

二、内存管理的深水区

2.1 RAII------C++资源管理的灵魂

RAII不是语法特性，而是一种编程范式：资源获取即初始化，资源释放即析构。

cpp 复制代码

// 不仅仅是内存，任何需要成对获取/释放的资源都适用RAII
class FileGuard {
    FILE* file_;
public:
    explicit FileGuard(const char* path, const char* mode)
        : file_(fopen(path, mode)) {
        if (!file_) throw std::runtime_error("Failed to open file");
    }
    ~FileGuard() { if (file_) fclose(file_); }
    
    // 禁止拷贝（文件句柄不可共享）
    FileGuard(const FileGuard&) = delete;
    FileGuard& operator=(const FileGuard&) = delete;
    
    // 允许移动
    FileGuard(FileGuard&& other) noexcept : file_(other.file_) {
        other.file_ = nullptr;
    }
    
    FILE* get() const { return file_; }
};

// 更通用的RAII包装器
template<typename T, typename Deleter>
class ScopedResource {
    T resource_;
    Deleter deleter_;
    bool owns_ = true;
public:
    ScopedResource(T res, Deleter del) : resource_(res), deleter_(del) {}
    ~ScopedResource() { if (owns_) deleter_(resource_); }
    
    ScopedResource(ScopedResource&& other) noexcept 
        : resource_(other.resource_), deleter_(other.deleter_), owns_(other.owns_) {
        other.owns_ = false;
    }
    
    T get() const { return resource_; }
};

// 使用
auto socketGuard = ScopedResource(socket(AF_INET, SOCK_STREAM, 0), ::close);
auto mmapGuard = ScopedResource(
    mmap(nullptr, size, PROT_READ, MAP_SHARED, fd, 0),
    [size](void* p) { munmap(p, size); }
);

2.2 智能指针的隐藏陷阱

陷阱一：shared_ptr的"栈外"构造与控制块分离

cpp 复制代码

// ⚠️ 严重错误：同一个裸指针构造两个shared_ptr
auto* raw = new int(42);
std::shared_ptr<int> sp1(raw);
std::shared_ptr<int> sp2(raw);  // 独立的控制块！
// sp1和sp2各有自己的引用计数，都认为自己独占资源
// 当sp1销毁时delete raw，sp2变成悬空指针------双重释放！

// ✅ 正确：始终通过make_shared或拷贝构造
auto sp3 = std::make_shared<int>(42);
auto sp4 = sp3;  // 共享控制块

// ✅ 从this构造shared_ptr：enable_shared_from_this
class Node : public std::enable_shared_from_this<Node> {
public:
    std::shared_ptr<Node> getSelf() {
        return shared_from_this();  // 安全获取自身的shared_ptr
    }
};

auto node = std::make_shared<Node>();
auto selfPtr = node->getSelf();  // 与node共享控制块

陷阱二：shared_ptr的线程安全误区

cpp 复制代码

// shared_ptr的线程安全模型经常被误解：
// 1. 引用计数的增减是原子的（线程安全）
// 2. shared_ptr对象本身的读写不是线程安全的
// 3. 指向对象的访问不是线程安全的

std::shared_ptr<int> globalPtr;

// 线程A
globalPtr = std::make_shared<int>(1);  // 写shared_ptr本身

// 线程B
auto local = globalPtr;  // ⚠️ 读shared_ptr本身------数据竞争！
// 即使引用计数原子操作，shared_ptr内部的指针赋值不是原子的

// ✅ 正确：用mutex保护shared_ptr本身的读写
std::mutex ptrMutex;
{
    std::lock_guard<std::mutex> lock(ptrMutex);
    globalPtr = std::make_shared<int>(1);
}
{
    std::lock_guard<std::mutex> lock(ptrMutex);
    auto local = globalPtr;
}

// 或者使用atomic_store/atomic_load（C++20）
// C++20之前：
auto local = std::atomic_load(&globalPtr);  // 已弃用但可用

陷阱三：make_shared与自定义删除器的矛盾

cpp 复制代码

// make_shared无法指定自定义删除器
auto sp1 = std::shared_ptr<FILE>(fopen("test.txt", "r"), fclose);  // OK

// 但make_shared有性能优势：一次分配同时分配对象和控制块
auto sp2 = std::make_shared<int>(42);  // 一次malloc
auto sp3 = std::shared_ptr<int>(new int(42));  // 两次malloc

// make_shared的另一个问题：大对象的延迟释放
struct BigObject {
    char data[4096];
    std::shared_ptr<BigObject> self_ref;  // 可能造成循环引用
};

// 即使self_ref被重置，由于控制块和对象在同一块内存，
// 控制块仍需等待weak_ptr释放，BigObject的内存也迟迟无法归还
// 这种场景下应使用shared_ptr<T>(new T(...))分离分配

陷阱四：unique_ptr的数组偏特化

cpp 复制代码

// unique_ptr对数组有偏特化
std::unique_ptr<int[]> arr(new int[10]);
arr[0] = 42;  // 使用operator[]

// ⚠️ 错误用法
std::unique_ptr<int> arr2(new int[10]);  // 编译通过但delete而非delete[]
// 未定义行为！必须用unique_ptr<int[]>

// ✅ 最佳实践：优先用vector，不用unique_ptr<T[]>
auto vec = std::vector<int>(10);

2.3 new/delete的底层机制

复制代码

new表达式的工作流程：
1. 调用operator new分配内存（底层通常调malloc）
2. 调用构造函数
3. 如果构造函数抛异常，调用operator delete释放内存

delete表达式的工作流程：
1. 调用析构函数
2. 调用operator delete释放内存（底层通常调free）

cpp 复制代码

// 重载operator new/delete实现内存池
class FastAlloc {
public:
    void* operator new(size_t size) {
        // 从内存池分配，避免频繁调用malloc
        return MemoryPool::allocate(size);
    }
    
    void operator delete(void* ptr, size_t size) {
        MemoryPool::deallocate(ptr, size);
    }
    
    // 数组版本
    void* operator new[](size_t size) {
        return MemoryPool::allocate(size);
    }
    
    void operator delete[](void* ptr, size_t size) {
        MemoryPool::deallocate(ptr, size);
    }
};

// placement new：在已分配的内存上构造对象
void* buffer = operator new(sizeof(MyClass));
MyClass* obj = new(buffer) MyClass(42);    // 在buffer上构造
obj->~MyClass();                            // 手动析构
operator delete(buffer);                    // 释放内存

2.4 未定义行为（UB）------C++最危险的陷阱

cpp 复制代码

// 1. 悬空指针解引用
int* p = new int(42);
delete p;
int val = *p;   // UB！可能看似正常工作，也可能崩溃

// 2. 使用未初始化的变量
int x;
if (x > 0) { /* ... */ }  // UB！x的值不确定
// 调试模式和Release模式行为可能完全不同

// 3. 有符号整数溢出
int a = INT_MAX;
int b = a + 1;  // UB！编译器可能假设不会溢出进行优化
// 编译器可能将 if (a + 1 > a) 优化为 if (true)

// 4. 严格别名规则（Strict Aliasing）
float f = 1.0f;
int* ip = reinterpret_cast<int*>(&f);
int bits = *ip;  // UB！不能通过int指针访问float对象
// 正确做法：使用memcpy
int bits2;
std::memcpy(&bits2, &f, sizeof(f));  // OK

// 5. 越界访问
int arr[5];
arr[5] = 10;  // UB！越界写入

// 6. 析构后使用（use-after-free）
std::vector<int> v = {1, 2, 3};
int* ptr = &v[0];
v.push_back(4);  // 可能触发重新分配
*ptr = 10;       // UB！ptr可能指向已释放的内存

// 7. 竞争条件
int counter = 0;
// 线程A
counter++;  // 非原子操作：读-改-写三步
// 线程B
counter++;  // 数据竞争 → UB

UB的可怕之处：编译器有权假设UB不会发生，并据此进行优化。

cpp 复制代码

// 实际案例：编译器可能将下面的代码优化为无限循环
bool flag = false;

void thread1() {
    flag = true;  // 可能在另一个线程
}

void thread2() {
    while (!flag) {
        // 编译器可能认为flag永远不会变（因为数据竞争是UB，编译器假设UB不发生）
        // 从而将循环优化为 while(true)
    }
}

三、移动语义的深水区

3.1 万能引用（Universal Reference）与右值引用的区别

cpp 复制代码

// 右值引用：T是具体类型
void foo(int&& x);        // x是右值引用

// 万能引用：T是推导的模板参数
template<typename T>
void bar(T&& x);          // x是万能引用

// 关键区别：万能引用的折叠规则
// 传入左值 int a; bar(a)   → T=int&,   参数类型=int& && → int&
// 传入右值 bar(42)         → T=int,    参数类型=int&&

// ⚠️ 不是所有T&&都是万能引用
template<typename T>
class Widget {
    void process(T&& x);  // ⚠️ 这是右值引用，不是万能引用！
    // 因为T在类实例化时已确定，不是每次调用时推导
};

// auto&& 是万能引用
auto&& universal = someExpression();  // 可以绑定任何值类别

3.2 完美转发的失败场景

cpp 复制代码

// 完美转发的基本模式
template<typename T>
void wrapper(T&& arg) {
    target(std::forward<T>(arg));  // 保持arg的值类别
}

// 场景1：花括号初始化列表
wrapper({1, 2, 3});  // ⚠️ 编译错误！花括号列表不能推导为T

// 解决：
wrapper(std::initializer_list<int>{1, 2, 3});  // 显式指定类型

// 场景2：0和NULL作为空指针
void target(int*);
wrapper(0);     // T推导为int，转发为int&&，不匹配int*
wrapper(NULL);  // 可能推导为int或long，同样不匹配

// 解决：
wrapper(nullptr);  // T推导为std::nullptr_t

// 场景3：static const整型成员
class MyClass {
    static const int value = 42;  // 声明但未定义
};
wrapper(MyClass::value);  // ⚠️ 链接错误！需要odr-use
// 解决：在类外定义 const int MyClass::value; 或使用constexpr

3.3 移动语义的常见误区

cpp 复制代码

// 误区1：移动操作总是比拷贝快
// 对于POD类型（int, float, 小结构体），移动和拷贝代价相同
struct Point { int x, y; };  // 移动 ≈ 拷贝（都是8字节复制）

// 误区2：std::move真的移动了
std::string s1 = "Hello";
std::string s2 = std::move(s1);  // 确实移动了

// 但：
void process(std::string str);  // 按值传参
std::string s3 = "World";
process(std::move(s3));
// s3被移动到str参数中，但str在函数内仍可用
// 移动后s3处于"有效但未指定"的状态

// ⚠️ 移动后的对象只能：赋值、析构、调用不依赖当前值的方法
// 不能假设移动后对象为空！
std::vector<int> v1 = {1, 2, 3};
std::vector<int> v2 = std::move(v1);
// v1.empty() 可能为true，但不是保证！
// 标准只保证v1处于"有效但未指定"状态

// 误区3：函数中总是std::move返回值
std::string createString() {
    std::string result = "Hello";
    return std::move(result);  // ⚠️ 反而阻碍NRVO！
}
// 正确写法：
std::string createString() {
    std::string result = "Hello";
    return result;  // NRVO优化，零拷贝
}
// 当NRVO无法应用时，编译器也会将局部变量视为右值（C++11起）
// 所以return std::move(result)永远不需要，反而有害

3.4 Copy-and-Swap惯用法

cpp 复制代码

class Resource {
    int* data_;
    size_t size_;
public:
    // 构造与析构省略...
    
    // 拷贝赋值：使用copy-and-swap
    Resource& operator=(Resource other) noexcept {  // 注意：参数是按值传递
        swap(*this, other);
        return *this;
        // other在函数结束时自动析构，释放旧资源
    }
    
    friend void swap(Resource& a, Resource& b) noexcept {
        using std::swap;
        swap(a.data_, b.data_);
        swap(a.size_, b.size_);
    }
};

// 优点：
// 1. 自赋值安全：Resource r; r = r; 不会出问题
// 2. 异常安全：拷贝在参数构造时完成，如果抛异常，this不变
// 3. 自动支持移动赋值：传入右值时，other通过移动构造

四、模板元编程与编译期计算

4.1 CRTP（Curiously Recurring Template Pattern）

cpp 复制代码

// 静态多态：编译期确定，零运行时开销
template<typename Derived>
class Base {
public:
    void interface() {
        static_cast<Derived*>(this)->implementation();
    }
    
    // 通用的默认实现
    void implementation() {
        std::cout << "Base implementation\n";
    }
};

class Concrete : public Base<Concrete> {
public:
    void implementation() {
        std::cout << "Concrete implementation\n";
    }
};

// 底层：没有vtable，没有虚函数调用开销
// 编译器直接将interface()内联为Concrete::implementation()
// 代价：每种Derived类型生成一份Base的代码实例（代码膨胀）

// 实际应用：静态接口 + 代码复用
template<typename Derived>
class Addable {
public:
    Derived operator+(const Derived& rhs) const {
        Derived result = static_cast<const Derived&>(*this);
        result += rhs;  // 要求Derived提供operator+=
        return result;
    }
};

class Vector2D : public Addable<Vector2D> {
    float x_, y_;
public:
    Vector2D& operator+=(const Vector2D& rhs) {
        x_ += rhs.x_; y_ += rhs.y_;
        return *this;
    }
};

4.2 SFINAE的高阶用法

cpp 复制代码

// 检测类是否具有某个成员函数
template<typename T, typename = void>
struct HasSerialize : std::false_type {};

template<typename T>
struct HasSerialize<T, std::void_t<
    decltype(std::declval<T>().serialize())  // 表达式SFINAE
>> : std::true_type {};

// 使用
static_assert(HasSerialize<MyClass>::value, "MyClass must have serialize()");

// 检测是否可迭代
template<typename T, typename = void>
struct IsIterable : std::false_type {};

template<typename T>
struct IsIterable<T, std::void_t<
    decltype(std::begin(std::declval<T>())),
    decltype(std::end(std::declval<T>()))
>> : std::true_type {};

// C++17简化：if constexpr
template<typename T>
std::string serialize(const T& obj) {
    if constexpr (HasSerialize<T>::value) {
        return obj.serialize();
    } else if constexpr (std::is_arithmetic_v<T>) {
        return std::to_string(obj);
    } else {
        static_assert(HasSerialize<T>::value, "Type not serializable");
    }
}

4.3 编译期字符串处理（C++20）

cpp 复制代码

// C++20：固定字符串 + 编译期格式化
template<size_t N>
struct FixedString {
    char data[N];
    constexpr FixedString(const char (&str)[N]) {
        std::copy_n(str, N, data);
    }
    constexpr size_t size() const { return N - 1; }
    constexpr char operator[](size_t i) const { return data[i]; }
};

template<FixedString fmt>
constexpr auto parseFormat() {
    // 编译期解析格式字符串
    // ...
}

// C++20 constexpr的强大能力
constexpr int fibonacci(int n) {
    if (n <= 1) return n;
    return fibonacci(n - 1) + fibonacci(n - 2);
}

static_assert(fibonacci(10) == 55);  // 编译期计算

// C++20：consteval强制编译期执行
consteval int square(int x) {
    return x * x;
}

int main() {
    int a = square(5);       // OK，编译期计算
    // int x; std::cin >> x;
    // int b = square(x);    // 错误！consteval不能运行时调用
}

五、STL的暗礁与性能陷阱

5.1 vector的迭代器失效------最高频的Bug

cpp 复制代码

std::vector<int> vec = {1, 2, 3, 4, 5};

// 失效场景1：push_back导致重新分配
auto it = vec.begin();
vec.push_back(6);  // 如果触发扩容，it失效！
// *it;  // UB

// 失效场景2：erase导致后续迭代器失效
// ⚠️ 经典错误：边遍历边删除
for (auto it = vec.begin(); it != vec.end(); ++it) {
    if (*it % 2 == 0) {
        vec.erase(it);  // it失效，++it是UB！
    }
}

// ✅ 正确写法
for (auto it = vec.begin(); it != vec.end(); ) {
    if (*it % 2 == 0) {
        it = vec.erase(it);  // erase返回下一个有效迭代器
    } else {
        ++it;
    }
}

// ✅ 更好：erase-remove惯用法
vec.erase(
    std::remove_if(vec.begin(), vec.end(), [](int x) { return x % 2 == 0; }),
    vec.end()
);

// 失效场景3：insert导致重新分配
auto pos = vec.begin() + 2;
vec.insert(vec.begin(), 0);  // pos失效！所有迭代器失效

// vector扩容策略：
// GCC: 2倍扩容   MSVC: 1.5倍扩容
// 扩容 = 分配新内存 + 拷贝/移动元素 + 释放旧内存
// 所有指针、引用、迭代器全部失效

5.2 map的\[\]运算符陷阱

cpp 复制代码

std::map<std::string, int> ages;

// []的隐藏行为：如果key不存在，会插入一个默认构造的值！
int age = ages["Alice"];  // ages中插入了 {"Alice": 0}
// 即使你只是想读取，也会修改map！

// ✅ 正确的只读访问
auto it = ages.find("Alice");
if (it != ages.end()) {
    int age = it->second;
}

// ✅ C++20: contains()
if (ages.contains("Alice")) {
    int age = ages.at("Alice");  // at()不会插入，不存在则抛异常
}

// []的性能代价
// 每次调用[]都要默认构造一个value，即使key已存在
// 对于重型value类型，代价惊人
std::map<int, std::vector<std::string>> cache;
cache[1];  // 构造了一个空vector！

5.3 小字符串优化（SSO）

cpp 复制代码

// std::string的SSO：短字符串直接存储在对象内部，不分配堆内存
// 典型实现：
// GCC libstdc++: 15字节（64位系统）
// LLVM libc++:   22字节（64位系统）
// MSVC:          15字节

// 这意味着：
// sizeof(std::string) 通常为 32字节（64位系统）
// 不管字符串多长，string对象本身的大小不变

// 性能影响
std::string shortStr = "Hello";   // SSO，无堆分配
std::string longStr = "This is a very long string that exceeds SSO limit";
// 堆分配

// ⚠️ SSO导致string不宜用作移动场景的受益者
// 短字符串的移动 ≈ 拷贝（都是复制内部缓冲区）
// 只有长字符串的移动才有显著优势

5.4 unordered_map的哈希冲突与性能退化

cpp 复制代码

// unordered_map的最坏情况：O(n)查找
// 当所有key映射到同一个桶时，退化为链表

// 攻击场景：恶意构造的key导致哈希碰撞攻击
std::unordered_map<std::string, int> map;
// 攻击者知道哈希函数，构造大量碰撞key
// 查找性能从O(1)退化为O(n)

// 解决方案1：使用随机化哈希种子
// 解决方案2：C++20的unordered_map支持max_load_factor调整
map.max_load_factor(0.5);  // 更早扩容，减少冲突

// 底层实现差异：
// GCC: 链地址法（链表 + 红黑树退化）  → 最坏O(log n)
// LLVM: 链地址法（纯链表）            → 最坏O(n)
// 有些实现：开放寻址法                → 缓存更友好

// ⚠️ 指针作为key
std::unordered_map<int*, Data> ptrMap;
// 指针的哈希值通常就是指针值的位模式
// 但相同值的int*可能指向不同对象（非唯一性），需注意语义

5.5 算法的隐蔽陷阱

cpp 复制代码

// 1. std::remove并不真的删除元素！
std::vector<int> v = {1, 2, 3, 2, 4};
std::remove(v.begin(), v.end(), 2);
// v = {1, 3, 4, ?, ?}  逻辑删除，size不变
// 必须 erase-remove:
v.erase(std::remove(v.begin(), v.end(), 2), v.end());

// 2. std::sort的等价元素顺序不稳定
struct Item { int priority; std::string name; };
std::vector<Item> items = {{1, "A"}, {2, "B"}, {1, "C"}};
std::sort(items.begin(), items.end(), 
    [](const Item& a, const Item& b) { return a.priority < b.priority; });
// priority相同的元素顺序不确定
// 需要 stable_sort 或 在比较器中加入次要排序键

// 3. binary_search要求序列已排序
std::vector<int> unsorted = {3, 1, 4, 1, 5};
bool found = std::binary_search(unsorted.begin(), unsorted.end(), 4);
// ⚠️ 未定义行为！binary_search假设序列已排序

// 4. lower_bound vs find
// find: O(n)，线性搜索，不要求排序
// lower_bound: O(log n)，二分搜索，要求排序
// 对于小容器（< 50元素），find可能更快（缓存友好）

// 5. std::nth_element：面试常考
// 将第n个元素放到正确位置，左边都≤它，右边都≥它
// 但不保证左右两边内部有序------O(n)时间
std::vector<int> v = {5, 2, 8, 1, 9, 3, 7};
auto mid = v.begin() + v.size() / 2;
std::nth_element(v.begin(), mid, v.end());
// *mid 就是中位数（或近似中位数）

六、并发编程的真实世界

6.1 内存模型与happens-before关系

cpp 复制代码

// C++内存模型定义了6种内存序
// memory_order_relaxed:    无同步，只保证原子性
// memory_order_acquire:    之后的读写不能重排到此操作之前
// memory_order_release:    之前的读写不能重排到此操作之后
// memory_order_acq_rel:    acquire + release
// memory_order_consume:    数据依赖的acquire（C++17起不推荐）
// memory_order_seq_cst:    顺序一致性（默认，最严格）

// 经典的双重检查锁定模式（DCLP）
class Singleton {
    static std::atomic<Singleton*> instance_;
    static std::mutex mtx_;
    
public:
    static Singleton* getInstance() {
        Singleton* tmp = instance_.load(std::memory_order_acquire);
        if (!tmp) {
            std::lock_guard<std::mutex> lock(mtx_);
            tmp = instance_.load(std::memory_order_relaxed);
            if (!tmp) {
                tmp = new Singleton();
                instance_.store(tmp, std::memory_order_release);
            }
        }
        return tmp;
    }
};

// ⚠️ 为什么需要memory_order_acquire/release？
// 如果用relaxed读，可能看到store前的中间状态
// acquire确保看到release之前的所有写入

// 更简单的C++11写法（Meyers' Singleton）
class Singleton {
public:
    static Singleton& getInstance() {
        static Singleton instance;  // C++11保证线程安全的局部静态变量
        return instance;
    }
};

6.2 自旋锁与std::atomic的高级用法

cpp 复制代码

// 简单自旋锁
class SpinLock {
    std::atomic_flag flag_ = ATOMIC_FLAG_INIT;
public:
    void lock() {
        while (flag_.test_and_set(std::memory_order_acquire)) {
            // ⚠️ 生产代码应加入退避策略
            // while循环直接自旋会浪费CPU并导致总线风暴
            #if defined(__x86_64__)
            _mm_pause();  // x86的PAUSE指令，降低功耗
            #elif defined(__aarch64__)
            __asm__ volatile("yield");
            #endif
        }
    }
    
    void unlock() {
        flag_.clear(std::memory_order_release);
    }
};

// 改进：指数退避
class BackoffSpinLock {
    std::atomic<bool> locked_{false};
public:
    void lock() {
        int backoff = 1;
        while (true) {
            // 先读一次，避免总是总线锁
            if (!locked_.load(std::memory_order_relaxed) &&
                !locked_.exchange(true, std::memory_order_acquire)) {
                return;  // 获取成功
            }
            // 退避：随机延迟一段时间
            for (int i = 0; i < backoff; ++i) {
                #if defined(__x86_64__)
                _mm_pause();
                #endif
            }
            backoff = std::min(backoff * 2, 64);  // 指数增长，上限64
        }
    }
    
    void unlock() {
        locked_.store(false, std::memory_order_release);
    }
};

cpp 复制代码

// ⚠️ 典型错误：多线程各自更新数组中相邻元素
struct Counter {
    alignas(64) std::atomic<int> count1;  // 独占一个缓存行
    alignas(64) std::atomic<int> count2;  // 独占一个缓存行
    // 不加alignas(64)：count1和count2可能在同一缓存行
    // 线程A更新count1，使线程B的缓存行失效（即使B只用count2）
    // 这就是False Sharing，性能可能下降10-100倍
};

// 另一个常见场景
void parallelSum(const std::vector<int>& data, int numThreads) {
    std::vector<int64_t> partialSums(numThreads, 0);  // ⚠️ 相邻元素在相同缓存行
    
    // ✅ 修复：填充到缓存行大小
    struct alignas(64) PaddedSum { int64_t value = 0; };
    std::vector<PaddedSum> partialSums2(numThreads);
    
    // 或者每个线程用thread_local累积，最后合并
}

6.4 锁的优先级与死锁预防

cpp 复制代码

// 死锁的四个必要条件：互斥、持有并等待、不可抢占、循环等待
// 破坏"循环等待"最实用：锁排序

class Account {
    std::mutex mtx_;
    int balance_;
public:
    void transfer(Account& to, int amount) {
        // ⚠️ 死锁写法
        // std::lock_guard<std::mutex> lock1(this->mtx_);
        // std::lock_guard<std::mutex> lock2(to.mtx_);
        // 如果A→B和B→A同时发生，死锁！
        
        // ✅ 方案1：std::lock同时锁定（避免死锁）
        std::unique_lock<std::mutex> lock1(this->mtx_, std::defer_lock);
        std::unique_lock<std::mutex> lock2(to.mtx_, std::defer_lock);
        std::lock(lock1, lock2);  // 原子化地获取两把锁
        
        // ✅ 方案2：按地址排序（确定性加锁顺序）
        if (this < &to) {
            std::lock_guard<std::mutex> lk1(this->mtx_);
            std::lock_guard<std::mutex> lk2(to.mtx_);
        } else {
            std::lock_guard<std::mutex> lk1(to.mtx_);
            std::lock_guard<std::mutex> lk2(this->mtx_);
        }
        
        // ✅ 方案3：C++17 scoped_lock（最简洁）
        std::scoped_lock lock(this->mtx_, to.mtx_);
        // 自动按无死锁顺序获取
    }
};

七、类型系统的深度运用

7.1 auto的类型推导陷阱

cpp 复制代码

// 陷阱1：auto忽略顶层const和引用
const int& ref = 42;
auto x = ref;          // x是int，去掉了const和引用
const auto& y = ref;   // y是const int&，需要显式加

// 陷阱2：auto与花括号初始化
auto a = 42;          // int
auto b = {42};        // std::initializer_list<int>
auto c = {42, 3.14};  // ⚠️ 编译错误！元素类型不一致

// 陷阱3：auto&&与vector<bool>
std::vector<bool> v = {true, false, true};
auto& x = v[0];       // ⚠️ 编译错误！vector<bool>的operator[]返回代理对象
auto  y = v[0];        // OK，但y是bool而非vector<bool>::reference

// 陷阱4：数组退化为指针
int arr[10];
auto p = arr;          // int*，数组退化为指针
auto& r = arr;         // int(&)[10]，保持数组引用

// 陷阱5：函数到函数指针的退化
void func(int);
auto f = func;         // void(*)(int)，函数退化为函数指针
auto& fr = func;       // void(&)(int)，保持函数引用

7.2 decltype的推导规则

cpp 复制代码

// 规则1：decltype(变量名) → 变量的声明类型
int x = 0;
decltype(x) a = 0;           // int
decltype((x)) b = x;         // int&  ⚠️ 双括号改变语义！

// 规则2：decltype(表达式) → 表达式的值类别决定类型
//   左值 → T&
//   右值 → T
//   x是左值，(x)也是左值 → int&

int&& rref = 42;
decltype(rref) c = 42;       // int&&
decltype((rref)) d = rref;   // int&（具名右值引用是左值！）

// 经典面试题
int a = 1, b = 2;
decltype(a) x1 = 0;          // int
decltype(a + b) x2 = 0;      // int（a+b是右值）
decltype(a = b) x3 = a;      // int&（赋值表达式返回左值引用）

7.3 std::variant与std::visit（类型安全的联合体）

cpp 复制代码

#include <variant>
#include <string>

// 替代union + tag的传统模式
using Value = std::variant<int, double, std::string>;

Value v = 42;
v = 3.14;
v = "Hello";

// 访问方式1：std::get（可能抛异常）
int i = std::get<int>(v);          // 如果v不是int，抛std::bad_variant_access
int* pi = std::get_if<int>(&v);    // 返回指针，不抛异常

// 访问方式2：std::visit（类型安全的多态访问）
struct Printer {
    void operator()(int i) const { std::cout << "int: " << i << "\n"; }
    void operator()(double d) const { std::cout << "double: " << d << "\n"; }
    void operator()(const std::string& s) const { std::cout << "string: " << s << "\n"; }
};

std::visit(Printer{}, v);

// 更优雅的泛型lambda + overload模式
template<class... Ts>
struct overload : Ts... { using Ts::operator()...; };
template<class... Ts>
overload(Ts...) -> overload<Ts...>;

std::visit(overload{
    [](int i) { std::cout << "int: " << i << "\n"; },
    [](double d) { std::cout << "double: " << d << "\n"; },
    [](const std::string& s) { std::cout << "string: " << s << "\n"; }
}, v);

八、Pimpl惯用法与编译防火墙

8.1 Pimpl（Pointer to Implementation）

cpp 复制代码

// Widget.h --- 头文件只暴露最小接口
class Widget {
public:
    Widget();
    ~Widget();
    Widget(Widget&& rhs) noexcept;
    Widget& operator=(Widget&& rhs) noexcept;
    
    // 拷贝操作需要自行定义（unique_ptr不可拷贝）
    Widget(const Widget& rhs);
    Widget& operator=(const Widget& rhs);
    
    void doWork();
    
private:
    struct Impl;                   // 前置声明
    std::unique_ptr<Impl> pImpl_;  # 指向实现
};

// Widget.cpp --- 实现细节全部隐藏
struct Widget::Impl {
    std::string name;
    std::vector<int> data;
    void complexHelper();
};

Widget::Widget() : pImpl_(std::make_unique<Impl>()) {}
Widget::~Widget() = default;  // ⚠️ 必须在.cpp中定义，因为Impl在此完整

Widget::Widget(Widget&& rhs) noexcept = default;
Widget& Widget::operator=(Widget&& rhs) noexcept = default;

Widget::Widget(const Widget& rhs) 
    : pImpl_(std::make_unique<Impl>(*rhs.pImpl_)) {}
Widget& Widget::operator=(const Widget& rhs) {
    *pImpl_ = *rhs.pImpl_;
    return *this;
}

void Widget::doWork() {
    pImpl_->complexHelper();
}

// Pimpl的优势：
// 1. 修改Impl不需要重新编译使用Widget的代码（编译防火墙）
// 2. 头文件不再#include <string>和<vector>，减少依赖
// 3. 二进制兼容性：修改Impl成员不影响ABI

Pimpl的常见踩坑：

cpp 复制代码

// 坑1：在头文件中定义析构函数
// 如果在头文件中 ~Widget() = default，编译器需要知道Impl的完整定义
// 但Impl在.cpp中定义，头文件中只有一个前置声明
// 结果：unique_ptr的析构需要delete不完整类型 → 编译错误

// 坑2：忘记定义移动操作
// 声明了析构函数后，编译器不再隐式生成移动操作
// 即使生成了，也可能因为Impl不完整而编译失败

// 坑3：const成员函数无法直接操作pImpl_
void Widget::doWork() const {
    // pImpl_是指向非const Impl的指针
    // 即使Widget是const，pImpl_指向的对象仍可修改
    // 这是一种"浅const"语义------const Widget的Impl仍可变
    pImpl_->data.push_back(42);  // 能编译！但可能违反const语义
}

九、异常安全的三个等级

cpp 复制代码

// 1. 基本保证（Basic Guarantee）：异常发生后对象处于有效状态，无资源泄漏
// 2. 强保证（Strong Guarantee）：异常发生后对象状态回滚到操作前
// 3. 不抛出保证（Nothrow Guarantee）：操作保证不抛出异常

class Stack {
    std::vector<int> data_;
public:
    // 基本保证：push_back可能抛bad_alloc，但data_仍有效
    void push(int val) {
        data_.push_back(val);  // 如果失败，data_不变
    }
    
    // ⚠️ 不满足任何保证
    void badPush(int val) {
        data_.reserve(data_.size() + 1);  // 可能抛异常
        data_.push_back(val);              // 如果这抛异常，reserve已执行
    }
    
    // 强保证：使用copy-and-swap
    void strongPush(int val) {
        std::vector<int> copy = data_;  // 拷贝
        copy.push_back(val);             // 修改拷贝
        data_.swap(copy);                # 不抛出交换
    }
    
    // 不抛出保证
    void pop() noexcept {
        if (!data_.empty()) {
            data_.pop_back();  // pop_back不抛异常
        }
    }
};

// RAII是异常安全的基石
void processFile() {
    std::ifstream file("data.txt");  // RAII
    std::string line;
    while (std::getline(file, line)) {
        processLine(line);  // 如果抛异常，file自动关闭
    }
}  // 无论是否异常，file都会正确关闭

十、编译期优化与性能调优

10.1 返回值优化（RVO/NRVO）

cpp 复制代码

// RVO（Return Value Optimization）：对返回临时对象的优化
std::string createString() {
    return std::string("Hello");  // RVO：直接在调用方的栈帧构造
}

// NRVO（Named Return Value Optimization）：对返回命名变量的优化
std::string createString2() {
    std::string result = "Hello";  // NRVO：result直接构造在调用方栈帧
    result += " World";
    return result;
}

// ⚠️ 阻碍NRVO的条件
std::string createString3(bool flag) {
    std::string a = "Hello";
    std::string b = "World";
    if (flag) return a;  // 多个返回路径 → NRVO可能失败
    return b;
}

// C++17保证RVO（但对NRVO仍是可选优化）
// C++11起：即使NRVO失败，也会尝试移动语义
std::string createString4() {
    std::string result = "Hello";
    return result;  // 如果NRVO失败，std::move(result)自动应用
    // ⚠️ 不要显式写 return std::move(result)，会阻碍NRVO
}

10.2 内联与虚函数的性能博弈

cpp 复制代码

// 虚函数阻止内联------但有时编译器可以"去虚化"（Devirtualization）
class Base {
public:
    virtual int compute(int x) { return x * 2; }
};

void devirtExample() {
    Base b;
    b.compute(5);  // 编译器可能去虚化：直接调用Base::compute并内联
    // 因为编译器能看到b的精确类型
}

// 但通过指针/引用调用时，去虚化困难
void virtualCall(Base* ptr) {
    ptr->compute(5);  // 通常无法内联
}

// C++11的final帮助编译器去虚化
class FinalClass final : public Base {
    int compute(int x) override final { return x * 3; }
};

void callFinal(FinalClass* ptr) {
    ptr->compute(5);  // 编译器知道FinalClass没有更多派生类，可以内联
}

10.3 缓存友好的代码

cpp 复制代码

// 数据结构选择对缓存的影响
// 场景：遍历100万个元素并求和

// 方案1：vector（连续内存，缓存友好）
std::vector<int> vec(1'000'000);
// 遍历时间：~2ms（缓存命中率高）

// 方案2：list（链式内存，缓存不友好）
std::list<int> lst(vec.begin(), vec.end());
// 遍历时间：~15ms（每次访问都可能cache miss）

// 方案3：deque（分段连续，折中）
std::deque<int> dq(vec.begin(), vec.end());
// 遍历时间：~3ms

// 结构体数组的缓存优势 vs 数组结构
struct Particle {
    float x, y, z;       // 位置
    float vx, vy, vz;    // 速度
    float mass;
    // ... 20个字段
};

// 只更新位置：
void updatePositions(std::vector<Particle>& particles) {
    for (auto& p : particles) {
        p.x += p.vx;  // 每次加载整个Particle（可能64+字节）
        p.y += p.vy;  // 但只用x/y/z和vx/vy/vz
        p.z += p.vz;  // 大量缓存行浪费在未使用的数据上
    }
}

// SoA（Structure of Arrays）优化
struct ParticleSoA {
    std::vector<float> x, y, z;
    std::vector<float> vx, vy, vz;
    std::vector<float> mass;
};

void updatePositions(ParticleSoA& particles) {
    for (size_t i = 0; i < particles.x.size(); ++i) {
        particles.x[i] += particles.vx[i];  // 连续内存，完美缓存利用
        particles.y[i] += particles.vy[i];
        particles.z[i] += particles.vz[i];
    }
}

十一、面试高频深度题集

Q1: 为什么构造函数不能是虚函数？

对象构造时，vptr尚未初始化。构造函数的执行顺序是基类→派生类，在基类构造期间，对象的动态类型还不是派生类，vptr指向基类的vtable。因此虚函数机制无法正常工作。

Q2: delete this是否合法？

合法但有严格条件：

对象必须是通过new分配的（非栈对象、非全局对象）
调用后不能访问this的任何成员
调用后不能调用delete再次释放
通常用于引用计数归零的场景

cpp 复制代码

class RefCounted {
    std::atomic<int> count_{1};
public:
    void addRef() { count_.fetch_add(1, std::memory_order_relaxed); }
    void release() {
        if (count_.fetch_sub(1, std::memory_order_acq_rel) == 1) {
            delete this;  // 合法
        }
    }
};

Q3: 什么是纯虚析构函数？为什么要用它？

cpp 复制代码

class AbstractBase {
public:
    virtual ~AbstractBase() = 0;  // 纯虚析构函数
};
// 必须提供定义！
AbstractBase::~AbstractBase() = default;

// 目的：使类成为抽象类（不可实例化），同时确保派生类的析构链正确
// 如果不提供定义，派生类析构时会链接错误

Q4: static成员变量的初始化顺序？

cpp 复制代码

// ⚠️ 不同编译单元的static变量初始化顺序未定义！
// file1.cpp
static int a = computeA();  // 可能先执行，也可能后执行

// file2.cpp  
static int b = computeB();  // 如果computeB依赖a的值，结果未定义

// 解决方案：函数内static（Meyers' Singleton模式）
int& getA() {
    static int a = computeA();  // C++11保证线程安全的延迟初始化
    return a;
}
int& getB() {
    static int b = computeB(getA());  // 保证a先初始化
    return b;
}

Q5: std::shared_ptr的control block结构？

复制代码

shared_ptr控制块通常包含：
┌───────────────────┐
│ ref_count         │  ← shared_ptr引用计数
│ weak_count        │  ← weak_ptr引用计数
│ [自定义删除器]     │  ← 如果有
│ [自定义分配器]     │  ← 如果有
│ [对象本身]         │  ← make_shared时与控制块连续分配
└───────────────────┘

// make_shared的内存布局（一次分配）:
┌───────────────────┐
│ 控制块头部         │
│ 对象 T            │  ← 紧跟控制块
└───────────────────┘

// 这就是为什么weak_ptr能延长对象内存的释放：
// 即使ref_count降为0（对象析构），weak_count > 0时整个内存块不释放
// 对象的析构函数被调用，但内存不归还

Q6: 什么时候必须用std::forward而不是std::move？

cpp 复制代码

// 规则：只在万能引用（T&&）参数上用std::forward
// 其他所有需要右值的场景用std::move

template<typename T>
void wrapper(T&& arg) {
    // arg在函数内是左值（具名变量都是左值）
    // std::forward<T>(arg) 保持arg传入时的值类别
    // 如果传入左值 → 转发为左值引用
    // 如果传入右值 → 转发为右值引用
    
    target(std::forward<T>(arg));  // ✅ 正确
    target(std::move(arg));         // ❌ 错误！左值也会被转为右值
}

总结

C++的深度不在于语法数量，而在于语言规则与机器模型之间的鸿沟：

层次	关注点	典型问题
语法层	怎么写	虚函数怎么声明
语义层	为什么这样设计	虚析构为什么必要
底层实现	编译器怎么做的	vtable的内存布局
工程实践	生产环境怎么用	ABI兼容性、迭代器失效
性能层	运行时开销多少	False sharing、缓存行
标准边界	什么是UB	严格别名、数据竞争

掌握C++不是记住所有规则，而是理解规则背后的设计哲学和硬件约束。 当你能从CPU缓存行、编译器优化、内存模型的角度理解一行代码的行为时，才算真正读懂了C++。

参考资料

Effective Modern C++ --- Scott Meyers（移动语义/类型推导必读）
C++ Concurrency in Action --- Anthony Williams（并发/内存模型权威）
Inside the C++ Object Model --- Stanley Lippman（对象模型底层）
CppCoreGuidelines --- Bjarne Stroustrup & Herb Sutter
What Every Programmer Should Know About Memory --- Ulrich Drepper
cppreference.com（最权威的在线参考）

C++核心技术深度剖析：从底层原理到工程实践

一、对象模型与内存布局

1.1 虚函数表（vtable）与虚表指针（vptr）------面试必考

1.2 对象切片（Object Slicing）------隐蔽的Bug来源

1.3 多重继承与菱形继承

1.4 内存对齐与填充（Padding）

二、内存管理的深水区

2.1 RAII------C++资源管理的灵魂

2.2 智能指针的隐藏陷阱

陷阱一：shared_ptr的"栈外"构造与控制块分离

陷阱二：shared_ptr的线程安全误区

陷阱三：make_shared与自定义删除器的矛盾

陷阱四：unique_ptr的数组偏特化

2.3 new/delete的底层机制

2.4 未定义行为（UB）------C++最危险的陷阱

三、移动语义的深水区

3.1 万能引用（Universal Reference）与右值引用的区别

3.2 完美转发的失败场景

3.3 移动语义的常见误区

3.4 Copy-and-Swap惯用法

四、模板元编程与编译期计算

4.1 CRTP（Curiously Recurring Template Pattern）

4.2 SFINAE的高阶用法

4.3 编译期字符串处理（C++20）

五、STL的暗礁与性能陷阱

5.1 vector的迭代器失效------最高频的Bug

5.2 map的\[\]运算符陷阱

5.3 小字符串优化（SSO）

5.4 unordered_map的哈希冲突与性能退化

5.5 算法的隐蔽陷阱

六、并发编程的真实世界

6.1 内存模型与happens-before关系

6.2 自旋锁与std::atomic的高级用法

6.3 False Sharing------多核性能杀手

6.4 锁的优先级与死锁预防

七、类型系统的深度运用

7.1 auto的类型推导陷阱

7.2 decltype的推导规则

7.3 std::variant与std::visit（类型安全的联合体）

八、Pimpl惯用法与编译防火墙

8.1 Pimpl（Pointer to Implementation）

九、异常安全的三个等级

十、编译期优化与性能调优

10.1 返回值优化（RVO/NRVO）

10.2 内联与虚函数的性能博弈

10.3 缓存友好的代码

十一、面试高频深度题集

Q1: 为什么构造函数不能是虚函数？

Q2: delete this是否合法？

Q3: 什么是纯虚析构函数？为什么要用它？

Q4: static成员变量的初始化顺序？

Q5: std::shared_ptr的control block结构？

Q6: 什么时候必须用std::forward而不是std::move？

总结

参考资料