深度解读《深度探索C++对象模型》之数据成员的存取效率分析(三)

接下来我将持续更新"深度解读《深度探索C++对象模型》"系列,敬请期待,欢迎关注!也可以关注公众号:iShare爱分享,自动获得推文和全部的文章列表。

前面两篇请通过这里查看:

深度解读《深度探索C++对象模型》之数据成员的存取效率分析(一)

深度解读《深度探索C++对象模型》之数据成员的存取效率分析(二)

这一节讲解具体继承的情况,具体继承也叫非虚继承(针对虚继承而言),分为两种情况讨论:单一继承和多重继承。

单一继承

在上面的例子中,所有的数据都封装在一个类中,但有时可能由于业务的需要,需要拆分成多个类,然后每个类之间具有继承关系,比如可能是这样的定义:

c++ 复制代码
class Point {
	int x;
};
class Point2d: public Point {
	int y;
};
class Point3d: public Point2d {
	int z;
};

对于这样的单一继承关系,在前面的文章《深度解读《深度探索C++对象模型》之C++对象的内存布局》中已经分析过了。一般而言,Point3d 类的内存布局跟独立声明的类的内存布局没什么差别,除非在某些情况下,编译器为了内存对齐而进行填充,造成空间占用上会变大的情况,但对于存取效率而言没什么影响,因为在编译期间就已经确定好了它们的偏移值。完善上面的例子,在main 函数中定义Point3d的对象,然后访问各个成员,看看对应的汇编代码。

c++ 复制代码
int main() {
    printf("&Point2d::y = %d\n", &Point2d::y);
    printf("&Point3d::y = %d\n", &Point3d::y);
    Point3d p3d;
    p3d.x = p3d.y = p3d.z = 1;

    return 0;
}

上面两行打印代码输出的都是4,再看看第5行代码对应的汇编代码:

text 复制代码
mov     dword ptr [rbp - 8], 1
mov     dword ptr [rbp - 12], 1
mov     dword ptr [rbp - 16], 1

生成的汇编代码跟独立类的汇编代码没有区别,这说明单一继承的存取效率跟没有继承关系的类的存取效率是一样的。

多重继承

或许业务需要,继承关系不是上面的单一继承关系,而是需要改成多重继承关系,多重继承下对象的存取效率是否会受影响?我们来看一个具体的例子:

c++ 复制代码
#include <cstdio>

class Point {
public:
    int x;
};
class Point2d {
public:
    int y;
};
class Point3d: public Point, public Point2d {
public:
    int z;
};

int main() {
    printf("&Point2d::y = %d\n", &Point2d::y);
    printf("&Point3d::x = %d\n", &Point3d::x);
    printf("&Point3d::y = %d\n", &Point3d::y);
    printf("&Point3d::z = %d\n", &Point3d::z);
    Point3d p3d;
    p3d.x = p3d.y = p3d.z = 1;
    Point2d* p2d = &p3d;
    p2d->y = 2;

    return 0;
}

输出结果是:

text 复制代码
&Point2d::y = 0
&Point3d::x = 0
&Point3d::y = 0
&Point3d::z = 8

第1、2行输出是0 很正常,因为对于Point2d 类来说只有一个成员y ,也没有继承其他类,所以y 的偏移值是0 ,第2行输出的是x 的偏移值,它从Point 类继承而来,排在最前面,所以偏移值也是0 。但为什么第3行输出也是0 ?难道不应该是4 吗?从第4行的输出看到z的偏移值是8 ,说明前面确实有两个成员在那里了。其实这里应该是编译器做了调整了,因为Point2d 是第二基类,访问第二基类及之后的类时需要调整this 指针,也就是将Point3d 对象的起始地址调整为Point2d 的起始地址,一般是将Point3d 的地址加上前面子类的大小,如 &p3d+sizeof(Point) 。来看看上面代码生成的汇编代码:

text 复制代码
main:                           # @main
    # 略...
    lea     rdi, [rip + .L.str]
    xor     eax, eax
    mov     esi, eax
    mov     al, 0
    call    printf@PLT
    lea     rdi, [rip + .L.str.1]
    xor     eax, eax
    mov     esi, eax
    mov     al, 0
    call    printf@PLT
    lea     rdi, [rip + .L.str.2]
    xor     eax, eax
    mov     esi, eax
    mov     al, 0
    call    printf@PLT
    lea     rdi, [rip + .L.str.3]
    mov     esi, 8
    mov     al, 0
    call    printf@PLT
    mov     dword ptr [rbp - 8], 1
    mov     dword ptr [rbp - 12], 1
    mov     dword ptr [rbp - 16], 1
    xor     eax, eax
    lea     rcx, [rbp - 16]
    cmp     rcx, 0
    mov     qword ptr [rbp - 32], rax       # 8-byte Spill
    je      .LBB0_2
    lea     rax, [rbp - 16]
    add     rax, 4
    mov     qword ptr [rbp - 32], rax       # 8-byte Spill
.LBB0_2:
    mov     rax, qword ptr [rbp - 32]       # 8-byte Reload
    mov     qword ptr [rbp - 24], rax
    mov     rax, qword ptr [rbp - 24]
    mov     dword ptr [rax], 2
    # 略...
    ret
# 略...

上面汇编代码中的第3到第7行对应的是上面C++代码的第一条printf 打印语句(C++代码第17行),这里可以看到给printf 函数传递了两个参数,分别通过rdi 寄存器和esi寄存器,rdi 寄存器保存的是第一个参数字符串,它的地址是 [rip + .L.str].L.str 是字符串存储在数据段中的位置标签,rip +这个标签可以取得它的偏移地址,以下的 .L.str.1、.L.str.2.L.str.3 都是字符串的位置标签),esi 是第二个参数,这里的值被设为0了。

第8到12行汇编代码对应的是C++代码中的第二条printf 打印语句,同样地,给rdi 寄存器设置字符串的地址,给esi 寄存器设置值为0 。第13到第17行对应的是第三条printf 打印语句,第18到第21行就是对应C++代码中的第四条printf 打印语句,可以看到编译器在编译期间已经确定好了它们的偏移值为0, 0, 0, 8

第22到24行对应的C++的第22行代码,是对对象的成员进行赋值,可以看到通过对象来存取数据成员跟独立的类存取数据成员是一样的,已经知道了每个成员的内存地址了,所以存取的效率跟独立的类的存取效率没有差别。

汇编代码的第25行到37行对应C++的第23、24行代码,是将Point3d的地址转换成父类Point2d 的指针类型,通过父类Point2d 的指针来访问数据成员。前面提到过的将子类转换成第2及之后的基类时会进行this 指针的调整,这里就是具体的实现。相当于伪代码:Point2d* p2d = &p3d+sizeof(Point),其实这里应该还需要判断下p3d 是否为0 ,所以正确应该是:Point2d* p2d = &p3d ? &p3d+sizeof(Point) : 0。上面的第26到29行即是判断是否为0 ,如果为0 则跳转到第33行,如果不为0 则将p3d 的地址 [rbp - 16] 加上44Point 类的大小,然后存放在 [rbp - 32] ,再加载到rax 寄存器中,然后对其赋值2(汇编代码第37行)。

通过分析汇编代码,多重继承的情况,如果是通过对象来存取数据成员,是跟独立类的存取效率是一致的,如果是通过第二及之后的基类的指针来存取,则需要调整this指针,可以看到对应的汇编代码也多了好好多行,所以效率上会有一些损失。

如果您感兴趣这方面的内容,请在微信上搜索公众号iShare爱分享并关注,以便在内容更新时直接向您推送。

相关推荐
anyup_前端梦工厂19 小时前
ECharts 海量数据渲染性能优化方案
信息可视化·性能优化·echarts
Chancezhou19 小时前
【JVM】总结篇之GC性能优化案例
jvm·性能优化
vip1024p19 小时前
全面指南:使用JMeter进行性能压测与性能优化(中间件压测、数据库压测、分布式集群压测、调优)
jmeter·中间件·性能优化
eyuhaobanga2 天前
高质量编程 & 性能优化学习笔记
笔记·学习·性能优化
Feng.Lee2 天前
性能测试中CPU风险诊断方法有哪些
服务器·网络·性能优化
码云之上3 天前
十分钟快速实现Web应用性能监控
前端·性能优化·监控
wenchun0013 天前
【MySQL实战】mysql_exporter+Prometheus+Grafana
数据库·mysql·性能优化·数据分析
浏览器爱好者4 天前
谷歌浏览器的兼容性与性能优化策略
chrome·性能优化
huaqianzkh4 天前
了解效率及其子特性:软件性能优化的关键
性能优化·系统架构
蛇皮划水怪4 天前
《Effective Java》——对所有对象都通用的方法
后端·面试·代码规范