C++: 如何用C语言实现C++的虚函数机制?

前言

googletest的源码中,看到gtest-matchers.h 中实现的MatcherBase 类自定义了一个 VTable,这种设计实现了一种类似于C++虚函数的机制。C++中的虚函数机制实质上就是通过这种方式实现的,本文用c语言自定义虚函数表VTable实现了一下virtual的功能,来深刻理解其机制。我们通过创建存储函数指针的结构体来模拟这种行为。

C++的运行时多态

如果我们在C++中有一个抽象基类 Shape ,定义了纯虚函数GetArea() 用于计算面积。对于不同的派生于 Shape 的类,面积计算方法会不一样。比如,对于圆形 Circle类,是 Shape 的一种,其特有属性为半径r,面积计算公式为 π·r² ;对于正方形 Square类,其特有属性为边长d,其面积计算公式为

基类Shape 的定义如下:

cpp 复制代码
class Shape { 
public:
	virtual double GetArea()=0;
};

派生类Circle 继承于 Shape,定义如下:

cpp 复制代码
class Circle: public Shape  {
public:
  Circle(double r):radius(r){}
	double GetArea() override {
		return radius * radius * 3.14;
	}
private:
	double radius;
};

通过基类指针指向不同派生类对象,去调用同一个方法,可以实现多态,如下所示:

cpp 复制代码
Shape* shape = new CirCle(5);
shape->GetArea();

那么 virtual 实现多态的底层原理是什么呢?

用C语言简单实现virtual的底层原理

用C语言模拟实现以上C++代码。首先定义一个存储函数指针的结构体VTable,作为 Shape类的虚函数表 ,其中定义了两个函数指针, 分别指向该类计算面积的函数和析构函数,只要目标函数的参数列表和返回类型与函数指针定义相同 ,其中void*相当于this指针:

c 复制代码
struct VTable{
    double (*GetArea)(void*);
    void (*Destructor)(void*);
};

然后定义一个基类Shape的结构体,其中包含了一个指向虚函数表VTable 的指针:

c 复制代码
struct Shape{
    VTable* vtable;
};

在派生类 Circle 中,添加了额外的字段 radius,并且包含一个基类的实例,通过这种方式实现继承:

c 复制代码
struct Circle{
    Shape base;
    double radius;
};

然后定义一个函数GetArea,作为公共调用接口,该函数接收一个Shape指针作为参数,并通过其指向类的虚函数表调用它的面积计算方法:

c 复制代码
double GetArea(Shape* shape){
    return shape->vtable->GetArea(shape);
}

对于Circle类中的面积计算方法,实现如下:

c 复制代码
double GetCircleArea(void* obj){
    Circle* circle = (Circle*)obj;
    return 3.14 * circle->radius * circle->radius;
}

最后,在程序中初始化Circle类的虚函数表 circle_vtable ,设置GetArea函数和析构函数,分配一块Circle对象大小的内存,将它的vtable绑定到circle_vtable ,初始化radius的值,并通过Shape类型的指针指向Circle对象,调用虚表中的方法:

c 复制代码
VTable circle_vtable = {&GetCircleArea,
                        &CircleDestructor};

Circle* circle = (Circle*)malloc(sizeof(Circle));
circle->base.vtable = &circle_vtable;
circle->radius = 5;

Shape* shape = (Shape*)circle;
printf("Area of circle: %f\n", GetArea(shape));
ShapeDestructor(shape);

输出为:

Area of circle: 78.500000

对于Square 类,也是类似的实现。类设计如下图所示:

完整测试程序地址:https://compiler-explorer.com/z/zbGh7dsh4

自定义VTable的好处

通过virtual实现多态绝大多数时候都够了,那为什么googletest库中要自定义VTable呢?以下是一些好处,供参考,学习一下库开发者的思考角度。

  1. 更好的性能

C++的虚函数机制虽然方便,但是它在某些情况下会带来性能开销。例如,虚函数表的查找需要额外的时间,并且每个对象都需要一个指向虚表的指针,这会增加内存的开销。通过自定义的VTable机制,googletest 可以更好地控制这些开销,可能减少间接调用的开销,提高性能。

  1. 灵活的内存管理

使用自定义的VTable可以更灵活地管理内存。例如,可以将VTable实例放置在特定的内存区域或共享多个对象之间,从而减少内存占用。这种方式也可以使得一些轻量级对象不需要包含虚表指针,从而减小对象的大小。

  1. 跨编译器兼容性

不同的编译器和编译器版本对虚函数的实现可能略有不同,这会导致跨编译器的兼容性问题。通过自定义的VTable机制,googletest 可以避免依赖编译器的实现细节,保证在不同编译器和平台上的一致行为。

  1. 类型擦除和多态性

自定义的VTable机制可以实现类型擦除和更灵活的多态性。它允许将不同类型的对象统一处理,而不需要它们共享一个公共的基类。这对于模板编程和泛型编程非常有用,因为可以实现基于模板的多态而不需要依赖继承。

  1. 更好的调试和测试

自定义的VTable可以在调试和测试中提供更多的信息。例如,可以在VTable中包含额外的调试信息或断言,以帮助发现和诊断问题。这种灵活性在某些情况下是C++内置的虚函数机制所无法提供的。

总结

这个例子的实现对很多问题还没有考虑到,不过我认为它已经通过C语言基本展示了C++虚函数的原理。理解以上过程后,再去重新思考以下问题,可能会更清晰。

  1. C++ virtual运行时多态的实现原理?
  2. 派生类重写虚函数生效的条件是什么?
  3. 一个仅有虚析构函数的类大小为多少?
  4. 纯虚函数=0是什么含义?
  5. 虚函数为什么会稍慢些?其开销有哪些?
  6. 为什么构造函数不能是虚函数,而析构函数通常需要是虚函数?

参考

  1. https://github.com/google/googletest/blob/1d17ea141d2c11b8917d2c7d029f1c4e2b9769b2/googletest/include/gtest/gtest-matchers.h#L316
  2. https://stackoverflow.com/questions/78655663/why-does-matcherbase-class-in-gtest-matchers-h-define-a-vtable-and-what-is-its

如果你觉得本文对你有帮助,请点个赞,鼓励我持续创作;关注我,一起持续进步!

公众号:七昂的技术之旅

关注公众号,送你一份C++系列电子书。

相关推荐
concisedistinct10 分钟前
大数据开发语言 Scala(四):面向对象编程
大数据·开发语言·后端·scala·编程语言·面向对象
_Rookie._17 分钟前
java 单例模式
java·开发语言·单例模式
梦中北山34 分钟前
JWT安全分析
开发语言·网络·安全·web安全·php
Li&ShuaiShuai40 分钟前
Linux系统编程:信号
linux·运维·服务器·c++·信号
编程刘明1 小时前
学会拥抱Python六剑客,提高编程效率
开发语言·数据库·python·程序人生·职场和发展·学习方法
不吃饭的猪1 小时前
【无标题】
java·开发语言·docker
不会编程的小孩子1 小时前
python 基础综合应用——小开发
开发语言·python
happy_plus1 小时前
AutoX.js从某音分享链接解析出视频ID
开发语言·javascript·ecmascript
真果粒wrdms1 小时前
【sqlite3】联系人管理系统
linux·c语言·数据库·经验分享·笔记·sqlite