模板编程—C++不支持模板分离编译分析

一、模板编译的特点

模板的编译相对于普通编程的编译,要复杂不少。比如一个模板函数,在不同的编译单元被include,那么会生成多个相同签名的函数,这就需要编译器后期进行相关的去重处理。而且这种代码多了,编译时,相关的编译部分体积也会变大,也就是常说的代码膨胀。另外,还需要处理ADL和CTAD(前面都分析过)等相关的细节,直到链接时对相关函数的具体定位(两阶段名称查找)等等,都相较于非模板代码编译需要更多的步骤和处理过程。

这里重点分析一下,为什么在模板编程中见到的模板代码都定义在头文件中,而不是象普通的代码声明在头文件而定义在cpp中,也就是分离编译的问题。

二、为什么不支持模板分离编译

那么为什么不支持模板的分离编译呢?这就需要从C++的编译过程和模板的特点说起。在C++编译的过程中,普通的代码是在一个个的CPP文件做为独立的编译单元进行编译的,然后在链接阶段进行相关函数等符号的链接。但是,模板有一个特点,即经常提到的延迟加载,即不调用的情况下一般不会生成实例,也就无法生成相关的符号链接。那么如果去链接,就会报链接错误。这也是为什么模板编译时,很多问题都体现在了链接错误上的一个重要原因(这里并未严格区分编译和链接,统一处理为编译)。

大多数情况下,模板的实例化都是隐式实现的。虽然这样做更符合传统的开发风格以及相关的技术处理,但这也从某种角度加强了开发者对模板编译与普通代码编译的过程,从而导致分离编译时的错误情况产生。

回想一下前面对模板的分析,模板就是一个"定义代码的空架子",它本身对编译器是没有多大作用的,只有将这个"空架子"填充上真实的数据类型后(即实例化)后,编译器才会真正的将其作为可处理的代码进行编译。有的资料上说模板是一种"蓝图",不过觉得说是一个空架子反而更简单。下面看一个简单的例子:

c++ 复制代码
//h
#ifndef TEMPLATEDEMO_H
#define TEMPLATEDEMO_H

class TemplateDemo {
public:
  TemplateDemo();
  template <typename T> void getData(const T &id);

private:
  void insDemo();
};

#endif // TEMPLATEDEMO_H
//cpp
#include "templatedemo.h"
#include <iostream>
TemplateDemo::TemplateDemo() {}
template <typename T>
void TemplateDemo::getData(const T &id) {
    std::cout << "this is get test!" << std::endl;
}
// void TemplateDemo::insDemo() { getData(100); }//注释则编译时链接有问题

//main.cpp
#include "templatedemo.h"
int main() {
  TemplateDemo t;
  int d = 100;
  t.getData(d);
  return 0;
}

当注释打开和不打开的情况下,可以发现编译后的汇编代码中就有getData是否出现的情况,看下面的结果:

复制代码
//注释
	.file	"templatedemo.cpp"
	.text
	.local	_ZStL8__ioinit
	.comm	_ZStL8__ioinit,1,1
	.align 2
	.globl	_ZN12TemplateDemoC2Ev
	.type	_ZN12TemplateDemoC2Ev, @function
_ZN12TemplateDemoC2Ev:
.LFB1732:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	movq	%rdi, -8(%rbp)
	nop
	popq	%rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE1732:
	.size	_ZN12TemplateDemoC2Ev, .-_ZN12TemplateDemoC2Ev
	.globl	_ZN12TemplateDemoC1Ev
	.set	_ZN12TemplateDemoC1Ev,_ZN12TemplateDemoC2Ev
	.type	_Z41__static_initialization_and_destruction_0ii, @function
_Z41__static_initialization_and_destruction_0ii:
.LFB2229:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	subq	$16, %rsp
	movl	%edi, -4(%rbp)
	movl	%esi, -8(%rbp)
	cmpl	$1, -4(%rbp)
	jne	.L4
	cmpl	$65535, -8(%rbp)
	jne	.L4
	leaq	_ZStL8__ioinit(%rip), %rax
	movq	%rax, %rdi
	call	_ZNSt8ios_base4InitC1Ev@PLT
	leaq	__dso_handle(%rip), %rax
	movq	%rax, %rdx
	leaq	_ZStL8__ioinit(%rip), %rax
	movq	%rax, %rsi
	movq	_ZNSt8ios_base4InitD1Ev@GOTPCREL(%rip), %rax
	movq	%rax, %rdi
	call	__cxa_atexit@PLT
.L4:
	nop
	leave
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE2229:
	.size	_Z41__static_initialization_and_destruction_0ii, .-_Z41__static_initialization_and_destruction_0ii
	.type	_GLOBAL__sub_I__ZN12TemplateDemoC2Ev, @function
_GLOBAL__sub_I__ZN12TemplateDemoC2Ev:
.LFB2230:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	movl	$65535, %esi
	movl	$1, %edi
	call	_Z41__static_initialization_and_destruction_0ii
	popq	%rbp
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE2230:
	.size	_GLOBAL__sub_I__ZN12TemplateDemoC2Ev, .-_GLOBAL__sub_I__ZN12TemplateDemoC2Ev
	.section	.init_array,"aw"
	.align 8
	.quad	_GLOBAL__sub_I__ZN12TemplateDemoC2Ev
	.hidden	__dso_handle
	.ident	"GCC: (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0"
	.section	.note.GNU-stack,"",@progbits
	.section	.note.gnu.property,"a"
	.align 8
	.long	1f - 0f
	.long	4f - 1f
	.long	5
0:
	.string	"GNU"
1:
	.align 8
	.long	0xc0000002
	.long	3f - 2f
2:
	.long	0x3
3:
	.align 8
4:
//未注释
	.file	"templatedemo.cpp"
.....
	.type	_ZN12TemplateDemo7insDemoEv, @function
_ZN12TemplateDemo7insDemoEv:
.LFB1735:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	subq	$32, %rsp
	movq	%rdi, -24(%rbp)
	movq	%fs:40, %rax
	movq	%rax, -8(%rbp)
	xorl	%eax, %eax
	movl	$100, -12(%rbp)
	leaq	-12(%rbp), %rdx
	movq	-24(%rbp), %rax
	movq	%rdx, %rsi
	movq	%rax, %rdi
	call	_ZN12TemplateDemo7getDataIiEEvRKT_
	nop
	movq	-8(%rbp), %rax
	subq	%fs:40, %rax
	je	.L3
	call	__stack_chk_fail@PLT
.L3:
	leave
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE1735:
	.size	_ZN12TemplateDemo7insDemoEv, .-_ZN12TemplateDemo7insDemoEv
	.section	.rodata
.LC0:
	.string	"this is get test!"
	.section	.text._ZN12TemplateDemo7getDataIiEEvRKT_,"axG",@progbits,_ZN12TemplateDemo7getDataIiEEvRKT_,comdat
	.align 2
	.weak	_ZN12TemplateDemo7getDataIiEEvRKT_
	.type	_ZN12TemplateDemo7getDataIiEEvRKT_, @function
_ZN12TemplateDemo7getDataIiEEvRKT_:
.LFB1996:
	.cfi_startproc
	endbr64
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	subq	$16, %rsp
	movq	%rdi, -8(%rbp)
	movq	%rsi, -16(%rbp)
	leaq	.LC0(%rip), %rax
	movq	%rax, %rsi
	leaq	_ZSt4cout(%rip), %rax
	movq	%rax, %rdi
	call	_ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@PLT
	movq	_ZSt4endlIcSt11char_traitsIcEERSt13basic_ostreamIT_T0_ES6_@GOTPCREL(%rip), %rdx
	movq	%rdx, %rsi
	movq	%rax, %rdi
	call	_ZNSolsEPFRSoS_E@PLT
	nop
	leave
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE1996:
	.size	_ZN12TemplateDemo7getDataIiEEvRKT_, .-_ZN12TemplateDemo7getDataIiEEvRKT_
	.text
	.type	_Z41__static_initialization_and_destruction_0ii, @function
_Z41__static_initialization_and_destruction_0ii:
.LFB2239:
......

说明:C++有改名机制

当然,大家也可以看完全编译后的文件,然后用readelf等命令查看类似的情况,可以更好理解这种情况。C++模板编译的最突出的特征就是两阶段查找和延迟实例化。这才是导致C++模板分离编译问题的根源。当然,这也恰恰是模板编程可以被利用的一些特点,通过延迟加载等降低编译的时间,提高效率。

这里简单说明一下模板编译的两阶段查找。第一阶段,用来处理定义时的不依赖的名称,可以理解为普通函数的不包括参数的相关内容的查找和验证。比如调用了一个模板函数调用了一个普通函数,如果找不到直接就报错;第二阶段则是在实例化时,模板代码已经可以看作是具体的"普通代码"了,此时需要对依赖的相关名称进行确定,包括参数、调用的模板函数等等,此时会触发ADL。延迟加载比较简单,就不再赘述了。

三、可分离编译的情况

虽然C++不支持模板的分离编译,但在实际的工程中可以看到有些情况是可以进行分离编译的。主要有以下几种情况:

普通类的模板函数 外部模板

  1. 编译单元(主要是分离编译的类文件)内部的使用
    这种情况其实和不分离编译没有本质的区别,在编译单元内可以看到模板相关的实现。特别是既然使用,就会实例化。看下面的例子:
c 复制代码
//h
class Demo{
public:
template <typename T>
void test(const T&);
private:
void call();
int m_a = 0;
};
//cpp
template <typename T> 
void Demo::test(const T &id) { 
}
void Demo::call() { test(m_a); }
  1. 显式实例化
    即使用模板的显式实例化,这样等同于有了普通的代码。看下面的代码:
c 复制代码
//在上面的cpp最后增加下面的显式实例化代码,其它都不变
template void Demo::test<int>(const int &id);
  1. 外部模板
    外部模板的使用本质和显式声明没有太大的区别,它主要是显式的让编译器不再生成过多的实例代码。比如仍然是上面的例子,但在main函数调用前增加相关的外部模板声明:
c 复制代码
extern template void TemplateDemo::getData<int>(const int &);
int main(){}
  1. C++20模块的引入
    模块机制的引入并不能解决模板的分离编译,但可以从逻辑上解决对头文件的依赖问题,让模板编程更容易使用。

四、分析总结

从上面的分析来看,只要能在一个编译单元中看到相关模板的实现,就编译没有问题。或者说没有外部调用只在内部定义(延迟加载)也可以,但这种情况意义不大。所谓分离编译与不分离的编译,对编译器来说,都必须能够找到相关的符号链接地址,否则就是报错。这才是问题的重点。至于C++中模板为什么不使用分离编译,原因就在于两阶段查找和延迟加载,导致链接问题。当然如果强行使用分离编译,可能会引发更多的问题会付出更多的代价,反而得不偿失。

五、总结

分离编译有分离编译的优点比如容易定位错误位置、共享模块等;但对于模板来说,可能不分离编译能更好的支持模板的特性,这才是重点。正如反复提及的,最合适的就是最好的,这才是解决问题的态度。

相关推荐
寻寻觅觅☆6 小时前
东华OJ-基础题-106-大整数相加(C++)
开发语言·c++·算法
fpcc6 小时前
并行编程实战——CUDA编程的Parallel Task类型
c++·cuda
ceclar1238 小时前
C++使用format
开发语言·c++·算法
lanhuazui108 小时前
C++ 中什么时候用::(作用域解析运算符)
c++
charlee448 小时前
从零实现一个生产级 RAG 语义搜索系统:C++ + ONNX + FAISS 实战
c++·faiss·onnx·rag·语义搜索
老约家的可汗8 小时前
初识C++
开发语言·c++
crescent_悦9 小时前
C++:Product of Polynomials
开发语言·c++
小坏坏的大世界9 小时前
CMakeList.txt模板与 Visual Studio IDE 操作对比表
c++·visual studio
乐观勇敢坚强的老彭9 小时前
c++寒假营day03
java·开发语言·c++
愚者游世10 小时前
brace-or-equal initializers(花括号或等号初始化器)各版本异同
开发语言·c++·程序人生·面试·visual studio