深入探究 C++ 字符串

上一篇文章中我们聊到了 C 语言字符串的相关内容。比如 C 字符串字面量是只读数据------不可修改。如果需要修改只能将只读数据拷贝到字符数组中------char *

C++ 的 STL 提供了一个字符串类------std::string 简化了大量的字符串操作,而且同样也支持 C 的字符串字面量来初始化,比如下面这样:

c 复制代码
std::string str = "C and C++ Strings"; 

这篇文章,我们接着上一篇文章的内容,继续探讨下面几个关于std::string 的问题:

  1. C++ string 在通过字符串字面量初始化时有拷贝发生吗?
  2. C++ string 在与其它字符串字面量拼接(+操作)时有拷贝发生吗?

std::string 类的初始化

首先 std::string 是可变量,也就说我们可以增加、缩减或者修改内容。而 C 字符串字面量都不可修改的,因此我们不难推测出用 C 字符串字面量初始化 std::string 类时也会有拷贝发生。在上一篇文章中我们举了这样一个例子:

c 复制代码
char[] str = "C and C++ Strings"; 

其中隐含了一个点------用栈空间来储存该字符数组。同样我们也可以用堆空间来存储,像下面这样:

c 复制代码
  const int str_len = 100;
  char *ptr = (char *)malloc(str_len);
  if (ptr == NULL) {
    return;
  }
  strcpy(ptr, "C and C++ strings");
  printf("string: %s, length: %ld", ptr, strlen(ptr));
  free(ptr);

std::string 其实就是把上面的两种处理重载成了一个赋值运算符,并在内部封装了一个字符数组。

因为栈空间有限不可能全部使用栈空间存储字符串,堆空间虽然理论上可以无限大,但是频繁申请小内存也会导致内存碎片问题。因此,在 GCC 和 Clang 编译器的 STL 实现中,如果字面量长度小于等于 16(包含终止符)则会在栈上储存,否则在堆上存储。

std::string 的拼接

使用 std::string 的过程中,我们也会经常用 + 来拼接字符串,像下面这样:

c 复制代码
std::string str = "C and C++";
std::string str1 = str + " strings";

我们不妨大胆推测一下。

因为 std::string 是可修改的,拼接字符串字面量务必需要拷贝到 std::string 内部的字符数组中。根据 GCC 和 Clang 针对小字符串的优化,我们也可以推测,如果两个字符串的长度小于等于 16 则存放在栈中,否则储存在堆中。

那怎么验证呢?

我们可以重载 new 运算符,增加日志信息。这样每次使用 new 申请堆内存时便有日志打印。

c 复制代码
void* operator new(size_t count) {
  std::cout << "\tAllocate " << count << " bytes\n";
  return malloc(count);
}

剩下的就交给大家,写代码验证一下吧。如果有问题,欢迎到评论区讨论。

思考问题

  1. 怎样避免字面量初始化 std::string 的拷贝呢?

参考资料

C++17 -- Avoid Copying with std::string_view -- MC++ BLOG (modernescpp.com)

相关推荐
Fantastic_sj11 分钟前
[代码例题] var 和 let 在循环中的作用域差异,以及闭包和事件循环的影响
开发语言·前端·javascript
weixin_462446231 小时前
EasyExcel 动态修改模板 Sheet 名称:自定义 SheetWriteHandler 拦截器
java·开发语言·easyexcel
汉克老师1 小时前
CCF-NOI2025第二试题目与解析(第二题、集合(set))
c++·算法·noi·子集卷积·sos dp·mod 异常
绝世唐门三哥1 小时前
使用Intersection Observer js实现超出视口固定底部按钮
开发语言·前端·javascript
Ayu阿予1 小时前
C++从源文件到可执行文件的过程
开发语言·c++
C++业余爱好者1 小时前
JVM优化入门指南:JVM垃圾收集器(GC)介绍
java·开发语言·jvm
福尔摩斯张1 小时前
基于C++的UDP网络通信系统设计与实现
linux·c语言·开发语言·网络·c++·tcp/ip·udp
Trouvaille ~1 小时前
【Java篇】基石与蓝图::Object 类与抽象类的双重奏
java·开发语言·javase·抽象类·类与对象·基础入门·object类
hkNaruto1 小时前
【规范】Linux平台C/C++程序版本发布调试规范手册 兼容银河麒麟
linux·c语言·c++
卜锦元1 小时前
Golang中make()和new()的区别与作用?
开发语言·后端·golang