C++ 性能优化

引言

在算法竞赛或高性能程序开发中,C++ 代码的运行效率往往决定成败。本文总结 10 个实用的性能优化技巧,从代码编写到编译配置全方位提升程序速度。

一、基础优化:减少不必要的开销
二、数据结构优化
三、循环与分支优化
  1. 输入输出优化

    禁用同步流与解除绑定,速度提升数倍:

    cpp 复制代码
    ios::sync_with_stdio(false);
    cin.tie(0);
    cout.tie(0);
  2. 极端场景下使用scanf/printffread

  3. 避免全局变量初始化

    全局变量默认初始化会耗时,局部变量在栈上分配更高效。

  4. 减少函数调用开销

    热点函数添加inline关键字,短函数优先写成内联形式。

  5. 优先使用数组而非容器
    int a[1000]vector<int> 访问更快,避免动态内存分配。

  6. 循环展开

    减少循环变量自增和判断次数:

    cpp 复制代码
    // 优化前
    for (int i = 0; i < n; i++) sum += a[i];
    
    // 优化后(n为4的倍数)
    for (int i = 0; i < n; i += 4) {
        sum += a[i] + a[i+1] + a[i+2] + a[i+3];
    }
  7. 容器选择技巧

    • 频繁插入删除用list,随机访问用vector

    • 哈希表优先用unordered_map,但需注意哈希冲突

    • 分支预测友好

      避免在循环内使用复杂条件判断,可通过查表法替代。

    四、编译选项优化

    在 GCC 中添加以下选项:

    cpp 复制代码
    g++ -O2 -march=native -ffast-math -o program program.cpp
    • -O2:启用基本优化
    • -march=native:针对本地 CPU 架构优化
    • -ffast-math:牺牲部分精度换取速度(慎用)
    五、效果测试

    以 1e8 次整数加法为例,优化前后对比:

    • 未优化:1.2s
    • 启用 O2 + 循环展开:0.3s(提速 4 倍)
相关推荐
老四啊laosi2 分钟前
[C++进阶] 24. 哈希表封装unordered_map && unordered_set
c++·哈希表·封装·unordered_map·unordered_set
014-code28 分钟前
订单超时取消与库存回滚的完整实现(延迟任务 + 状态机)
java·开发语言
妙为34 分钟前
银河麒麟V4下编译Qt5.12.12源码
c++·qt·国产化·osg3.6.5·osgearth3.2·银河麒麟v4
lly20240644 分钟前
组合模式(Composite Pattern)
开发语言
游乐码1 小时前
c#泛型约束
开发语言·c#
Dontla1 小时前
go语言Windows安装教程(安装go安装Golang安装)(GOPATH、Go Modules)
开发语言·windows·golang
chushiyunen1 小时前
python rest请求、requests
开发语言·python
铁东博客1 小时前
Go实现周易大衍筮法三变取爻
开发语言·后端·golang
baidu_huihui1 小时前
在 CentOS 9 上安装 pip(Python 的包管理工具)
开发语言·python·pip
南 阳1 小时前
Python从入门到精通day63
开发语言·python