C++性能优化之访存优化(未完)

数据预取

数据预取是一种提前为处理器准备数据机制,主要有硬件预取和软件预取。

硬件是根据程序运行状态预测,硬件机制。

软件是使用预取指令或者内置函数,内置函数就是编译器自带的函数,_builtin_prefetch(void * addr, rw, locality);第一个采纳数是内存指针数据,第二个是读写,第三个预取数据的时间局部性,0-3,越大代表时间局部性越强。

cpp 复制代码
#include <iostream>
#include <chrono>
#include <vector>
#include <cstdint>

// 数据大小 (1000万元素)
constexpr size_t DATA_SIZE = 10000000;

// 测试不使用预取的内存访问
uint64_t testWithoutPrefetch(const std::vector<int>& data) {
    uint64_t sum = 0;
    auto start = std::chrono::high_resolution_clock::now();
    
    for (size_t i = 0; i < data.size(); ++i) {
        sum += data[i];
    }
    
    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count();
    
    std::cout << "不使用预取 - 耗时: " << duration << " 毫秒" << std::endl;
    return sum;
}

// 测试使用预取的内存访问
uint64_t testWithPrefetch(const std::vector<int>& data) {
    uint64_t sum = 0;
    auto start = std::chrono::high_resolution_clock::now();
    
    // 预取距离当前位置512个元素后的内存地址
    constexpr size_t PREFETCH_DISTANCE = 512;
    
    for (size_t i = 0; i < data.size(); ++i) {
        if (i + PREFETCH_DISTANCE < data.size()) {
            // 预取指令: 读取, 非时态, 中等距离
            __builtin_prefetch(&data[i + PREFETCH_DISTANCE], 0, 1);
        }
        sum += data[i];
    }
    
    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count();
    
    std::cout << "使用预取 - 耗时: " << duration << " 毫秒" << std::endl;
    return sum;
}

int main() {
    // 初始化测试数据
    std::vector<int> data(DATA_SIZE);
    for (size_t i = 0; i < DATA_SIZE; ++i) {
        data[i] = static_cast<int>(i);
    }
    
    // 预热缓存
    uint64_t warmup = testWithoutPrefetch(data);
    (void)warmup; // 避免未使用变量警告
    
    std::cout << "\n正式测试:" << std::endl;
    
    // 测试不使用预取
    uint64_t sum1 = testWithoutPrefetch(data);
    
    // 测试使用预取
    uint64_t sum2 = testWithPrefetch(data);
    
    // 验证结果一致性
    std::cout << "\n验证结果: " << (sum1 == sum2 ? "正确" : "错误") << std::endl;
    
    return 0;
}
相关推荐
睡美人的小仙女1272 小时前
Threejs加载环境贴图报错Bad File Format: bad initial token
开发语言·javascript·redis
rayufo2 小时前
【工具】列出指定文件夹下所有的目录和文件
开发语言·前端·python
RANCE_atttackkk2 小时前
[Java]实现使用邮箱找回密码的功能
java·开发语言·前端·spring boot·intellij-idea·idea
缺点内向3 小时前
C#编程实战:如何为Word文档添加背景色或背景图片
开发语言·c#·自动化·word·.net
一起养小猫3 小时前
Flutter for OpenHarmony 实战:记账应用数据统计与可视化
开发语言·jvm·数据库·flutter·信息可视化·harmonyos
zhougl9963 小时前
Java 所有关键字及规范分类
java·开发语言
java1234_小锋4 小时前
Java高频面试题:MyISAM索引与InnoDB索引的区别?
java·开发语言
2501_944525544 小时前
Flutter for OpenHarmony 个人理财管理App实战 - 支出分析页面
android·开发语言·前端·javascript·flutter
Bella的成长园地4 小时前
面试中关于 c++ async 的高频面试问题有哪些?
c++·面试
彷徨而立4 小时前
【C/C++】什么是 运行时库?运行时库 /MT 和 /MD 的区别?
c语言·c++