大数据计算里的加速利器-向量化

文章目录

向量化

通俗来说在列式存储的数据库里来说,如果要对数据进行累加运行,如果每次只能操作一个数,必然效率低下,向量操作就是就是采用SIMD技术,通过一个指令,实现对多个数据的处理

使用场景

通常会用在列式数据库,作分析数据使用。 比如clickhouse

代码说明

通常代码来详细展示使用向量和传统方式实现相加的实现方式

bash 复制代码
#include <iostream>
#include <arm_neon.h>  // 包含 ARM NEON SIMD 指令集的头文件
#include <chrono>      // 用于计时的头文件

void vector_add_neon(const float32_t* a, const float32_t* b, float32_t* result, size_t n) {
    size_t i = 0;
    for (; i + 4 <= n; i += 4) {
        float32x4_t va = vld1q_f32(a + i);    // 加载 4 个浮点数到 NEON 寄存器 va
        float32x4_t vb = vld1q_f32(b + i);    // 加载 4 个浮点数到 NEON 寄存器 vb
        float32x4_t vr = vaddq_f32(va, vb);   // 对寄存器 va 和 vb 中的浮点数逐元素相加
        vst1q_f32(result + i, vr);            // 将结果存储回内存
    }
    for (; i < n; ++i) {
        result[i] = a[i] + b[i];
    }
}

void vector_add_basic(const float* a, const float* b, float* result, size_t n) {
    for (size_t i = 0; i < n; ++i) {
        result[i] = a[i] + b[i];
    }
}

int main() {
    const size_t n = 1000000;  // 数组长度增加到 100 万
    float32_t a[n];
    float32_t b[n];
    float32_t result_neon[n];
    float32_t result_basic[n];

    // 初始化数组 a 和 b
    for (size_t i = 0; i < n; ++i) {
        a[i] = static_cast<float32_t>(i);
        b[i] = static_cast<float32_t>(i * 2);
    }

    // 测量使用 NEON SIMD 的计算时间
    auto start_neon = std::chrono::high_resolution_clock::now();
    vector_add_neon(a, b, result_neon, n);
    auto end_neon = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed_neon = end_neon - start_neon;

    // 测量普通循环计算时间
    auto start_basic = std::chrono::high_resolution_clock::now();
    vector_add_basic(a, b, result_basic, n);
    auto end_basic = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> elapsed_basic = end_basic - start_basic;

    // 输出结果
    std::cout << "NEON SIMD 加速耗时: " << elapsed_neon.count() << " 秒\n";
    std::cout << "普通循环耗时: " << elapsed_basic.count() << " 秒\n";

    return 0;
}
相关推荐
tan180°2 小时前
MySQL表的操作(3)
linux·数据库·c++·vscode·后端·mysql
彭祥.3 小时前
Jetson边缘计算主板:Ubuntu 环境配置 CUDA 与 cudNN 推理环境 + OpenCV 与 C++ 进行目标分类
c++·opencv·分类
lzb_kkk4 小时前
【C++】C++四种类型转换操作符详解
开发语言·c++·windows·1024程序员节
胖大和尚5 小时前
clang 编译器怎么查看在编译过程中做了哪些优化
c++·clang
钱彬 (Qian Bin)6 小时前
一文掌握Qt Quick数字图像处理项目开发(基于Qt 6.9 C++和QML,代码开源)
c++·开源·qml·qt quick·qt6.9·数字图像处理项目·美观界面
双叶8367 小时前
(C++)学生管理系统(正式版)(map数组的应用)(string应用)(引用)(文件储存的应用)(C++教学)(C++项目)
c语言·开发语言·数据结构·c++
源代码•宸7 小时前
C++高频知识点(二)
开发语言·c++·经验分享
jyan_敬言9 小时前
【C++】string类(二)相关接口介绍及其使用
android·开发语言·c++·青少年编程·visual studio
liulilittle9 小时前
SNIProxy 轻量级匿名CDN代理架构与实现
开发语言·网络·c++·网关·架构·cdn·通信
tan77º10 小时前
【Linux网络编程】Socket - UDP
linux·服务器·网络·c++·udp