C# SIMD向量加速运算简单例子

cs 复制代码
 public unsafe struct VectorOperation<T> where T : struct, INumber<T>
    {
        private T[]? _data = null;
        public VectorOperation()
        {

        }
        public VectorOperation(T[] values)
        {
            _data = values;
        }
        public T[] Data
        {
            get => _data;
            set => _data = value;
        }
        /// <summary>
        /// 累乘
        /// </summary>
        /// <param name="array"></param>
        /// <param name="count"></param>
        /// <returns></returns>
        public T Multiply(T[] array, int count)
        {
            int vectorSize = Vector<T>.Count;
            Vector<T> accVector = Vector<T>.One;
            int i;
            T result = T.One;
            for (i = 0; i <= count - vectorSize; i += vectorSize)
            {
                Vector<T> v = new Vector<T>(array, i);
                accVector = Vector.Multiply(accVector, v);
            }

            for (int j = 0; j < vectorSize; j++)
            {
                result *= accVector[j];
            }

            for (; i < count; i++)
            {
                result *= array[i];
            }

            return result;
        }

        /// <summary>
        /// 元素累加
        /// </summary>
        /// <param name="array"></param>
        /// <param name="count"></param>
        /// <returns></returns>
        public T Sum(T[] array, int count)
        {
            int vectorSize = Vector<T>.Count;
            T result = T.Zero;
            int i;
            for (i = 0; i <= count - vectorSize; i += vectorSize)
            {
                Vector<T> v = new Vector<T>(array, i);
                result += Vector.Sum(v);
            }
            for (; i < array.Length; i++)
            {
                result += array[i];
            }
            return result;
        }

      
    }

上面就简单做了元素累加与累乘,速度也高。

SIMD 是一种在现代 CPU 中广泛使用的并行计算技术。在 SIMD 中,单一的指令可以同时对多个数据进行操作。例如,如果你有两个包含四个元素的数组,你可以使用一条 SIMD 指令来同时对这两个数组的所有元素进行加法运算,而不是分别对每对元素进行加法运算。

复制代码
int vectorSize = Vector<T>.Count;s是对应值类型数组元素数量。

然后for循环vectorSize长度数组一次操作,比如加或者乘;

复制代码
for (; i < array.Length; i++)h后面这个循环是对剩余元素操作,比如int是8bit,一次操作的元素数量是8个,一共有17个元素,操作2次剩余1个元素,剩余的元素另外进行运算。

在此操作上可以加速图像运算,在没有GPU的电脑上运行是非常快了的。

相关推荐
YuTaoShao几秒前
【LeetCode 热题 100】142. 环形链表 II——快慢指针
java·算法·leetcode·链表
CCF_NOI.8 分钟前
(普及−)B3629 吃冰棍——二分/模拟
数据结构·c++·算法
Json____32 分钟前
使用python的 FastApi框架开发图书管理系统-前后端分离项目分享
开发语言·python·fastapi·图书管理系统·图书·项目练习
运器1231 小时前
【一起来学AI大模型】支持向量机(SVM):核心算法深度解析
大数据·人工智能·算法·机器学习·支持向量机·ai·ai编程
人生在勤,不索何获-白大侠1 小时前
day16——Java集合进阶(Collection、List、Set)
java·开发语言
Zedthm1 小时前
LeetCode1004. 最大连续1的个数 III
java·算法·leetcode
LIN-JUN-WEI1 小时前
[ESP32]VSCODE+ESP-IDF环境搭建及blink例程尝试(win10 win11均配置成功)
c语言·开发语言·ide·vscode·单片机·学习·编辑器
神的孩子都在歌唱1 小时前
3423. 循环数组中相邻元素的最大差值 — day97
java·数据结构·算法
YuTaoShao1 小时前
【LeetCode 热题 100】73. 矩阵置零——(解法一)空间复杂度 O(M + N)
算法·leetcode·矩阵
望获linux2 小时前
【Linux基础知识系列】第四十三篇 - 基础正则表达式与 grep/sed
linux·运维·服务器·开发语言·前端·操作系统·嵌入式软件