C# SIMD向量加速运算简单例子

cs 复制代码
 public unsafe struct VectorOperation<T> where T : struct, INumber<T>
    {
        private T[]? _data = null;
        public VectorOperation()
        {

        }
        public VectorOperation(T[] values)
        {
            _data = values;
        }
        public T[] Data
        {
            get => _data;
            set => _data = value;
        }
        /// <summary>
        /// 累乘
        /// </summary>
        /// <param name="array"></param>
        /// <param name="count"></param>
        /// <returns></returns>
        public T Multiply(T[] array, int count)
        {
            int vectorSize = Vector<T>.Count;
            Vector<T> accVector = Vector<T>.One;
            int i;
            T result = T.One;
            for (i = 0; i <= count - vectorSize; i += vectorSize)
            {
                Vector<T> v = new Vector<T>(array, i);
                accVector = Vector.Multiply(accVector, v);
            }

            for (int j = 0; j < vectorSize; j++)
            {
                result *= accVector[j];
            }

            for (; i < count; i++)
            {
                result *= array[i];
            }

            return result;
        }

        /// <summary>
        /// 元素累加
        /// </summary>
        /// <param name="array"></param>
        /// <param name="count"></param>
        /// <returns></returns>
        public T Sum(T[] array, int count)
        {
            int vectorSize = Vector<T>.Count;
            T result = T.Zero;
            int i;
            for (i = 0; i <= count - vectorSize; i += vectorSize)
            {
                Vector<T> v = new Vector<T>(array, i);
                result += Vector.Sum(v);
            }
            for (; i < array.Length; i++)
            {
                result += array[i];
            }
            return result;
        }

      
    }

上面就简单做了元素累加与累乘,速度也高。

SIMD 是一种在现代 CPU 中广泛使用的并行计算技术。在 SIMD 中,单一的指令可以同时对多个数据进行操作。例如,如果你有两个包含四个元素的数组,你可以使用一条 SIMD 指令来同时对这两个数组的所有元素进行加法运算,而不是分别对每对元素进行加法运算。

复制代码
int vectorSize = Vector<T>.Count;s是对应值类型数组元素数量。

然后for循环vectorSize长度数组一次操作,比如加或者乘;

复制代码
for (; i < array.Length; i++)h后面这个循环是对剩余元素操作,比如int是8bit,一次操作的元素数量是8个,一共有17个元素,操作2次剩余1个元素,剩余的元素另外进行运算。

在此操作上可以加速图像运算,在没有GPU的电脑上运行是非常快了的。

相关推荐
天选之女wow4 分钟前
【代码随想录算法训练营——Day43(Day42周日休息)】动态规划——300.最长递增子序列、674.最长连续递增序列、718.最长重复子数组
算法·leetcode·动态规划
Yeats_Liao7 分钟前
Go Web 编程快速入门 01 - 环境准备与第一个 Web 应用
开发语言·前端·golang
卓码软件测评7 分钟前
第三方CMA软件测试机构:页面JavaScript动态渲染生成内容对网站SEO的影响
开发语言·前端·javascript·ecmascript
*才华有限公司*12 分钟前
《爬虫进阶之路:从模拟浏览器到破解动态加载的实战指南》
开发语言·python
敲代码的嘎仔32 分钟前
JavaWeb零基础学习Day4——Maven
java·开发语言·学习·算法·maven·javaweb·学习方法
W.Buffer39 分钟前
设计模式-工厂模式:解耦对象创建的设计艺术
java·开发语言·设计模式
聪明的笨猪猪1 小时前
hot 100 (1)—— 两数之和(哈希)
java·经验分享·算法·哈希算法
梵得儿SHI1 小时前
Java 注解与反射实战:自定义注解从入门到精通
java·开发语言·注解·自定义注解·元注解·控制注解的作用·声明式编程思想
沐知全栈开发1 小时前
Foundation 网格实例
开发语言
_dindong1 小时前
牛客101:链表
数据结构·c++·笔记·学习·算法·链表