【一天一点.NET小知识】运用向量Vector<T>加速求和计算

随着 .NET 版本的演进,从 .NET Standard 2.0 版本开始,支持 Vector<T> 类型。

.NET 8.0 版本开始,大量在 Runtime 提供的各个组件中运用向量计算,​特别是 Linq。
Vector
类型
:表示指定数值类型(适用于并行算法的低级别优化)的单个向量。

假如我们有一个求和函数接受一个int数组入参,当它的长度大于等于8及其倍数以上时,那么我们就可以考虑使用向量Vector<T>加速求和计算。

以下是使用了向量的求和函数代码:

csharp 复制代码
internal class Program
{
    static void Main(string[] args)
    {
        int[] array = Enumerable.Range(1, 32).ToArray();
        int result = Sum(array);
        Console.WriteLine(result);
        Console.ReadKey();
    }

    public static int Sum(int[] numbers)
    {
        ReadOnlySpan<int> span = new ReadOnlySpan<int>(numbers);
        ref int ptr = ref MemoryMarshal.GetReference(span);
        int result = 0;
        int vectorSize = Vector<int>.Count;
        int index;
        int remainder = span.Length % vectorSize;
        int vectorLength = span.Length - remainder;
        Vector<int> vector = Vector<int>.Zero;
        for (index = 0; index < vectorLength; index += vectorSize)
        {
            //Vector<int> vector2 = new Vector<int>(span.Slice(index, vectorSize));
            ref byte address = ref Unsafe.As<int, byte>(ref Unsafe.Add(ref Unsafe.AsRef(in ptr), index));
            Vector<int> vector2 = Unsafe.ReadUnaligned<Vector<int>>(ref address);
            vector += vector2;
        }

        result += Vector.Dot<int>(vector, Vector<int>.One);
        for (; index < span.Length; index++)
        {
            result += Unsafe.Add(ref ptr, index);
        }

        return result;
    }
}

以下是相减函数代码:

csharp 复制代码
static int Sub(int[] numbers)
{
	ReadOnlySpan<int> span = new ReadOnlySpan<int>(numbers);
	ref int ptr = ref MemoryMarshal.GetReference(span);
	int result = 0;
	int vectorSize = Vector<int>.Count;
	int index;
	int remainder = span.Length % vectorSize;
	int vectorLength = span.Length - remainder;
	for (index = 0; index < vectorLength; index += vectorSize)
	{
		ref byte address = ref Unsafe.As<int, byte>(ref Unsafe.Add(ref Unsafe.AsRef(in ptr), index));
		Vector<int> vector = Unsafe.ReadUnaligned<Vector<int>>(ref address);
		result -= Vector.Dot<int>(vector, Vector<int>.One);
	}

	for (; index < span.Length; index++)
	{
		result -= Unsafe.Add(ref ptr, index);
	}

	return result + 2;
}

其它运算,例如相减,也是同理。

以上代码,均可以在 .NET Standard 2.0 及以上版本运行。

当我们向量 Vector<T> 之后,特别是在一些频繁调用计算的场景,将获得指数量级的性能提升。
需要注意的是,向量 Vector<T> 依赖 CPU 硬件的 SIMD 指令集支持,在一些相对较旧的 古董CPU,可能不支持。

PS:

相关推荐
m5655bj11 小时前
通过 C# 将 RTF 文档转换为图片
开发语言·c#
MM_MS12 小时前
WinForm+C#小案例--->写一个记事本程序
开发语言·计算机视觉·c#·visual studio
步步为营DotNet14 小时前
深入理解IAsyncEnumerable:.NET中的异步迭代利器
服务器·前端·.net
浪客川15 小时前
高效日志分离器:一键筛选关键信息
开发语言·windows·c#
小熊熊知识库15 小时前
C# EF.core 介绍以及高性能使用
开发语言·c#
雨疏风骤124016 小时前
【FreeRTOS】任务、任务状态
开发语言·stm32·c#·rtos
️公子17 小时前
传奇游戏集成系统
游戏·c#
玩泥巴的18 小时前
强的飞起的 Roslyn 编译时代码生成,实现抽象类继承与依赖注入的自动化配置
c#·.net·代码生成·roslyn
mudtools18 小时前
强的飞起的 Roslyn 编译时代码生成,实现抽象类继承与依赖注入的自动化配置
c#·.net