C# simd指令之MaskMove

**MaskMove指令说明:**该方法将掩码向量中的每个非零元素对应的源向量中的元素移动到内存地址指定的位置。如果掩码中的元素为零,则对应的内存位置不会被修改。

MaskMove指令接受三个参数(source、mask、address):

**源向量(source):**包含要移动的数据的 128 位向量。

**掩码向量(mask):**也是一个 128 位向量,用于控制哪些元素将被移动到内存地址。掩码中的每个元素(sbyte)将决定相应位置的元素是否被写入内存。如果掩码中的元素为非零值,则对应的元素将被写入;如果为零,则不写入。

**内存地址(address):**指向目标内存位置的指针,将从这里开始写入数据。

示例

将source向量中的元素全部移到tmpData数组中,这样我们将向量拷贝到数组中的时候就可以用到了

cs 复制代码
Random random = new Random();
int size= Vector128<byte>.Count;
byte[] data = new byte[size << 1];
random.NextBytes(data);
byte[] tmpData = new byte[size];
fixed (byte* dataPtr = data, tmpPtr = tmpData)
{
    Vector128<byte> source = *(Vector128<byte>*)dataPtr;
    Vector128<byte> mask = Vector128.Create((byte)255);
    Sse2.MaskMove(source, mask, tmpPtr);
}

如果需要source指定位置的元素不移动,只需要在mask 指定位置的元素设置为0

cs 复制代码
 // 设置mask第一个元素为0 
mask = mask.WithElement(0, (byte)0);
// source的第一个元素将不在移动到tmpData
Sse2.MaskMove(source, mask, tmpPtr);

也可以把向量复制移动到另外的向量,我们就可以实现向量深拷贝

cs 复制代码
Vector128<byte> newVector;
Sse2.MaskMove(source, mask, (byte*)&newVector);
相关推荐
用户938515635075 小时前
从 O(n²) 到 O(nlogn):一文读懂快速排序的“快”与“妙”
javascript·算法
To_OC6 小时前
手写快排次次翻车?别死背快排模板了,这才是面试官想听的底层逻辑
javascript·算法·排序算法
饼干哥哥6 小时前
Reddit VOC调研太慢?搭一个AI专家团队半小时洞察任何品类|以猫用饮水机为例
人工智能·算法·ai编程
地平线开发者8 小时前
Transformer模型部署之性能优化指南
算法
地平线开发者8 小时前
人在途中:从“编译失败”到“模型可落地”——CUDA 自定义算子
算法·自动驾驶
半个落月11 小时前
从递归到快速排序:用 JavaScript 把分治思想讲明白
javascript·算法·面试
小月土星12 小时前
JavaScript 快速排序:从 pivot、双指针到分治思想
javascript·算法·面试
小月土星12 小时前
JavaScript 递归入门:从 1 到 n 求和,再到数组扁平化
javascript·算法·面试
To_OC1 天前
LC 1 两数之和:面试第一道必考题,暴力解法直接被面试官 pass
javascript·算法·leetcode