C# simd指令之MaskMove

**MaskMove指令说明:**该方法将掩码向量中的每个非零元素对应的源向量中的元素移动到内存地址指定的位置。如果掩码中的元素为零,则对应的内存位置不会被修改。

MaskMove指令接受三个参数(source、mask、address):

**源向量(source):**包含要移动的数据的 128 位向量。

**掩码向量(mask):**也是一个 128 位向量,用于控制哪些元素将被移动到内存地址。掩码中的每个元素(sbyte)将决定相应位置的元素是否被写入内存。如果掩码中的元素为非零值,则对应的元素将被写入;如果为零,则不写入。

**内存地址(address):**指向目标内存位置的指针,将从这里开始写入数据。

示例

将source向量中的元素全部移到tmpData数组中,这样我们将向量拷贝到数组中的时候就可以用到了

cs 复制代码
Random random = new Random();
int size= Vector128<byte>.Count;
byte[] data = new byte[size << 1];
random.NextBytes(data);
byte[] tmpData = new byte[size];
fixed (byte* dataPtr = data, tmpPtr = tmpData)
{
    Vector128<byte> source = *(Vector128<byte>*)dataPtr;
    Vector128<byte> mask = Vector128.Create((byte)255);
    Sse2.MaskMove(source, mask, tmpPtr);
}

如果需要source指定位置的元素不移动,只需要在mask 指定位置的元素设置为0

cs 复制代码
 // 设置mask第一个元素为0 
mask = mask.WithElement(0, (byte)0);
// source的第一个元素将不在移动到tmpData
Sse2.MaskMove(source, mask, tmpPtr);

也可以把向量复制移动到另外的向量,我们就可以实现向量深拷贝

cs 复制代码
Vector128<byte> newVector;
Sse2.MaskMove(source, mask, (byte*)&newVector);
相关推荐
聚客AI12 小时前
🙋‍♀️Transformer训练与推理全流程:从输入处理到输出生成
人工智能·算法·llm
大怪v14 小时前
前端:人工智能?我也会啊!来个花活,😎😎😎“自动驾驶”整起!
前端·javascript·算法
惯导马工16 小时前
【论文导读】ORB-SLAM3:An Accurate Open-Source Library for Visual, Visual-Inertial and
深度学习·算法
骑自行车的码农18 小时前
【React用到的一些算法】游标和栈
算法·react.js
博笙困了18 小时前
AcWing学习——双指针算法
c++·算法
moonlifesudo19 小时前
322:零钱兑换(三种方法)
算法
NAGNIP2 天前
大模型框架性能优化策略:延迟、吞吐量与成本权衡
算法
美团技术团队2 天前
LongCat-Flash:如何使用 SGLang 部署美团 Agentic 模型
人工智能·算法
Fanxt_Ja2 天前
【LeetCode】算法详解#15 ---环形链表II
数据结构·算法·leetcode·链表
侃侃_天下2 天前
最终的信号类
开发语言·c++·算法