Pytorch在二进制层面比较张量中的各行是否相同,并返回不相同的各行

代码实例:

python 复制代码
def unique(arr):
    # Finds unique rows in arr and return their indices
    arr = arr.cpu().numpy()
    arr_ = np.ascontiguousarray(arr).view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[1])))
    _, idxs = np.unique(arr_, return_index=True)
    if torch.cuda.is_available():
        return torch.LongTensor(np.sort(idxs)).cuda()
    return torch.LongTensor(np.sort(idxs))

在 NumPy 中,.view() 方法用于创建数组的新视图,而不实际复制底层数据。在这种情况下,.view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[1]))) 的目的是将数组 arr 转换为一个以字节为单位的视图,以便后续的操作更加灵活。

具体来说,这一行代码的操作步骤如下:

  1. np.ascontiguousarray(arr): 确保数组是按照内存中的顺序(C 风格)连续存储的,这对于后续的视图操作很重要。

  2. .view(np.dtype((np.void, arr.dtype.itemsize * arr.shape[1]))): 创建一个新的视图,该视图将数组的每一行都视为一个字节块np.dtype((np.void, arr.dtype.itemsize * arr.shape[1]))定义了这个字节块的数据类型,其中 arr.dtype.itemsize * arr.shape[1] 表示每一行的总字节数。这样,整个数组被视为一个由字节块组成的虚拟类型数组。

  3. np.void 是 NumPy 中的数据类型,表示**"虚拟"类型**。它通常用于表示内存块,而不考虑具体的数据类型。在这里,np.void 被用于创建一个足够大的数据类型,以便能够容纳整个行数据

    在特定的上下文中,np.void 类型的一个实例可能包含多个数据类型的字段,但在这里它主要用于以字节的形式表示整个行的内容,而不考虑具体的数值类型。这使得在内存中视图上进行操作更加灵活,而不依赖于原始数据类型

这种方式的操作在某些情况下很有用,尤其是在处理复杂的数据结构或需要比较原始二进制数据时。在这里,可能是为了实现对行的快速唯一性检查,因为 .unique() 方法在处理复杂数据类型时可能会遇到一些问题。

相关推荐
澳鹏Appen16 小时前
数据集月度精选 | 高质量具身智能数据集:打开机器人“感知-决策-动作”闭环的钥匙
人工智能·机器人·具身智能
文人sec16 小时前
pytest1-接口自动化测试场景
软件测试·python·单元测试·pytest
q***710117 小时前
开源模型应用落地-工具使用篇-Spring AI-Function Call(八)
人工智能·spring·开源
极限实验室17 小时前
Coco AI 参选 Gitee 2025 最受欢迎开源软件!您的每一票,都是对中国开源的硬核支持
人工智能·开源
secondyoung17 小时前
Mermaid流程图高效转换为图片方案
c语言·人工智能·windows·vscode·python·docker·流程图
iFlow_AI17 小时前
iFlow CLI Hooks 「从入门到实战」应用指南
开发语言·前端·javascript·人工智能·ai·iflow·iflow cli
Shang1809893572617 小时前
THC63LVD1027D一款10位双链路LVDS信号中继器芯片,支持WUXGA分辨率视频数据传输THC63LVD1027支持30位数据通道方案
人工智能·考研·信息与通信·信号处理·thc63lvd1027d·thc63lvd1027
nini_boom18 小时前
**论文初稿撰写工具2025推荐,高效写作与智能辅助全解析*
大数据·python·信息可视化
飞哥数智坊18 小时前
项目太大,AI无法理解?试试这3种思路
人工智能·ai编程
桜吹雪18 小时前
手搓一个简易Agent
前端·人工智能·后端