【pytorch11】高阶操作

高阶操作

  • Where
  • Gather

where

三个参数,第一个是condition,第二个参数是源头A,第三个参数是源头B,也就是说有两项数据A和B,C有可能来自于A也有可能来自于B,如果全部来自于A的话直接赋值给A,如果部分来自A的话可以例如C[0]=A[0],C[1]=B[1],如果C[0,0,1]=A[0,0,1],C[0,0,2]=B[0,0,2],C[0,0,3]=A[0,0,3]说明C的来源是比较乱的,没有一个特别好的规律,把这个乱的规则写在condition表里,condition的shape与A和B是一样的


为什么需要这个操作?

没有一个很好规则来帮助你赋值,简单的复制方法是不可行的,使用Python的逻辑控制比如for,比如用双重for循环加条件语句C[i,j]=A[i,j],但是存在一个问题,这段代码是运行在CPU上的就没有GPU的加速功能,因此要完成这样一个简单的分别采样或者分别取值的过程,照python代码的情况是用CPU控制的没有并行,生成一个condition,赋值语句就可以高度并行化

例如有一个场景,有一张表存储的是动物的名字[dog,cat,whale],但是pytoch是没有string类型的这里只是示意,通过神经网络得到相对编号的索引比如说第一个动物得到的索引是1那就意味着是cat,第二个动物对应的索引是0那就是对应的dog,第三个动物对应的索引是1,第四个动物得到的索引是2,即[1,0,1,2],表一共有3个种类,但是我们要查4次操作,所以查表的操作会生成[cat,dog,cat,whale]所以生成的shape和你提供要查找的shape是一样的,这个查表的操作是一个收集的操作,根据1收集索引为1的cat以此类推,因此这就是gather设计的初衷,gather([dog,cat,whale],dim=0,[1,0,1,2]),通过这三个参数就可以很好的生成查表的操作,pytorch矩阵运算没有这种操作可以完成这个功能,因此gather设计为了GPU的方式实现这个功能


相关推荐
徐安安ye8 小时前
FlashAttention流式输出:Streaming Chunked Attention与增量解码
人工智能·pytorch·python
SimpleLearingAI15 小时前
PyTorch乘法全解析
人工智能·pytorch·python
MediaTea1 天前
PyTorch:主要模块简介
人工智能·pytorch·python·深度学习·机器学习
rayyy91 天前
神经网络模型的外推性验证
pytorch·python·深度学习
MediaTea2 天前
DL:扩散模型的基本原理与 PyTorch 实现
人工智能·pytorch·python·深度学习·机器学习
EnCi Zheng2 天前
09aa-偏置是什么?
人工智能·pytorch·python·深度学习·神经网络
香蕉鼠片2 天前
Pytorch
人工智能·pytorch·python
xingyuzhisuan2 天前
租用4090服务器CUDA与PyTorch极速部署实操指南
运维·服务器·人工智能·pytorch·gpu算力
MediaTea2 天前
人工智能通识课:深度学习框架 PyTorch
人工智能·pytorch·python·深度学习·机器学习
这是谁的博客?2 天前
PyTorch 深度学习框架核心机制解析:从动态图到编译优化的全面指南
人工智能·pytorch·深度学习·ai·分布式训练·autograd