pytorch中torch.einsum函数的详细计算过程图解

第一次见到 rel_h = torch.einsum("bhwc,hkc->bhwk", r_q, Rh)这行代码时,属实是懵了,网上找了很多博主的介绍,但都没有详细的说明函数内部的计算过程,看得我是一头雾水,只知道计算结果的维度是如何变化的,却不明白函数内部是如何计算的。话不多说,直接上示例代码

示例代码

python 复制代码
import torch
r_q = torch.tensor([[[[1, 2, 3, 4, 5],
                      [6, 7, 8, 9, 10],
                      [11, 12, 13, 14, 15],
                      [16, 17, 18, 19, 20]],
                     [[21, 22, 23, 24, 25],
                      [26, 27, 28, 29, 30],
                      [31, 32, 33, 34, 35],
                      [36, 37, 38, 39, 40]],
                     [[41, 42, 43, 44, 45],
                      [46, 47, 48, 49, 50],
                      [51, 52, 53, 54, 55],
                      [56, 57, 58, 59, 60]]]])

Rh = torch.tensor([[[1, 2, 3, 4, 5,],
                      [7, 8, 9, 10, 11, ],
                      [13, 14, 15, 16, 17, ],
                      [19, 20, 21, 22, 23, ],
                        [1, 2, 3, 4, 5,],
                    [1, 2, 3, 4, 5,],],
                     [[25, 26, 27, 28, 29, ],
                      [31, 32, 33, 34, 35, ],
                      [37, 38, 39, 40, 41, ],
                      [43, 44, 45, 46, 47, ],
                      [1, 2, 3, 4, 5,],
                      [1, 2, 3, 4, 5,],],
                     [[49, 50, 51, 52, 53, ],
                      [55, 56, 57, 58, 59, ],
                      [61, 62, 63, 64, 65, ],
                      [67, 68, 69, 70, 71, ],
                      [1, 2, 3, 4, 5,],
                      [1, 2, 3, 4, 5,],]])

rel_h = torch.einsum("bhwc,hkc->bhwk", r_q, Rh)
print(rel_h)

输出结果:

结果解释

文字很难解释清楚,直接上图。r_q的维度为(1, 3, 4, 5), Rh的维度为(3, 6, 5),函数torch.einsum("bhwc,hkc->bhwk", r_q, Rh)中b=1, h=3, w=4, c=5。所以最终结果Rel_h的维度为bhwk,即(1, 3, 4, 5)。具体计算过程如下图。

这回看懂了吧。还不理解的或者讲的不对的地方,欢迎在评论区留言。创作不易,喜欢的话点个关注吧

相关推荐
怪兽学LLM1 分钟前
LeetCode 438 找到字符串中所有字母异位词(Python 固定滑动窗口+字符计数解法)
python·算法·leetcode
没事别瞎琢磨1 分钟前
二、类型系统——给所有概念起名字
人工智能·node.js
麻雀飞吧4 分钟前
期货量化日志别泄露密码:天勤账户凭证脱敏写法
python
卡梅德生物科技小能手6 分钟前
卡梅德生物科普:MAPT(微管相关蛋白Tau)
人工智能·经验分享·机器学习
满怀冰雪6 分钟前
第04篇-双指针算法-从有序数组到回文判断的高频解法
java·算法
CC数学建模7 分钟前
2026年江西省研究生数学建模竞赛1题:空间数据分析中的过拟合识别完整思路、代码、模型、文章,全网首发高质量分享!
python·算法·数学建模
matlabgoodboy7 分钟前
计算机java程序代写python代码编写c/c++代做qt设计php开发matlab
java·c语言·python
战族狼魂9 分钟前
基于 CNN 的ConvS2S(Convolutional Sequence-to-Sequence)架构英德机器翻译模型
人工智能·cnn·机器翻译
me83212 分钟前
【AI面试】小白理解大模型:仅编码器(BERT类)、仅解码器(GPT类)和完整的编码器-解码器架构各有什么优缺点?
人工智能·gpt·ai·bert
不考研当牛马12 分钟前
Django 框架 深度学习
python·深度学习·django