pytorch中的可学习查找表实现之nn.Embedding

假设我们需要一个查找表(Lookup Table),我们可以根据索引数字快速定位查找表中某个具体位置并读取出来。最简单的方法,可以通过一个二维数组或者二维list来实现。但如果我希望查找表的值可以通过梯度反向传播来修改,那么就需要用到nn.Embedding来实现了。

其实,我们需要用反向传播来修正表值的场景还是很多的,比如我们想存储数据的通用特征时,这个通用特征就可以用nn.Embedding来表示,常见于现在的各种codebook的trick。闲话不多说,我们来看栗子:

python 复制代码
import torch
from torch import nn

table = nn.Embedding(10, 3)
print(table.weight)
idx = torch.LongTensor([[1]])
b = table(idx)
print(b)

'''
output
Parameter containing:
tensor([[-0.2317, -0.9679, -1.9324],
        [ 0.2473,  1.1043, -0.7218],
        [ 0.5425, -0.3109, -0.1330],
        [-1.4006, -0.0675,  0.1376],
        [-0.1995,  0.7168,  0.5692],
        [-1.3572, -0.6407, -0.0128],
        [-0.0773,  1.1928, -1.0836],
        [ 0.1721, -0.9232, -0.4059],
        [ 1.6108, -0.4640,  0.3535],
        [ 0.6975,  1.6554, -0.2217]], requires_grad=True)
tensor([[[ 0.2473,  1.1043, -0.7218]]], grad_fn=<EmbeddingBackward0>)
'''

这段代码实际上就实现了一个查找表的功能,索引值为\[1](注意有两个中括弧),返回值为对应的表值。我们还可以批量查找表值:

python 复制代码
import torch
from torch import nn

table = nn.Embedding(10, 3)
print(table)
print(table.weight)

indices = torch.LongTensor([[1,2,4,5],[4,3,2,9]])
print(indices)

out = table(indices)
print(out)
print(out.shape)

通过输入索引张量来获取表值:2,4 -> 2,4,3,请注意这个shape变化,即对应位置的索引获得对应位置的表值。

参考:https://pytorch.org/docs/stable/generated/torch.nn.Embedding.html

本人亲自整理,有问题可留言交流~

相关推荐
小何code6 小时前
人工智能【第52篇】RAG系统实战:检索增强生成技术详解
embedding·向量数据库·rag·检索增强生成·llm应用
格桑阿sir13 小时前
10-大模型智能体开发工程师:RAG检索增强生成
ai·大模型·llm·embedding·agent·检索增强·rag
寻道码路17 小时前
LangChain4j Java AI 应用开发实战(十):Embedding 模型与文本分类 - 语义向量化
java·人工智能·ai·embedding
贺国亚17 小时前
RAG检索增强-向量库与Chunking
prompt·embedding
codefan※21 小时前
pytorch安装流程
人工智能·pytorch·python
三无推导1 天前
ComfyUI 安装部署教程:Windows 下快速搭建可视化 AI 绘图工作流,零基础也能跑通
人工智能·pytorch·windows·stable diffusion·aigc·ai绘画·持续部署
独隅2 天前
PyTorch自动微分模块:从原理到实战一
人工智能·pytorch·python
不羁的木木2 天前
HarmonyOS文件基础服务(Core File Kit)实战演练03-文件增删改查与目录操作
pytorch·华为·harmonyos
盼小辉丶2 天前
PyTorch深度学习实战(55)——在Android上部署PyTorch模型
android·pytorch·python·模型部署
zhendianluli2 天前
PyTorch 复杂模型转 ONNX 踩坑纪实:从 diff 到 nan_to_num 的三关突破
人工智能·pytorch·python