关于torch.nn.Embedding的浅显理解

最近在使用词嵌入向量表示我的数据标签,并且在试图理解torch.nn.Embedding函数。

torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None, _freeze=False, device=None, dtype=None)

这里只解释我对前两个参数的理解,这也是我唯二理解的:num_embeddings(int) -- size of the dictionary of embeddings,其实就是你给Embedding函数的张量里互不相同的数的个数;embedding_dim (int) -- the size of each embedding vector也即生成的词嵌入向量的最后一个维度。For example:

python 复制代码
import torch.nn as nn
import torch

known_label_lt = nn.Embedding(3, 10)

label = torch.tensor([
    [1, 0, 1, 0, 1],
    [2, 1, 0, 2, 1],
    [1, 1, 2, 1, 0],
    [1, 1, 0, 1, 2]
]).long() # without .long(), will result in an error. 

state = known_label_lt(label)
print(state.shape)

这里输入的向量label里只能包含三个不同的数:0,1,2 。或者反过来说known_label_lt的第一个参数只能是3,known_label_lt的第二个参数就决定了label的每一个数会被扩展到10维。所以最后生成的词嵌入维度是:

python 复制代码
torch.Size([4, 5, 10])
相关推荐
duyinbi75176 分钟前
【深度学习】基于YOLO11的数字仪表识别与分类实现_HAFB_1
人工智能·深度学习·分类
阿正的梦工坊13 分钟前
pip install transformer_engine[pytorch]编译错误解决方法
pytorch·transformer·pip
YukiMori2314 分钟前
使用 LoRA 对 Llama 基础模型进行指令微调 (SFT)
人工智能·深度学习
LDG_AGI21 分钟前
【机器学习】深度学习推荐系统(二十六):X 推荐算法多模型融合机制详解
人工智能·分布式·深度学习·算法·机器学习·推荐算法
小杨同学4925 分钟前
【嵌入式 C 语言实战】手动实现字符串四大核心函数(strcpy/strcat/strlen/strcmp)
后端·深度学习·算法
小辉笔记27 分钟前
Transformer讲解
人工智能·深度学习·transformer
噜~噜~噜~37 分钟前
损失曲线(loss surface)的个人理解
人工智能·深度学习·持续学习·任务边界感知·损失曲线
Dev7z38 分钟前
基于深度学习的泳池溺水行为检测算法设计
人工智能·深度学习·算法
liu****1 小时前
神经网络基础
人工智能·深度学习·神经网络·算法·数据挖掘·回归
创作者mateo1 小时前
深度学习学习笔记:发展脉络以及核心原理全解析
笔记·深度学习·学习