关于torch.nn.Embedding的浅显理解

最近在使用词嵌入向量表示我的数据标签,并且在试图理解torch.nn.Embedding函数。

torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None, _freeze=False, device=None, dtype=None)

这里只解释我对前两个参数的理解,这也是我唯二理解的:num_embeddings(int) -- size of the dictionary of embeddings,其实就是你给Embedding函数的张量里互不相同的数的个数;embedding_dim (int) -- the size of each embedding vector也即生成的词嵌入向量的最后一个维度。For example:

python 复制代码
import torch.nn as nn
import torch

known_label_lt = nn.Embedding(3, 10)

label = torch.tensor([
    [1, 0, 1, 0, 1],
    [2, 1, 0, 2, 1],
    [1, 1, 2, 1, 0],
    [1, 1, 0, 1, 2]
]).long() # without .long(), will result in an error. 

state = known_label_lt(label)
print(state.shape)

这里输入的向量label里只能包含三个不同的数:0,1,2 。或者反过来说known_label_lt的第一个参数只能是3,known_label_lt的第二个参数就决定了label的每一个数会被扩展到10维。所以最后生成的词嵌入维度是:

python 复制代码
torch.Size([4, 5, 10])
相关推荐
Java后端的Ai之路4 分钟前
【神经网络基础】-深度学习框架学习指南
人工智能·深度学习·神经网络·机器学习
一只大侠的侠32 分钟前
深度学习入门:从 LSTM 到 GAN 的实战项目推荐
深度学习·生成对抗网络·lstm
汤姆yu39 分钟前
基于yolov8的深度学习垃圾分类检测系统
人工智能·深度学习
独孤--蝴蝶44 分钟前
AI人工智能-大模型的演进-第十一周(上)(小白)
人工智能·深度学习·自然语言处理
中國龍在廣州1 小时前
生成不遗忘,「超长时序」世界模型,北大EgoLCD长短时记忆加持
人工智能·深度学习·算法·自然语言处理·chatgpt
无心水2 小时前
【神经风格迁移:性能】23、边缘艺术革命:树莓派+ONNX实现本地神经风格迁移,单张<2秒
pytorch·边缘计算·树莓派·onnx·int8·神经风格迁移:性能·神经风格
吃人陈乐游刘3 小时前
05实战经验X-anylabelingAI自动标注数据集-onnx简单解绍(2025年12月)
人工智能·深度学习
Rainly20003 小时前
深度学习旅程之数学统计底座
人工智能·深度学习
小鸡吃米…3 小时前
带Python的人工智能——深度学习
人工智能·python·深度学习
玄同7654 小时前
Python 流程控制:LLM 批量推理与 API 限流处理
服务器·人工智能·python·深度学习·自然语言处理·数据挖掘·知识图谱