PyTorch 中nn.Embedding

核心参数与用法

nn.Embedding的核心参数:

num_embeddings:嵌入表的大小(即离散特征的总类别数,如词汇表大小)。

embedding_dim:每个嵌入向量的维度(输出向量的长度)。

padding_idx(可选):指定一个索引,其对应的嵌入向量将始终为 0(用于处理填充符号)。

css 复制代码
import torch
import torch.nn as nn

# 定义嵌入层:词汇表大小为10(索引0-9),嵌入维度为3
embedding = nn.Embedding(num_embeddings=10, embedding_dim=3)

# 输入:形状为(batch_size, seq_len)的整数张量(索引必须在[0, num_embeddings-1]范围内)
input_indices = torch.tensor([[1, 3, 5], [2, 4, 6]])  # 批量大小为2,序列长度为3

# 前向传播:获取嵌入向量
output_embeddings = embedding(input_indices)

print("输入形状:", input_indices.shape)  # 输出:torch.Size([2, 3])
print("输出形状:", output_embeddings.shape)  # 输出:torch.Size([2, 3, 3])(每个索引被映射为3维向量)
print("输出内容:\n", output_embeddings)
css 复制代码
输入形状: torch.Size([2, 3])
输出形状: torch.Size([2, 3, 3])
输出内容:
 tensor([[[ 0.5095,  0.3979, -1.7759],
         [-0.1456,  1.6262,  0.3929],
         [ 0.8530, -0.6685,  1.6823]],

        [[ 1.0323, -0.0969, -0.6512],
         [ 0.2309, -1.5649,  0.7431],
         [-0.3285, -0.2512, -0.1028]]], grad_fn=<EmbeddingBackward0>)
Parameter containing:
tensor([[-1.8749,  0.2108,  0.4401],
        [ 0.5095,  0.3979, -1.7759],
        [ 1.0323, -0.0969, -0.6512],
        [-0.1456,  1.6262,  0.3929],
        [ 0.2309, -1.5649,  0.7431],
        [ 0.8530, -0.6685,  1.6823],
        [-0.3285, -0.2512, -0.1028],
        [-0.1919,  0.2022, -0.2425],
        [-0.7266,  1.3337, -0.7980],
        [ 0.0791, -0.7093,  0.2264]], requires_grad=True)
相关推荐
智算菩萨9 小时前
【How Far Are We From AGI】5 AGI的“道德罗盘“——价值对齐的技术路径与伦理边界
论文阅读·人工智能·深度学习·ai·接口·agi·对齐技术
Sakuraba Ema9 小时前
从零理解 MoE(Mixture of Experts)混合专家:原理、数学、稀疏性、专家数量影响与手写 PyTorch 实现
人工智能·pytorch·python·深度学习·数学·llm·latex
freewlt9 小时前
科技热点速递:AI技术集中爆发
人工智能·深度学习·计算机视觉
南宫乘风9 小时前
LLaMA-Factory 给 Qwen1.5 做 LoRA 微调 实战
人工智能·深度学习·llama
Westward-sun.10 小时前
PyTorch入门实战:MNIST手写数字识别(全连接神经网络详解)
人工智能·pytorch·神经网络
小陈phd10 小时前
多模态大模型学习笔记(二十一)—— 基于 Scaling Law方法 的大模型训练算力估算与 GPU 资源配置
笔记·深度学习·学习·自然语言处理·transformer
zm-v-1593043398610 小时前
Python 气象数据处理从入门到精通:机器学习订正 + 深度学习预测完整教程
python·深度学习·机器学习
nap-joker10 小时前
【生物年龄age gap】基于影像的器官特异性衰老时钟预测人类疾病和死亡率
人工智能·深度学习·影像·生物年龄·age gap
Figo_Cheung10 小时前
Figo神经网络几何优化:基于深度学习发现复杂参数空间中的最优测量几何
人工智能·深度学习·神经网络
张张123y11 小时前
#Transformer架构与微调技术深度解析
深度学习·架构·transformer