nn.Embedding

在这个代码片段中,TokenEmbedding 类继承了 torch.nn.Embedding 类,并在 __init__ 方法中通过调用 super(TokenEmbedding, self).__init__(vocab_size, d_model, padding_idx=1) 来初始化父类 nn.Embedding。由于 TokenEmbedding 没有定义新的方法,默认情况下它会使用 nn.Embedding 的行为来提供返回值。

nn.Embedding 的行为

nn.Embedding 是一个嵌入层,用于将词汇表中的单词映射为稠密的向量表示。它的作用是查找输入索引对应的嵌入向量,具体步骤如下:

  1. 当你传入词汇的索引(整数)时,它会从权重矩阵中查找对应的嵌入向量。
  2. 它不需要定义一个显式的 forward 方法,因为调用 nn.Embedding 实例时,自动会执行这个查找操作。

使用方式

  1. 实例化 TokenEmbedding :实例化时会初始化一个嵌入矩阵,矩阵的维度是 vocab_size x d_model,其中 vocab_size 是词汇表的大小,d_model 是每个单词的向量维度。

  2. 调用实例:传入单词索引(整数序列),实例会返回对应的嵌入向量。

示例:

python 复制代码
import torch
import torch.nn as nn

class TokenEmbedding(nn.Embedding):
    def __init__(self, vocab_size, d_model):
        super(TokenEmbedding, self).__init__(vocab_size, d_model, padding_idx=1)

# 假设词汇表大小为 100,嵌入维度为 64
vocab_size = 100
d_model = 64

# 实例化 TokenEmbedding
embedding_layer = TokenEmbedding(vocab_size, d_model)

# 创建输入张量,表示单词的索引
input_indices = torch.LongTensor([2, 5, 10])

# 调用实例,将词汇索引转换为嵌入向量
output = embedding_layer(input_indices)
print(output.shape)  # 输出形状为 (3, 64),因为输入中有 3 个单词,每个单词的嵌入向量是 64 维

解释:

  • vocab_size: 词汇表的大小,即可以表示多少个不同的单词。
  • d_model: 每个单词的嵌入向量的维度。
  • padding_idx=1: 用于指定填充标记的索引,通常是为了忽略填充标记在训练中的影响。

在这个类中,TokenEmbedding 类实际上没有显式返回值的方法,但是通过调用 __call__ 方法(继承自 nn.Embedding),它会查找并返回对应的嵌入向量。

相关推荐
jedi-knight16 分钟前
AGI时代下的青年教师与学术民主化
人工智能·python·agi
迷藏49418 分钟前
**eBPF实战进阶:从零构建网络流量监控与过滤系统**在现代云原生架构中,**网络可观测性**和**安全隔离**已成为
java·网络·python·云原生·架构
迷藏49419 分钟前
**发散创新:基于Solid协议的Web3.0去中心化身份认证系统实战解析**在Web3.
java·python·web3·去中心化·区块链
weixin_156241575761 小时前
基于YOLOv8深度学习花卉识别系统摄像头实时图片文件夹多图片等另有其他的识别系统可二开
大数据·人工智能·python·深度学习·yolo
AI_Claude_code1 小时前
ZLibrary访问困境方案三:Web代理与轻量级转发服务的搭建与优化
爬虫·python·web安全·搜索引擎·网络安全·web3·httpx
QQ676580081 小时前
AI赋能轨道交通智能巡检 轨道交通故障检测 轨道缺陷断裂检测 轨道裂纹识别 鱼尾板故障识别 轨道巡检缺陷数据集深度学习yolo第10303期
人工智能·深度学习·yolo·智能巡检·轨道交通故障检测·鱼尾板故障识别·轨道缺陷断裂检测
小陈工1 小时前
2026年4月7日技术资讯洞察:下一代数据库融合、AI基础设施竞赛与异步编程实战
开发语言·前端·数据库·人工智能·python
时空无限1 小时前
ansible 由于不同主机 python 版本不同执行报错
python·ansible
云程笔记1 小时前
002.计算机视觉与目标检测发展简史:从传统方法到深度学习
深度学习·yolo·目标检测·计算机视觉
ZhengEnCi1 小时前
P2E-Python字典操作完全指南-从增删改查到遍历嵌套的Python编程利器
python