技术栈
嵌入层
Hoper.J
17 天前
pytorch
·
embedding
·
嵌入向量
·
嵌入层
PyTorch nn.Embedding() 嵌入详解
在对文本序列进行分词(tokenize)并映射后,字符串序列就转变为了数字(token id)序列,这些 token id 可以直接输入到模型中,但需要明白的是,模型并不能直接从一个纯粹的数字中获取丰富的信息。类比到人类的认知,我们理解一个字或词并不是仅靠符号,而是其背后的含义。