LLM - 词向量 Word2vec

  1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。
  1. 词向量的实现:

(1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

(2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

(3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

  1. CBOW模型示意:用never和late预测中间词too的过程。

(1)首先将never,late表示成onehot向量.

(2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

(3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

(4)对n个输出做softmax,得到每个词分类概率分布。

  1. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐
Funny_AI_LAB3 分钟前
Zcode:智谱AI推出的轻量级 AI IDE 编程利器
人工智能·python·算法·编辑器
亚里随笔15 分钟前
偏离主路径:RLVR在参数空间中的非主方向学习机制
人工智能·深度学习·学习
共绩算力16 分钟前
Dolphin-v2:拍照论文也能实现精准解析
人工智能·共绩算力
沃达德软件19 分钟前
视频侦查技术揭秘
人工智能·opencv·计算机视觉·视觉检测·音视频·实时音视频·视频编解码
鲨莎分不晴22 分钟前
深度学习轻量化算子:从公式证明到数值计算
人工智能·深度学习
yzx99101323 分钟前
[特殊字符] AI画廊:基于CNN的实时艺术风格迁移系统
人工智能·神经网络·cnn
Blossom.11828 分钟前
GPTQ量化实战:从零手写大模型权重量化与反量化引擎
人工智能·python·算法·chatgpt·ai作画·自动化·transformer
KakiNakajima37 分钟前
windows ollama models 路径不生效【kaki踩坑日记】
人工智能
编码小哥38 分钟前
OpenCV高级形态学变换:梯度、顶帽与黑帽
人工智能·opencv·计算机视觉
睡醒了叭41 分钟前
图像分割-传统算法-区域分割
图像处理·人工智能·算法·计算机视觉