LLM - 词向量 Word2vec

  1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。
  1. 词向量的实现:

(1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

(2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

(3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

  1. CBOW模型示意:用never和late预测中间词too的过程。

(1)首先将never,late表示成onehot向量.

(2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

(3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

(4)对n个输出做softmax,得到每个词分类概率分布。

  1. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐
组合缺一2 分钟前
带来 AI Agent 开发,OpenSolon v3.8.3 发布
java·人工智能·ai·langchain·llm·solon
给算法爸爸上香8 分钟前
yolo26目标检测尝鲜测试
人工智能·yolo·目标检测·计算机视觉·yolo26
智算菩萨11 分钟前
2026最新视频压缩技术全景概述:AV2临近定稿、VVC加速落地、神经网络编码正在改写带宽成本
人工智能·深度学习·神经网络
洛阳泰山14 分钟前
一个人,一个项目,一年的坚持:关于我的 2025年 技术突围之路
java·人工智能·spring boot
龙亘川16 分钟前
SL/T830-2024 实操指南:水闸安全应急管理的标准化路径
大数据·人工智能·水闸安全管理应急预案技术导则
云卓SKYDROID19 分钟前
无人机降噪技术及应用分析
人工智能·无人机·飞控·高科技·云卓科技
Sherry Wangs21 分钟前
【ML】机器学习基础
人工智能·机器学习
LJ979511127 分钟前
告别发布焦虑:用AI开启“轻量化”精准媒体沟通时代
大数据·人工智能
点云SLAM28 分钟前
SLAM文献之-A Quick Guide for the Iterated Extended Kalman Filter on Manifolds
人工智能·机器人·slam·三维重建·fast-lio·卡尔曼滤波算法·iekf
duyinbi751733 分钟前
【深度学习】基于YOLO11的数字仪表识别与分类实现_HAFB_1
人工智能·深度学习·分类