LLM - 词向量 Word2vec

  1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。
  1. 词向量的实现:

(1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

(2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

(3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

  1. CBOW模型示意:用never和late预测中间词too的过程。

(1)首先将never,late表示成onehot向量.

(2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

(3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

(4)对n个输出做softmax,得到每个词分类概率分布。

  1. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐
云资源服务商2 分钟前
阿里云万相Wan2.6深度实测:从AI生成到智能导演,重新定义短视频创作
人工智能·阿里云·aigc
brave and determined2 分钟前
CANN训练营 学习(day10)昇腾AI算子ST测试全攻略:从入门到精通
自动化测试·人工智能·log4j·算子·fuzz·测试实战·st测试
小北的AI科技分享3 分钟前
AI智能体:连接大语言模型与现实任务的核心架构解析
人工智能·语言模型·自然语言处理
千殇华来6 分钟前
XMOS学习笔记
人工智能·笔记·学习
Blossom.1186 分钟前
Transformer时序预测实战:用PyTorch构建股价预测模型
运维·人工智能·pytorch·python·深度学习·自动化·transformer
模型启动机8 分钟前
Google推出托管MCP服务器,让AI Agent轻松接入其工具生态
运维·人工智能·ai·大模型
ar01238 分钟前
什么是AR远程协助?当前AR远程协助的应用场景有哪些?
人工智能·ar
baby_hua8 分钟前
20251031_三天速通PyTorch
人工智能·pytorch·python
yiersansiwu123d9 分钟前
AI产业融合纵深发展,治理创新护航智能未来
人工智能