LLM - 词向量 Word2vec

  1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。
  1. 词向量的实现:

(1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

(2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

(3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

  1. CBOW模型示意:用never和late预测中间词too的过程。

(1)首先将never,late表示成onehot向量.

(2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

(3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

(4)对n个输出做softmax,得到每个词分类概率分布。

  1. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐
予枫的编程笔记7 分钟前
【Java进阶】深入浅出 Java 锁机制:从“单身公寓”到“交通管制”的并发艺术
java·人工智能·
科技云报道9 分钟前
科技云科技云报到:RPA+Agent,为什么可以1+1>2?
人工智能·科技
SEO_juper9 分钟前
应对 AI 概览导致的网站流量流失:诊断、优化与长期策略
人工智能·seo·数字营销
Mintopia14 分钟前
🌌 信任是否会成为未来的货币?
前端·人工智能·aigc
青春不败 177-3266-052016 分钟前
AI支持下的临床医学日常工作、论文撰写、数据分析与可视化、机器学习建模中的实践应用
人工智能·数据挖掘·数据分析·医学
闲看云起20 分钟前
大模型注意力机制进化史:从全局到稀疏,从标准到线性、滑动窗口、MQA……
人工智能·语言模型·nlp
数说星榆18120 分钟前
可信AI:透明度、公平性与问责制
人工智能
实战项目22 分钟前
基于深度学习的音乐分类算法研究
人工智能·深度学习·分类
才兄说22 分钟前
机器人租赁中的现场确认痛点
人工智能·机器人
传说故事24 分钟前
【论文自动阅读】Stable Language Guidance for Vision-Language-Action Models
人工智能·具身智能