LLM - 词向量 Word2vec

  1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。
  1. 词向量的实现:

(1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

(2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

(3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

  1. CBOW模型示意:用never和late预测中间词too的过程。

(1)首先将never,late表示成onehot向量.

(2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

(3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

(4)对n个输出做softmax,得到每个词分类概率分布。

  1. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐
大猫子的技术日记10 分钟前
从DALL·E到Seedream:AI文生图技术全景速览与实战指南
人工智能
无bug代码搬运工10 分钟前
文献阅读:Class-incremental Learning for Time Series:Benchmark and Evaluation
人工智能·深度学习·transformer
乾元12 分钟前
智能化侦察:利用 LLM 进行自动化资产暴露面识别与关联
运维·网络·人工智能·网络协议·安全·自动化
lbb 小魔仙12 分钟前
AI工具与编程实践:重塑研发效率的双重引擎AI双擎驱动:工具与编程重构研发全流程的实战指南
人工智能·重构
行业探路者16 分钟前
如何利用二维码提升富媒体展示的效果?
大数据·人工智能·学习·产品运营·软件工程
爱打代码的小林18 分钟前
opencv(边缘检测)
人工智能·opencv·计算机视觉
lizhenning8718 分钟前
语言模型与动词知识库协同创新
人工智能·语言模型·自然语言处理
明月照山海-19 分钟前
机器学习周报三十一
人工智能·机器学习
木头程序员21 分钟前
算摄像学的“算法-传感器”协同设计:重新定义光学极限
人工智能·数码相机·硬件工程
Aaron_94526 分钟前
Skyvern:基于LLM和计算机视觉的浏览器自动化平台深度解析
人工智能·计算机视觉·自动化