LLM - 词向量 Word2vec

  1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。
  1. 词向量的实现:

(1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

(2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

(3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

  1. CBOW模型示意:用never和late预测中间词too的过程。

(1)首先将never,late表示成onehot向量.

(2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

(3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

(4)对n个输出做softmax,得到每个词分类概率分布。

  1. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐
Hcoco_me几秒前
Word2Vec:核心思想
人工智能·自然语言处理·word2vec
汤姆yu2 分钟前
基于深度学习的交通标志识别系统
人工智能·深度学习
南方略咨询2 分钟前
南方略咨询:环保行业进入深水区,营销管理能力正在拉开企业差距
大数据·人工智能
小鸡吃米…4 分钟前
机器学习 - Python 库
人工智能·python·机器学习
Brduino脑机接口技术答疑10 分钟前
TDCA 算法在 SSVEP 场景中的 Padding 技术:原理、应用与工程实现
人工智能·算法·机器学习·数据分析·脑机接口
TOPGUS11 分钟前
深圳SEO大会深度复盘:验证趋势,洞见未来! —— by Daniel
人工智能·搜索引擎·ai·chatgpt·seo·网络营销
智算菩萨12 分钟前
【Python机器学习】Bagging 与 Boosting:集成学习的两种风格
机器学习·集成学习·boosting
FPGA_ADDA15 分钟前
ORIN+FPGA 高速采集AI 智能处理板
人工智能·fpga开发
mubei-12320 分钟前
DPR:用于开放域问答的密集段落检索
人工智能·llm·检索增强生成·文本检索算法
GAOJ_K23 分钟前
滚柱导轨精度等级如何匹配应用场景?
人工智能·科技·机器人·自动化·制造