多模态基础--- word Embedding

1 word Embedding

原始的单词编码方式:

one-hot,维度太大,不同单词之间相互独立,没有远近关系区分。

wordclass,将同一类单词编码在一起,此时丢失了类别和类别间的相关信息,比如class1和class3都属于生物

word Embedding编码方式:

将每个word映射到高维向量上

1.1 word Embedding方式

word Embedding主要有两种方法:
count based:

通过阅读大量的文章,比较不同的词汇后面跟随的内容一致性判断该两个词汇的相关性。

例:乔丹在NBA打球《===》科比在NBA打球

prediction based:

如下图,输入为Wi-1这个单词,通过神经网络,输出为不同的词汇中下个单词为Wi的概率。
取第一个隐藏层 Z作为word的编码

由于只依靠前一个单词预测后面的单词,这很困难,因此可以选择前面的多个单词来预测后面的单词。

我们将输入的单词Xi-2和Xi-1

相关推荐
我叫汪枫8 小时前
Python 办公自动化入门:玩转 Excel 与 Word
python·word·excel
E_ICEBLUE8 小时前
三步完成 Markdown 到 Word/PDF 的转换:Python 教程
python·pdf·word·markdown·格式转换
小马哥编程1 天前
word多级列表中,级别1为:模块一; 那么如何实现级别2编号的格式为:1.1
word
楚疏笃1 天前
纯Python 实现 Word 文档转换 Markdown
python·word
心之伊始1 天前
Java synchronized 锁升级全过程深度解析:从 Mark Word 到偏向锁、轻量级锁与重量级锁的 HotSpot 实现
java·开发语言·word
放飞自我的Coder2 天前
【html word富文本编辑器 gemini3pro】
html·word
renzao_ai3 天前
10秒完成WORD表格添加序号列
word
快乐的韭菜根根3 天前
Word进阶
word
黄色茶杯4 天前
解决WPS的word文件嵌入EXCEL无法双击打开
word·excel·wps
gc_22994 天前
学习C#调用OpenXml操作word文档的基本用法(7:Style类分析-5)
学习·word·openxml