多模态基础--- word Embedding

1 word Embedding

原始的单词编码方式:

one-hot,维度太大,不同单词之间相互独立,没有远近关系区分。

wordclass,将同一类单词编码在一起,此时丢失了类别和类别间的相关信息,比如class1和class3都属于生物

word Embedding编码方式:

将每个word映射到高维向量上

1.1 word Embedding方式

word Embedding主要有两种方法:
count based:

通过阅读大量的文章,比较不同的词汇后面跟随的内容一致性判断该两个词汇的相关性。

例:乔丹在NBA打球《===》科比在NBA打球

prediction based:

如下图,输入为Wi-1这个单词,通过神经网络,输出为不同的词汇中下个单词为Wi的概率。
取第一个隐藏层 Z作为word的编码

由于只依靠前一个单词预测后面的单词,这很困难,因此可以选择前面的多个单词来预测后面的单词。

我们将输入的单词Xi-2和Xi-1

相关推荐
biter008819 小时前
IEEE Transactions 风格补充材料(Word)快速排版教程
word
玩泥巴的2 天前
.NET驾驭Word之力:数据驱动文档 - 邮件合并与自定义数据填充完全指南
c#·word·.net·com互操作
揭老师高效办公4 天前
Word和WPS文字如何从特定的页开始编号(页码)?
word·wps
secondyoung4 天前
Markdown转换为Word:Pandoc模板使用指南
开发语言·经验分享·笔记·c#·编辑器·word·markdown
广都--编程每日问5 天前
deepseek 的对话json导出成word和pdf
pdf·json·word·deepseek·exprot
疯癫的老码农5 天前
【word解析】从OLE到OMML:公式格式转换的挑战与解决方案
java·spring boot·spring·word
睿思达DBA_WGX5 天前
使用 python-docx 库操作 word 文档(1):文件操作
开发语言·python·word
专注VB编程开发20年6 天前
VB6.0找不到该引用word,excel“Microsoft Excel 16.0 Object Library”解决方法
word·excel·vba·vsto
揭老师高效办公7 天前
Word和WPS文字表格内的文字无法垂直居中?这样设置
word·wps
孤客网络科技工作室7 天前
Python - 100天从新手到大师:第二十六天Python操作Word和PowerPoint文件
python·word·powerpoint