多模态基础--- word Embedding

1 word Embedding

原始的单词编码方式:

one-hot,维度太大,不同单词之间相互独立,没有远近关系区分。

wordclass,将同一类单词编码在一起,此时丢失了类别和类别间的相关信息,比如class1和class3都属于生物

word Embedding编码方式:

将每个word映射到高维向量上

1.1 word Embedding方式

word Embedding主要有两种方法:
count based:

通过阅读大量的文章,比较不同的词汇后面跟随的内容一致性判断该两个词汇的相关性。

例:乔丹在NBA打球《===》科比在NBA打球

prediction based:

如下图,输入为W~i-1~这个单词,通过神经网络,输出为不同的词汇中下个单词为W~i~的概率。
取第一个隐藏层 Z作为word的编码

由于只依靠前一个单词预测后面的单词,这很困难,因此可以选择前面的多个单词来预测后面的单词。

我们将输入的单词X~i-2~和X~i-1~

相关推荐
feibaoqq2 天前
WPS或word接入智能AI
深度学习·word·wps
bu_shuo3 天前
Word中打开开发工具【修改日期控件显示格式】
word·开发人员
apple-mapping4 天前
免费deepseek的API获取教程及将API接入word或WPS中
人工智能·c#·word·wps
xiaoxiaobaozhu5 天前
用java实现word(docx)转换为pdf格式文档(简单版)
java·pdf·word
大龄码农有梦想6 天前
Springboot集成Milvus和Embedding服务,实现向量化检索
spring boot·embedding·milvus·向量检索·spring ai
铸人6 天前
Word 公式转 CSDN 插件 发布
word
取个名字真难呐7 天前
window patch按块分割矩阵
人工智能·pytorch·深度学习·矩阵·embedding
CodeCraft Studio7 天前
.NET版Word处理控件Aspose.Words教程:使用 C# 删除 Word 中的空白页
c#·word·.net
青涩小鱼7 天前
WPS中如何批量上下居中对齐word表格中的所有文字
word·wps
水瓶丫头站住7 天前
将Markdown格式文件与word文件相互转化方法
word