【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
Narrastory几秒前
最大似然估计,香农熵,交叉熵与KL散度的详细解读与实现
人工智能·机器学习
安徽正LU o561-6o623o71 分钟前
露-人体生理实验整体解决方案 机能实验室整体解决方案 行为学实验室整体解决方案 动物行为学整体解决方案
人工智能
拖拖7654 分钟前
重读经典:Karpathy 的《循环神经网络不可思议的有效性》与代码实战
人工智能
阿恩.7704 分钟前
前沿科技计算机国际期刊征稿:电子、AI与网络计算
人工智能·经验分享·笔记·计算机网络·考研·云计算
ZsTs1196 分钟前
《2025 AI 自动化新高度:一套代码搞定 iOS、Android 双端,全平台 AutoGLM 部署实战》
前端·人工智能·全栈
锐学AI6 分钟前
从零开始学LangChain(二):LangChain的核心组件 - Agents
人工智能·python
Guheyunyi7 分钟前
安全风险监测预警系统如何重塑企业安全防线
大数据·人工智能·科技·安全·信息可视化
GIS数据转换器14 分钟前
空天地一体化边坡监测及安全预警系统
大数据·人工智能·安全·机器学习·3d·无人机
Dev7z19 分钟前
YOLO11 公共区域违法发传单检测系统设计与实现
人工智能·计算机视觉·目标跟踪
王中阳Go21 分钟前
06 Go Eino AI应用开发实战 | Eino 框架核心架构
人工智能·后端·go