【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
chatexcel10 小时前
ChatExcel亮相GTC2025全球流量大会
大数据·人工智能
许泽宇的技术分享10 小时前
从 Semantic Kernel 到 Agent Framework:微软 AI 开发框架的进化之路
人工智能·microsoft
孟祥_成都11 小时前
打包票!前端和小白一定明白的人工智能基础概念!
前端·人工智能
幂律智能11 小时前
能源企业合同管理数智化转型解决方案
大数据·人工智能·能源
Arctic.acc11 小时前
Datawhale:吴恩达Post-training of LLMs,学习打卡5
人工智能
小毅&Nora11 小时前
【微服务】【Nacos 3】 ② 深度解析:AI模块介绍
人工智能·微服务·云原生·架构
Dev7z11 小时前
基于图像处理与数据分析的智能答题卡识别与阅卷系统设计与实现
图像处理·人工智能·数据分析
GoldenSpider.AI11 小时前
跨越地球的计算:StarCloud如何将AI数据中心送入太空,掀起下一代能源革命
人工智能·能源·starcloud·nvidia h100·philip johnston·ai创业公司
檐下翻书17311 小时前
流程图配色与美化:让你的图表会“说话”
论文阅读·人工智能·信息可视化·流程图·论文笔记
时序之心12 小时前
时序论文速递:覆盖损失函数优化、模型架构创新、理论基础与表征学习、应用场景与隐私保护等方向(11.10-11.14)
人工智能·损失函数·时间序列·表征学习·时序论文