【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
黑金IT几秒前
AI Agent “小龙虾终极进化”——自主学习与持久化记忆的架构实现
人工智能·学习·架构
砍材农夫5 分钟前
spring-ai 第九模型介绍-聊天记录
人工智能
小码吃趴菜5 分钟前
面试小论文准备
人工智能
最贪吃的虎6 分钟前
【每日一问系列】LangChain中支持几种Model?
人工智能
AGV算法笔记6 分钟前
二维码目标检测论文精读:EA-OBB 如何用轻量化旋转检测提升 QR 码定位效果?
人工智能·目标检测·目标跟踪
nap-joker7 分钟前
基于大语言模型的大规模人群中的生物年龄预测
人工智能·语言模型·自然语言处理·生物年龄·器官特异的生物年龄
Omics Pro14 分钟前
上海AI Lab+复旦大学:双轨协同实现自动化虚拟细胞建模
运维·人工智能·语言模型·自然语言处理·数据挖掘·数据分析·自动化
星爷AG I16 分钟前
19-2 符号学(AGI基础理论)
人工智能·agi
happyprince24 分钟前
2026年04月12日全球AI前沿动态
人工智能
xixixi7777730 分钟前
Token 经济引爆 AI 产业加速:从百模大战到百虾大战,谁在定义 2026 的中国 AI?
大数据·人工智能·机器学习·ai·大模型·算力·通信