【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
诸葛务农6 分钟前
类脑智能技术与系统:类脑大模型架构(下)
人工智能·深度学习·架构
诸葛务农6 分钟前
类脑智能技术与系统:类脑大模型架构(上)
人工智能·深度学习·神经网络·架构
imbackneverdie7 分钟前
2025国自然资助率12.29%创新低!2026年如何用数据与AI“破局”?
数据库·人工智能·自然语言处理·aigc·ai写作·课题·国家自然科学基金
IT_陈寒7 分钟前
JavaScript性能优化:我用这7个V8引擎冷门技巧将页面加载速度提升了40%
前端·人工智能·后端
KOYUELEC光与电子请努力拼搏~15 分钟前
监测精度再升级,小米手环8 Pro内部采用OCN亚奇科技连接器~
人工智能·科技
胡伯来了18 分钟前
19. Transformers - 文本领域的任务类
人工智能·transformer·多模态·transformers
Fabarta技术团队20 分钟前
枫清科技项目成功入选市科委、中关村管委会2025年重点应用场景项目名单
人工智能·科技
是店小二呀20 分钟前
出差忘带文件?我的急救方案节点小宝4.0
人工智能
李子琪。31 分钟前
AI创新创业:从技术赋能到范式革命
人工智能
LJ979511132 分钟前
智能连接:Infoseek如何重新定义媒体发布效率
大数据·人工智能