【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
野豹商业评论21 分钟前
千问App全球首发点外卖、买东西、订机票等AI购物功能
大数据·人工智能
独自破碎E27 分钟前
说说Copilot模式和Agent模式的区别
人工智能·语言模型·copilot
yhdata40 分钟前
2026年镍合金线行业产业链分析报告
大数据·人工智能
jiguanghover44 分钟前
Langgraph_通过playwright mcp执行自动化
人工智能·agent
清 澜1 小时前
大模型扫盲式面试知识复习 (二)
人工智能·面试·职场和发展·大模型
kevin 11 小时前
财务审核场景全覆盖,AI智能审核,自然语言配置规则
人工智能
jieshenai1 小时前
BERT_Experiment_Template 多种模型与数据集加载,训练、参数保存与评估,适合论文实验的代码模板项目
人工智能·深度学习·bert
蝎蟹居1 小时前
GBT 4706.1-2024逐句解读系列(25) 第7.5条款:不同电压功率需清晰明确
人工智能·单片机·嵌入式硬件·物联网·安全
Mintopia1 小时前
😎 HTTP/2 中的 HPACK 压缩原理全揭秘
前端·人工智能·aigc
阿里云大数据AI技术1 小时前
EMR AI 助手再升级:支持 Serverless StarRocks
人工智能