【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
oscar99918 小时前
机器学习实战:多项式回归建模——从模拟数据到模型评估
人工智能·机器学习·回归
五羟基己醛18 小时前
【半小时入门深度学习】从零开始的Pytorch入门指南
人工智能·深度学习
喜欢吃豆18 小时前
企业级 AI 系统分层存储架构深度研究报告
人工智能·架构·大模型·2025博客之星
北京地铁1号线18 小时前
BERT(Bidirectional Encoder Representations from Transformers)架构详解
人工智能·深度学习·bert
低调小一19 小时前
Kotlin 2025–2026 客户端开发路线:语言升级 × 跨端落地 × AI Agent 入门
开发语言·人工智能·kotlin
ThinkPet19 小时前
【AI】大模型知识入门扫盲以及SpringAi快速入门
java·人工智能·ai·大模型·rag·springai·mcp
汽车仪器仪表相关领域19 小时前
双组分精准快检,汽修年检利器:MEXA-324M汽车尾气测量仪项目实战全解
大数据·人工智能·功能测试·测试工具·算法·机器学习·压力测试
renhongxia119 小时前
从文本到仿真:多智能体大型语言模型(LLM)自动化化学工艺设计工作流程
人工智能·语言模型·自动化
AI工具指南19 小时前
实测教程:三种主流AI生成PPT工作流详解
人工智能·ppt
DO_Community19 小时前
技术解码:Character.ai 如何实现大模型实时推理性能 2 倍提升
人工智能·算法·llm·aigc·moe·aiter