【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
许泽宇的技术分享8 小时前
当AI遇见UI:A2UI协议在.NET Blazor中的完整实现与深度剖析
人工智能·ui·.net·a2ui
2501_940178768 小时前
企业AI落地,从“能用”到“好用”的跨越:ModelEngine 实战与思考
人工智能
骚戴8 小时前
AI架构指南:大型语言模型 (LLM) API 的通用集成与企业级配置(2025年)
人工智能·大模型·llm·gateway·api
week_泽8 小时前
OpenCV图像拼接实践笔记(第一部分)
人工智能·笔记·opencv
乾元8 小时前
AI 在云网络(VPC / VNet)部署的编排与安全对齐——从“手工堆资源”到“意图驱动的网络生成”(含 Terraform 工程化)
运维·网络·人工智能·网络协议·安全·云计算·terraform
万俟淋曦8 小时前
【TextIn大模型加速器 + 火山引擎】赋能机器人行业分析与VLA研究
人工智能·机器人·火山引擎·robot·具身智能·coze·textln
三掌柜6668 小时前
2025三掌柜赠书活动第四十六期 白话AI安全:32个故事带你读懂AI的攻防博弈
人工智能
猫头虎8 小时前
猫头虎AI分享|可把GitHub代码库变成实时文档中心的一款实用型MCP工具:GitMCP,让AI随时访问最新文档代码,消除代码幻觉
人工智能·github·aigc·ai编程·ai写作·agi·ai-native
IT_陈寒8 小时前
Java 21新特性实战:5个必学的性能优化技巧让你的应用提速40%
前端·人工智能·后端
小毅&Nora8 小时前
【人工智能】【阿里云百炼平台】 ① 大模型全景图:从文本到全模态,一张图看懂AI能力边界(2025版)
人工智能·阿里云·云计算