【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:
1)神经网络不仅可以处理图像,还可以处理文本。
2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。
3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。
7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。
10)稠密词向量可以计算两个向量的距离,有语义意义。

相关推荐
张较瘦_14 小时前
[论文阅读] AI + 软件工程 | 告别“大海捞针”:LLM+自然语言摘要,破解多仓库微服务漏洞定位难题
论文阅读·人工智能·软件工程
Skrrapper14 小时前
【大模型开发之数据挖掘】1. 介绍数据挖掘及其产生与发展
人工智能·数据挖掘
rafael(一只小鱼)14 小时前
gemini使用+部署教程
java·人工智能·ai·go
Mr. zhihao14 小时前
深入浅出解析 Word2Vec:词向量的训练与应用
人工智能·自然语言处理·word2vec
南极星100514 小时前
OPENCV(python)--初学之路(十五)Shi-Tomasi 角点检测和追踪的良好特征和SIFT简介
人工智能·opencv·计算机视觉
skywalk816314 小时前
LLM API Gateway:使用Comate Spec Mode创建大模型调用中转服务器
服务器·人工智能·gateway·comate
却道天凉_好个秋14 小时前
OpenCV(三十九):Harris角点检测
人工智能·opencv·计算机视觉
谷粒.14 小时前
AI芯片战争:NVIDIA、AMD、Intel谁将主宰算力市场?
运维·网络·人工智能·测试工具·开源·自动化
爱学习的张大14 小时前
大话机器学习-1.神经网络
人工智能·神经网络·机器学习
热点速递14 小时前
AI竞争升级:OpenAI在三场“战争”中拉响红色警报,全力聚焦ChatGPT!
人工智能·chatgpt