大模型知识点之矩阵乘以向量

说明:本文开始总结大模型使用到的知识点。很零散,但重要。

矩阵乘以向量的几何意义

说明:

矩阵乘以向量的几何意义如下:⚠️警告:升维降维那我说的是 Ax 这个顺序相乘(矩阵在左边向量在右边)

1、矩阵乘以向量的的前提是列数必须等于向量的维度。否则无法对应每个输入维度进行加权求和。这是规则,但是为什么会有这个规则呢?具体参考 为什么矩阵乘以向量要求矩阵列数等于向量维度

2、当矩阵的行数不等于向量的维度的时候(列数必须等于向量的维度),相当于做了升维(矩阵行数大于向量维度)或者降维(矩阵行数小于向量维度),另外也做了拉伸(非单位矩阵)等操作。

3、当矩阵的行数等于向量的维度的时候(列数必须等于向量的维度),相当于只做了拉伸(非单位矩阵)等操作。

升维

拉伸

注意

上图就是 矩阵乘向量的几何意义:

灰色网格:原始坐标系

蓝色网格:矩阵作用后的坐标系(整个平面被拉伸+错切)

红色箭头:原始向量

绿色箭头:矩阵变换后的向量

👉 所以:矩阵乘以向量 = 向量在空间中被线性变换。

相关推荐
SmartBrain17 小时前
DeerFlow 实践:华为IPD流程的评审智能体设计
人工智能·语言模型·架构
JoannaJuanCV1 天前
大语言模型基石:Transformer
人工智能·语言模型·transformer
大千AI助手1 天前
TruthfulQA:衡量语言模型真实性的基准
人工智能·语言模型·自然语言处理·llm·模型评估·truthfulqa·事实性基准
张较瘦_1 天前
[论文阅读] 人工智能 + 软件工程 | 大语言模型驱动的多来源漏洞影响库识别研究解析
论文阅读·人工智能·语言模型
什么都想学的阿超1 天前
【大语言模型 58】分布式文件系统:训练数据高效存储
人工智能·语言模型·自然语言处理
J_Xiong01171 天前
【VLMs篇】07:Open-Qwen2VL:在学术资源上对完全开放的多模态大语言模型进行计算高效的预训练
人工智能·语言模型·自然语言处理
艾醒(AiXing-w)1 天前
探索大语言模型(LLM):Ollama快速安装部署及使用(含Linux环境下离线安装)
linux·人工智能·语言模型
这张生成的图像能检测吗1 天前
(综述)视觉任务的视觉语言模型
人工智能·计算机视觉·语言模型·自然语言处理·视觉语言模型
智者知已应修善业1 天前
【矩阵找最大小所在位置】2022-11-13
c语言·c++·经验分享·笔记·算法·矩阵
semantist@语校1 天前
第二十篇|SAMU教育学院的教育数据剖析:制度阈值、能力矩阵与升学网络
大数据·数据库·人工智能·百度·语言模型·矩阵·prompt