2.3线性代数 - 技术栈

1.

变量是未知的标量，标量是只有一个元素的张量，标量是向量的元素或者分量

2.矩阵

aij 第i行j列的元素

矩阵的转置，如果B=AT 那么Bij=Aji 对称矩阵：A=AT

对于形状相同的矩阵可以进行按元素计算

3.张量算法

两个矩阵的按元素乘法称为Hadamard积

将张量乘以或加上一个标量不会改变张量的形状，其中张量的每个元素都将与标量相加或相乘。

4.求和与平均值（降维与非降维）

降维求和

求和的时候会降维，使之变成标量进行运算

1）axis=0是一列一列的计算最后得到4个数 axis=1是一行一行的计算最后得到5个数（5，4）代表着五行四列也或者一行四个元素 axis=1给出的解释是"指定axis=1将通过汇总所有列的元素降维（轴1)" 但其实他是一行一行相加最后得到的数字是5 （一列有五个元素）那么是否可以认为，对于axis 和 dim 都可以说变化最后体现在n维上 axis转换（如下图）所以对于axis=（n-1）和dim=（n-1）最后都体现出行（第一维度）的变化

对于cat函数就是扩展这一行对于sum就是压缩这一行（dim/axis=1）

这里的变化就是最直观的形状上的变化，因为对于axis降维函数来说，相当于把数字压缩成一行本质是对列进行操作但是反映出来我们看到或者得到的是行（当axis=0时）为了方便记忆我这么变换了一下说法为了函数什么的统一理解，不过后续发现很多直接记忆就可以的话再重申（毕竟目前对我来说这个还是有一点点绕到底怎么记住维度呢代表的都是什么变换呢）个人有个人理解，欢迎讨论！

2）A.sum(axis=[0,1])=a.sum()沿行列求和和直接求和是一样的

降维求平均值

因为mean（）函数只支持浮点型or复数型，所以单纯整数会报错

A.mean(axis=0)=A.sum(axis=0)/A.numel（）

非降维求和

保留他的轴数或者行数

如果我们想沿某个轴计算A元素的累积总和，比如axis=0（按行计算），可以调用cumsum函数。此函数不会沿任何轴降低输入张量的维度。

拿axis=1说明：第一列是初始数字，最后一列就是他们的和(和降维求和结果相同) 而其他的则是第二列则是沿着行方向，以每行第一个元素为基础，依次加上该行后续元素。比如第一行的1是第一个元素0加上第二个元素1，第二行的9是第一个元素4加上第二个元素5（假设原始张量第二行第二列值为5 ）总之，是按照指定轴方向进行累积求和运算