向量
向量是机器学习最底层的组成部分, 也是基础数据的表示形式, 线性代数通过将研究对象拓展到向量, 对多维数据进行统一研究, 而进化出的方法方便我们可以研究和解决真实世界中的问题
标量
标量也称为"无向量", 使用一个单独的数表示数值大小, 可以有正负之分, 可以是实数和负数, 一般用小写变量表示, 比如 s s s表示行走距离, k k k表示直线斜率, n n n表示元素数目, 这些都可以看做标量
向量
向量是为了表达和处理高维空间的问题, 为表示一个整体会用方括号扩起来
向量的定义
将 n n n个有序的数排成一排称为 n n n维向量, 将 n n n个有次序的数排成一列, 称为 n n n维列向量
如, 称为四维列向量
x = 3 4 5 6 x = \left \\begin{matrix} 3 \& 4 \& 5 \& 6 \\end{matrix} \\right x=3456
称为四维行向量
x = 3 4 5 6 x = \left \\begin{matrix} 3 \\\\ 4 \\\\ 5 \\\\ 6 \\end{matrix} \\right x= 3456
如果没有声明一般为列向量
定位向量的值
y = 3 4 5 6 T y=\left\\begin{matrix}3 \& 4 \& 5 \& 6\\end{matrix}\\right ^T y=3456T, 向量 y y y的第 i i i个分向量用 y i y_i yi表示, 如 y 2 y_2 y2表示第二个分量, 值为 4 4 4
向量的几何意义
向量既有大小又有方向, 将向量的分量看作坐标轴上的坐标, 以坐标原点为起点, 向量代表的点为重点, 可以形成一条有向线段, 有向线段的长度表示向量的大小, 箭头所指的方向表示向量的方向, 可以将任意一个位置做为起始点进行自由移动, 但一般将原点看作起始点.
python
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
# 设置中文字体
plt.rcParams['font.sans-serif']=['Hiragino Sans GB'] # 修改字体
plt.rcParams['axes.unicode_minus'] = False # 正常显示负号
# 定义向量起点和终点(dx, dy)
x_start, y_start = 0, 0
dx, dy = 3, 4
dx1, dy1 = 4, 3
# 创建图形
plt.figure(figsize=(5, 5))
# 绘制向量
plt.arrow(x_start, y_start, dx, dy,
head_width=0.1, length_includes_head=True,
color='blue', lw=2)
plt.text(x_start+dx, y_start+dy, f"({dx}, {dy})")
# 绘制向量
plt.arrow(x_start, y_start, dx1, dy1,
head_width=0.1, length_includes_head=True,
color='blue', lw=2)
plt.text(x_start+dx1, y_start+dy1, f"({dx1}, {dy1})")
# 设置坐标轴范围
plt.xlim(-1, 6)
plt.ylim(-1, 6)
# 设置坐标轴比例一致
plt.axis('equal')
# 添加网格和标签
plt.grid(True)
plt.xlabel('x')
plt.ylabel('y')
plt.title('向量的表示')
# 显示图形
plt.show()

通常向量代表一组数, 是由使用者定义, 比如个人信息, 可以用 u s e r = 0 18 173 78789 user = \left\\begin{matrix}0 \& 18 \& 173 \& 78789\\end{matrix}\\right user=01817378789, 分别代表性别, 年龄, 身高, 和名字
向量的运算
加法
向量加法的值等于两个向量的对应分量之和
以两个二维向量加法为例, 如 r = 3 , 1 t r=3,1^t r=3,1t和 s = 2 , 3 t s=2,3^t s=2,3t, r + s = 2 + 2 , 1 + 3 t = 5 , 4 t r+s=2+2, 1+3^t=5,4^t r+s=2+2,1+3t=5,4t
python
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
# 设置中文字体
plt.rcParams['font.sans-serif']=['Hiragino Sans GB'] # 修改字体
plt.rcParams['axes.unicode_minus'] = False # 正常显示负号
# 定义向量起点和终点(dx, dy)
x_start, y_start = 0, 0
dx, dy = 3, 4
dx1, dy1 = 4, 3
# 创建图形
plt.figure(figsize=(5, 5))
# 绘制向量
# 注意, 后面的 dx, dy 分别是以前面两个微基础的向量非坐标
plt.arrow(x_start, y_start, dx, dy,
head_width=0.1, length_includes_head=True,
color='blue', lw=2)
plt.arrow(dx, dy, dx1, dy1,
head_width=0.1, length_includes_head=True,
color='blue', lw=2, linestyle="-")
plt.text(x_start+dx, y_start+dy, f"({dx}, {dy})")
plt.text(x_start+dx + dx1, y_start+dy + dy1, f"({dx} + {dx1}, {dy} + {dy1})")
# 绘制向量
plt.arrow(x_start, y_start, dx1, dy1,
head_width=0.1, length_includes_head=True,
color='blue', lw=2)
plt.arrow(dx1, dy1, dx, dy,
head_width=0.1, length_includes_head=True,
color='blue', lw=2, linestyle="-")
plt.text(x_start+dx1, y_start+dy1, f"({dx1} + {dx}, {dy1} + {dy})")
# 设置坐标轴范围
# plt.xlim(-1, 10)
# plt.ylim(-1, 10)
# 设置坐标轴比例一致
plt.axis('equal')
# 添加网格和标签
plt.grid(True)
plt.xlabel('x')
plt.ylabel('y')
plt.title('向量的表示')
# 显示图形
plt.show()

向量的乘法
数乘向量是数量与向量的乘法运算, 一个数 m m m乘以一个向量 r r r, 结果是向量 m r mr mr, 以而为向量数乘为例, m = 3 , r = 2 , 1 t m=3, r=2,1^t m=3,r=2,1t, m r = 3 ∗ 2 , 3 ∗ 1 t = 6 , 3 t mr=3 \* 2, 3 \* 1^t=6, 3^t mr=3∗2,3∗1t=6,3t
向量与数据
机器学习中, 对一个对象或者事件的描述称为样本, 反映样本某方面的表现或者性质的事项称为特征或属性, 特征的取值称为特征值, 样本组成的集合称为数据集, 向量可以看做样本的特征数
矩阵
标量是一个数, 向量是标量的拓展是一组数, 矩阵是对向量的拓展, 看作一组向量, 矩阵是线性代数最有用的工具
矩阵的定义
A = 120 3 2 2 0.2 600 100 3 1 2 0.2 500 110 3 1 2 0.1 700 90 3 1 1 1 300 A = \left\\begin{matrix} 120 \& 3 \& 2 \& 2 \& 0.2 \& 600 \\\\ 100 \& 3 \& 1 \& 2 \& 0.2 \& 500 \\\\ 110 \& 3 \& 1 \& 2 \& 0.1 \& 700 \\\\ 90 \& 3 \& 1 \& 1 \& 1 \& 300 \\end{matrix}\\right A= 120100110903333211122210.20.20.11600500700300
这个矩阵由4行6列组成, 就是 4 × 6 4 \times 6 4×6的矩阵
由 m × n m \times n m×n个数 a i j a_{ij} aij, i = 1 , 2 , . . . , m i=1,2,...,m i=1,2,...,m, j = 1 , 2 , . . . , n j=1,2,...,n j=1,2,...,n排成的 m m m行 n n n列的数表, 称为 m m m行 n n n列矩阵
A = a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ a i j ⋮ a m 1 a m 2 ⋯ a m n A = \left\\begin{matrix} a_{11} \& a_{12} \& \\cdots \& a_{1n} \\\\ a_{21} \& a_{22} \& \\cdots \& a_{2n} \\\\ \\vdots \& \\vdots \& a_{ij} \& \\vdots \\\\ a_{m1} \& a_{m2} \& \\cdots \& a_{mn} \\end{matrix}\\right A= a11a21⋮am1a12a22⋮am2⋯⋯aij⋯a1na2n⋮amn
记做 A = A m × n = ( a i j ) m × n A = A_{m \times n} = (a_{ij})_{m \times n} A=Am×n=(aij)m×n
矩阵和数据
矩阵表示关系
用来表示城市之间是否可以通行, 分别用 0 , 1 0, 1 0,1来表示, 1代表可以通行, 0代表不可以通行
| 通行关系 | A | B | C | D |
|---|---|---|---|---|
| A | √ \surd √ | √ \surd √ | ||
| B | √ \surd √ | √ \surd √ | ||
| C | √ \surd √ | √ \surd √ | ||
| D | √ \surd √ |
A = 0 1 1 0 1 0 1 0 1 0 0 1 0 1 0 0 A = \left\\begin{matrix} 0 \& 1 \& 1 \& 0 \\\\ 1 \& 0 \& 1 \& 0 \\\\ 1 \& 0 \& 0 \& 1 \\\\ 0 \& 1 \& 0 \& 0 \\end{matrix} \\right A= 0110100111000010
矩阵表示直接信息
学生选修了 A , B , C , D A, B, C, D A,B,C,D四门课, 用矩阵表示
| 通行关系 | A | B | C | D |
|---|---|---|---|---|
| 1 | 80 | 75 | 75 | 78 |
| 2 | 98 | 70 | 85 | 84 |
| 3 | 90 | 75 | 90 | 90 |
| 4 | 88 | 70 | 82 | 80 |
A = 80 75 75 78 98 70 85 84 90 75 90 90 88 70 82 80 A = \left\\begin{matrix} 80 \& 75 \& 75 \& 78 \\\\ 98 \& 70 \& 85 \& 84 \\\\ 90 \& 75 \& 90 \& 90 \\\\ 88 \& 70 \& 82 \& 80 \\end{matrix} \\right A= 80989088757075707585908278849080
矩阵表示线性系统
描述参数, 变量和常量先行关系, 设方程组如下
{ a 11 x 1 + a 12 x 2 + . . . + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + . . . + a 2 n x n = b 2 ⋮ a m 1 x 1 + a m 2 x 2 + . . . + a m n x n = b 2 \begin{cases} a_{11}x_1 + a_{12}x_2 + ... + a_{1n}x_n=b_1 \\ a_{21}x_1 + a_{22}x_2 + ... + a_{2n}x_n=b_2 \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + ... + a_{mn}x_n=b_2 \end{cases} ⎩ ⎨ ⎧a11x1+a12x2+...+a1nxn=b1a21x1+a22x2+...+a2nxn=b2⋮am1x1+am2x2+...+amnxn=b2
方程组左侧系数用 m × n m \times n m×n阶矩阵 A A A表示, 每行代表一个方程, 没列代表不同方程中未知数的系数. 方程组右侧用 m × 1 m \times 1 m×1阶矩阵 B B B表示, 每行代表方程右侧的值, 通常 A A A为系数矩阵, X X X为未知数矩阵, B B B为常数项矩阵, 记做 A X = B AX=B AX=B
A = a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n A = \left\\begin{matrix} a_{11} \& a_{12} \& \\cdots \& a_{1n} \\\\ a_{21} \& a_{22} \& \\cdots \& a_{2n} \\\\ \\vdots \& \\vdots \& \& \\vdots \\\\ a_{m1} \& a_{m2} \& \\cdots \& a_{mn} \\end{matrix} \\right A= a11a21⋮am1a12a22⋮am2⋯⋯⋯a1na2n⋮amn
X = x 1 x 2 ⋮ x n X = \left\\begin{matrix} x_1 \\\\ x_2 \\\\ \\vdots \\\\ x_n \\end{matrix} \\right X= x1x2⋮xn
B = b 1 b 2 ⋮ b n B = \left\\begin{matrix} b_1 \\\\ b_2 \\\\ \\vdots \\\\ b_n \\end{matrix} \\right B= b1b2⋮bn
使用Numpy很容易求出 X X X的值
矩阵和向量的创建
NumPy是Python开源的数值计算拓展
矩阵的创建
NumPy采用matrix(矩阵)和array(数组表示矩阵, 主要区别如下
- matrix 是 array 的分支, matrix 和 array 通用, 但大部分 Python程序中, array 更多, 因为更加灵活更快
- array类型为numpy.ndarray, 是相同类型元素组成, 统称为矩阵
python
import numpy as np
# 1. 基础矩阵创建
a = np.array([[1,2],[3,4]])
print("np.array:\n", a) # 通用矩阵创建
b = np.zeros((3,3))
print("\nnp.zeros:\n", b) # 初始化零矩阵
c = np.ones((2,3), dtype=int)
print("\nnp.ones:\n", c) # 创建整型全1矩阵
d = np.eye(3)
print("\nnp.eye:\n", d) # 创建单位矩阵
e = np.diag([1,2,3])
print("\nnp.diag:\n", e) # 创建对角矩阵
# 2. 数值序列生成
f = np.arange(2,10,2).reshape(2,2)
print("\nnp.arange+reshape:\n", f) # 生成等差序列矩阵
g = np.linspace(0,1,6).reshape(2,3)
print("\nnp.linspace:\n", g) # 生成等间隔矩阵
# 3. 随机矩阵
h = np.random.rand(3,2)
print("\nnp.random.rand:\n", h) # 生成[0,1)均匀分布矩阵
i = np.random.randn(2,3)
print("\nnp.random.randn:\n", i) # 生成正态分布矩阵
j = np.random.randint(1,10,size=(3,3))
print("\nnp.random.randint:\n", j) # 生成随机整数矩阵
# 4. 特殊构造方法
k = np.fromfunction(lambda i,j: i+j, (3,3))
print("\nnp.fromfunction:\n", k) # 通过函数构造矩阵
l = np.tile([1,2], (2,3))
print("\nnp.tile:\n", l) # 矩阵平铺复制
m = np.repeat([1,2], 3).reshape(2,3)
print("\nnp.repeat:\n", m) # 元素重复扩展
# 5. 矩阵属性操作
n = np.array([[1,2,3],[4,5,6]], dtype=np.float32)
print("\n矩阵属性:")
print("shape:", n.shape) # 形状
print("dtype:", n.dtype) # 数据类型
print("ndim:", n.ndim) # 维度
print("size:", n.size) # 元素总数
print("itemsize:", n.itemsize) # 单元素字节大小
"""
np.array:
[[1 2]
[3 4]]
np.zeros:
[[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]]
np.ones:
[[1 1 1]
[1 1 1]]
np.eye:
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]]
np.diag:
[[1 0 0]
[0 2 0]
[0 0 3]]
np.arange+reshape:
[[2 4]
[6 8]]
np.linspace:
[[0. 0.2 0.4]
[0.6 0.8 1. ]]
np.random.rand:
[[0.88342915 0.31164707]
[0.149002 0.5399805 ]
[0.42382287 0.85360373]]
np.random.randn:
[[ 0.20843083 -1.4405944 1.2375411 ]
[ 0.36852983 0.5106739 -0.54602658]]
np.random.randint:
[[3 7 5]
[8 2 1]
[4 9 6]]
np.fromfunction:
[[0. 1. 2.]
[1. 2. 3.]
[2. 3. 4.]]
np.tile:
[[1 2 1 2 1 2]
[1 2 1 2 1 2]]
np.repeat:
[[1 1 1]
[2 2 2]]
矩阵属性:
shape: (2, 3)
dtype: float32
ndim: 2
size: 6
itemsize: 4
"""