通用字体,符号规则
- x x x 标量
 - x \boldsymbol{x} x 向量
 - X \boldsymbol{X} X 随机向量、矩阵
 - χ \chi \quad χ 集合
 - x ^ \hat{x} x^ 估计或近似值
 - x ∗ x^* x∗ 最优值
 - x ˉ \bar{x} xˉ 平均值
 
常见的数学符号
- ∀ \forall \quad ∀ 对任意
 - ∃ \exists ∃ 存在
 - ∝ \propto ∝ 与...成正比
 - ⊥ \perp \quad ⊥ 垂直于
 - ~服从分布
 - iid或 iid 独立同分布
 - approx. 近似服从分布
 - ∇ f \nabla f \quad ∇f 的梯度
 - ∇ 2 f \nabla^2 f \quad ∇2f 的Hessian矩阵
 - f ∈ C p f f \in C^p \quad f f∈Cpf 具有 p p p 阶连续导数
 - ≈ \approx ≈ 约等于
 - ≃ \simeq \quad ≃ 渐进等于
 - ≪ \ll \quad ≪ 远小于
 - ⊕ \oplus ⊕ 直和
 - ๑ 对应元素乘积
 - ก 交
 - U 并
 - :=或=:定义
 
矩阵或向量表示
- A ⊤ \boldsymbol{A}^{\top} A⊤ 或 x ⊤ \boldsymbol{x}^{\top} \quad x⊤ 矩阵 A \boldsymbol{A} A 或向量 x \boldsymbol{x} x 的转置
 - A − 1 \boldsymbol{A}^{-1} A−1 矩阵 A \boldsymbol{A} A 的逆
 - A + \boldsymbol{A}^{+} A+矩阵 A \boldsymbol{A} A 的伪逆
 - A − ⊤ \boldsymbol{A}^{-\top} A−⊤ 矩阵 A ⊤ \boldsymbol{A}^{\top} A⊤ 的逆或 A − 1 \boldsymbol{A}^{-1} A−1 的转置
 - A > 0 \boldsymbol{A}>0 \quad A>0 矩阵 A \boldsymbol{A} A 是正定的
 - A ≥ 0 \boldsymbol{A} \geq 0 \quad A≥0 矩阵 A \boldsymbol{A} A 是半正定的
 - dim  ( x ) \operatorname{dim}(\boldsymbol{x}) dim(x) 向量 x \boldsymbol{x} x 的维数
 - det  ( A ) \operatorname{det}(\boldsymbol{A}) \quad det(A) 矩阵 A \boldsymbol{A} A 的行列式
 - ∣ A ∣ |\boldsymbol{A}| \quad ∣A∣ 矩阵 A \boldsymbol{A} A 的行列式的绝对值
 - tr  ( A ) \operatorname{tr}(\boldsymbol{A}) \quad tr(A) 矩阵 A \boldsymbol{A} A 的迹
 
保留字母和保留词
- C 复数集合
 - d 微分符号
 - E 期望
 - e 2.71828 ... 2.71828 \ldots 2.71828...
 - f f f 概率密度 (离散或连续)
 - g g g 预测函数
 - 1 { A } 1\{A\} 1{A} 或 1 A 1 A \quad 1A 集合 A A A 的指示函数
 - i -1 的平方根
 - ℓ \ell ℓ 风险:预期损失
 - Loss 损失函数
 - In 自然对数
 - N N \quad N 自然数集合 { 0 , 1 , ... } \{0 , 1 , \ldots\} {0,1,...}
 - O 大O阶符号:对于某个常数 α \alpha α ,当 x → α x \rightarrow \alpha x→α 时,如果 ∣ f ( x ) ∣ ≤ α g ( x ) |f(x)| \leq \alpha g(x) ∣f(x)∣≤αg(x) ,则 f ( x ) = O ( g ( x ) ) f(x)=O(g(x)) f(x)=O(g(x))
 - o小O阶符号: 对于某个常数 α \alpha α ,当 x → a x \rightarrow a x→a 时,如果 f ( x ) / g ( x ) → 0 f(x) / g(x) \rightarrow 0 f(x)/g(x)→0 ,则 f ( x ) = o ( g ( x ) ) f(x)=o(g(x)) f(x)=o(g(x))
 
P 概率测度
- π 3.14159 ... \pi \quad 3.14159 \ldots π3.14159...
 - R \mathrm{R} R 实数集合 (一维欧氏空间)
 - R n n \mathrm{R}^n \quad n Rnn 维欧氏空间
 - R + R_{+} R+正实数线性空间: [ 0 , ∞ ) [0, \infty) [0,∞)
 - τ \tau τ 确定性训练集
 - T 随机训练集
 - X \boldsymbol{X} X 模型 (设计) 矩阵
 - Z 整数集合 { ... , − 1 , 0 , 1 , ... } \{\ldots,-1,0,1, \ldots\} {...,−1,0,1,...}
 
概率分布
- 
Ber 伯努利分布
 - 
Beta 贝塔分布
 - 
Bin 二项分布
 - 
Exp 指数分布
 - 
Geom 几何分布
 - 
Gamma 伽马分布
 - 
F F分布
 - 
N 正态分布或高斯分布
 - 
Pareto 帕雷托分布
 - 
Poi 泊松分布
 - 
t 学生分布
 - 
U 均匀分布
 
缩与和缩略语
- 
cdf 累积分布函数(cumulative distribution function)
 - 
CMC 朴素蒙特卡罗(Crude Monte Carlo)
 - 
CE 交叉熵(Cross-Entropy)
 - 
EM 期望最大化(Expectation-Maximization)
 - 
GP 高斯过程(Gaussian Process)
 - 
KDE 核密度估计/估计器(Kernel Density Estimate/Estimator)
 - 
KL 库尔贝克-莱布勒(Kullback-Leibler)
 - 
KKT卡罗需-库恩-塔克(Karush-Kuhn-Tucker)
 - 
iid 独立同分布(independent and identically distributed)
 - 
MAP 最大后验概率(Maximum A Posteriori)
 - 
MCMC 马尔可夫链蒙特卡罗(Markov Chain Monte Carlo)
 - 
MLE 极大似然估计/估计器(Maximum Likelihood Estimate/Estimator)
 - 
OOB 袋外(Out-Of-Bag)
 - 
PCA 主成分分析(Principal Component Analysis)
 - 
pdf 概率密度函数(probability density function)(离散或连续)
 - 
SVD 奇异值分解(Singular Value Decomposition)
 
注:摘自《数据科学与机器学习:数学与统计方法》