机器学习（西瓜书）学习——绪论

术语按照概念类别可分为五个表格：

中文术语	英文术语	符号表示	解释
机器学习	Machine Learning	--	通过计算手段利用经验改善系统自身性能的学科
模型	Model	--	由算法通过学习（训练）数据而创建出来的数学函数或程序
数据集	Dataset	D D D	一组记录的集合，每条记录描述一个事件或对象
样本/示例	Sample/Instance	x x x	数据集中的单条记录，描述事件或对象的特征
属性/特征	Attribute/Feature	--	描述样本的某个特性（如"色泽"、"重量"）
属性值	Attribute value	x i x_i xi	属性取到的具体值（如"青绿"、"浊响"）。
属性空间/样本空间	Attribute Space/Sample Space	X \mathcal{X} X	由所有属性张成的多维空间
特征向量	Feature Vector	x = ( x 1 ; x 2 ; ... ; x d ) \boldsymbol{x} = (x_1;x_2;\dots;x_d) x=(x1;x2;...;xd)	样本在属性空间中的坐标表示形式
维数	Dimensionality	d d d	样本属性的个数（特征向量的维度）
标记	Label	y y y	样本的"结果"信息（如"好瓜"或"坏瓜"）
样例	Example	( x , y ) (\boldsymbol{x}, y) (x,y)	拥有标记信息的样本（即`(特征向量, 标记)`对）
标记空间/输出空间	Label Space/Output Space	Y \mathcal{Y} Y	所有可能标记的集合（如`{好瓜, 坏瓜}`）

中文术语	英文术语	符号表示	解释
学习/训练	Learning/Training	--	从数据中获取模型的过程
训练数据	Training Data	--	用于训练模型的数据集
训练样本	Training Sample	--	训练数据中的单个样本
训练集	Training Set	D t r a i n D_{train} Dtrain	包含多个训练样本的集合
假设	Hypothesis	--	学习算法对数据内在规律的潜在描述
假设空间	Hypothesis Space	H \mathcal{H} H	学习算法所有可能考虑的假设（函数）的集合
真相/真实	Ground Truth	--	数据中隐含的客观规律（理想模型）
学习器	Learner	--	学习算法的具体实现程序
独立同分布	Independent and Identically Distributed， i.i.d.	i.i.d.	样本独立且服从相同分布的基本前提

训练集学习算法模型测试集预测结果