
机器学习是利用恰当的算法,从数据中获取经验,对基于知识设计的初始模型进行改进,从而更有效地实现任务目标的方法。
基于知识的方法需要对机器行为的所有细节进行设计和编程,而机器学习则截然不同。它不直接规定机器如何执行任务,而只需明确任务目标,让机器通过自主学习获得实现目标的技能。
机器学习基本框架包括五个关键要素:目标、模型、算法、数据和知识。
一、目标:
首先要确定一个目标,机器才能知道学习的方向。典型学习目标包括使分类更精确、使预测更合理或使生成更真实等等。
这些目标需要表示为严格的数学形式,如分类错误、预测误差等,这些数学化后的目标通常称为"损失函数"。损失函数值越低,表明机器完成任务的能力越好。
例如,在分类任务中,我们可以计算样本中错误分类的比例。显然,错误分类的比例越小越好,因此该比例可作为分类任务的损失函数。
同样,在房价预测任务中,我们可以衡量模型预测值与实际房价之间的差距,其绝对值越小,表示预测越准确,因此可作为预测任务的损失函数。