机器学习入门：什么是机器学习

我想从机器学习的定义谈起，再讲讲机器学习都有哪些模型。

1 理解机器学习的定义

机器学习是人工智能学科的一个分支。机器学习概念的范畴比人工智能概念的范畴要小，但比深度学习概念范围要大，深度学习的底层是神经网络。这三者的关系大致如图1所示。

图1人工智能、机器学习、深度学习三者之间的关系

要想打好机器学习的数学基础，请参见清华大学出版社的人人可懂系列，包括《人人可懂的微积分》（已上市）、《人人可懂的线性代数》（即将上市）、《人人可懂的概率统计》（即将上市）。

通常我们口头上讲的人工智能是技术上的概念，这些技术包括但不限于机器学习、深度学习、自然语言处理、智能机器人、图像识别、语音识别、视频识别、手势控制、人机交互、知识推荐与过滤引擎、情境感知等。这些技术并不是完全的并列关系，它们之间又有交叉和重叠，如，机器学习是图像识别、语音识别的基础，图像识别、语音识别都会用到深度学习的很多算法。

上述技术可以广泛的应用到各行各业，包括但不限于互联网、金融业、智能交通、智慧旅游、工业机器人、服务机器人、自动驾驶、智能家居、精准农业、智能安防、翻译助手、博弈游戏、医学诊断、公共服务、场景教学、自动阅卷等。

那什么是机器学习呢？这里的机器指的就是计算机，并不是指的机器人、汽车等机械系统。通常认为，机器学习是指用计算机模拟人类学习行为的技术，用来从已知数据中获得新的知识。计算机相比人类的长处就在于存储容量大、计算速度快、擅长做大量重复的工作，因此在涉及大量的数据及从中学习出知识时，机器学习能发挥出计算机的特长。

有很多人总在争论机器会不会有自主思维？其实从我们做技术研究的人角度来看，要有自主思维还早得很，现有的技术要模拟出人类完整的复杂思维还够现实，我们还是现实一点，学会来用机器帮助我们解决一些工程实践问题吧。

2 机器学习有哪些模型

机器学习先选定模型从已有数据中学习到模型的参数值，再通过模型做出预测。机器学习模型的用途主要有2种，一种称为分类，如，对图像的分类；另一种称为回归，如，预测出股票的价格。这2种用途奠定了机器学习应用的基础，据此可应用到情感识别、图像处理等场景中。本书中举的例子也都是这2类用途应用的例子。有关回归的内涵后续还会详细讲解，这里可先有个感性认识。

根据模型的特征，机器学习模型还可以分为监督学习模型、无监督学习模型、强化学习模型和其它模型4类，如图2所示。监督学习模型需要先有训练数据（包括特征数据项和目标数据项），从训练数据中学习到知识。无监督学习模型也需要有训练数据，但训练数据不需要有目标数据项。强化学习则可以边探索数据边学习模型，使得模型越来越"强"。

监督学习模型有线性回归、逻辑回归、贝叶斯、决策树、支持向量机、KNN（K-Nearest Neighbor，K近邻算法）、集成学习等，本书主要详细讲解其中的6种。无监督学习包括各种聚类模型和降维模型，如PCA（Principle Component Analysis，主成分分析）。强化学习有Sarsa、DQN（Deep Q-Network，深度Q网络）等。其它模型还有深度学习的各种模型、隐马尔科夫模型、迁移学习模型等。可见，机器学习模型的种类非常丰富，而且事实上还远不止图中列出的这些模型，连我们常听人说起的深度学习也只是其中的一类。

图2 机器学习的模型

说明： 1. CNN：Convolutional Neural Network，卷积神经网络。

RNN：Recurrent Neural Network，循环神经网络。
LSTM：Long Short Term Memory Network，长短记忆网络。