我想从机器学习的定义谈起,再讲讲机器学习都有哪些模型。
1 理解机器学习的定义
机器学习是人工智能学科的一个分支。机器学习概念的范畴比人工智能概念的范畴要小,但比深度学习概念范围要大,深度学习的底层是神经网络。这三者的关系大致如图1所示。

图1人工智能、机器学习、深度学习三者之间的关系
要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。
通常我们口头上讲的人工智能是技术上的概念,这些技术包括但不限于机器学习、深度学习、自然语言处理、智能机器人、图像识别、语音识别、视频识别、手势控制、人机交互、知识推荐与过滤引擎、情境感知等。这些技术并不是完全的并列关系,它们之间又有交叉和重叠,如,机器学习是图像识别、语音识别的基础,图像识别、语音识别都会用到深度学习的很多算法。
上述技术可以广泛的应用到各行各业,包括但不限于互联网、金融业、智能交通、智慧旅游、工业机器人、服务机器人、自动驾驶、智能家居、精准农业、智能安防、翻译助手、博弈游戏、医学诊断、公共服务、场景教学、自动阅卷等。
那什么是机器学习呢?这里的机器指的就是计算机,并不是指的机器人、汽车等机械系统。通常认为,机器学习是指用计算机模拟人类学习行为的技术,用来从已知数据中获得新的知识。计算机相比人类的长处就在于存储容量大、计算速度快、擅长做大量重复的工作,因此在涉及大量的数据及从中学习出知识时,机器学习能发挥出计算机的特长。
有很多人总在争论机器会不会有自主思维?其实从我们做技术研究的人角度来看,要有自主思维还早得很,现有的技术要模拟出人类完整的复杂思维还够现实,我们还是现实一点,学会来用机器帮助我们解决一些工程实践问题吧。
2 机器学习有哪些模型
机器学习先选定模型从已有数据中学习到模型的参数值,再通过模型做出预测。机器学习模型的用途主要有2种,一种称为分类 ,如,对图像的分类;另一种称为回归,如,预测出股票的价格。这2种用途奠定了机器学习应用的基础,据此可应用到情感识别、图像处理等场景中。本书中举的例子也都是这2类用途应用的例子。有关回归的内涵后续还会详细讲解,这里可先有个感性认识。
根据模型的特征,机器学习模型还可以分为监督学习模型、无监督学习模型、强化学习模型和其它模型4类,如图2所示。监督学习模型需要先有训练数据(包括特征数据项和目标数据项),从训练数据中学习到知识。无监督学习模型也需要有训练数据,但训练数据不需要有目标数据项。强化学习则可以边探索数据边学习模型,使得模型越来越"强"。
要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。
监督学习模型有线性回归、逻辑回归、贝叶斯、决策树、支持向量机、KNN(K-Nearest Neighbor,K近邻算法)、集成学习等,本书主要详细讲解其中的6种。无监督学习包括各种聚类模型和降维模型,如PCA(Principle Component Analysis,主成分分析)。强化学习有Sarsa、DQN(Deep Q-Network,深度Q网络)等。其它模型还有深度学习的各种模型、隐马尔科夫模型、迁移学习模型等。可见,机器学习模型的种类非常丰富,而且事实上还远不止图中列出的这些模型,连我们常听人说起的深度学习也只是其中的一类。

图2 机器学习的模型
说明: 1. CNN:Convolutional Neural Network,卷积神经网络。
-
RNN:Recurrent Neural Network,循环神经网络。
-
LSTM:Long Short Term Memory Network,长短记忆网络。