机器学习入门:什么是机器学习

我想从机器学习的定义谈起,再讲讲机器学习都有哪些模型。

1 理解机器学习的定义

机器学习是人工智能学科的一个分支。机器学习概念的范畴比人工智能概念的范畴要小,但比深度学习概念范围要大,深度学习的底层是神经网络。这三者的关系大致如图1所示。

图1人工智能、机器学习、深度学习三者之间的关系

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

通常我们口头上讲的人工智能是技术上的概念,这些技术包括但不限于机器学习、深度学习、自然语言处理、智能机器人、图像识别、语音识别、视频识别、手势控制、人机交互、知识推荐与过滤引擎、情境感知等。这些技术并不是完全的并列关系,它们之间又有交叉和重叠,如,机器学习是图像识别、语音识别的基础,图像识别、语音识别都会用到深度学习的很多算法。

上述技术可以广泛的应用到各行各业,包括但不限于互联网、金融业、智能交通、智慧旅游、工业机器人、服务机器人、自动驾驶、智能家居、精准农业、智能安防、翻译助手、博弈游戏、医学诊断、公共服务、场景教学、自动阅卷等。

那什么是机器学习呢?这里的机器指的就是计算机,并不是指的机器人、汽车等机械系统。通常认为,机器学习是指用计算机模拟人类学习行为的技术,用来从已知数据中获得新的知识。计算机相比人类的长处就在于存储容量大、计算速度快、擅长做大量重复的工作,因此在涉及大量的数据及从中学习出知识时,机器学习能发挥出计算机的特长。

有很多人总在争论机器会不会有自主思维?其实从我们做技术研究的人角度来看,要有自主思维还早得很,现有的技术要模拟出人类完整的复杂思维还够现实,我们还是现实一点,学会来用机器帮助我们解决一些工程实践问题吧。

2 机器学习有哪些模型

机器学习先选定模型从已有数据中学习到模型的参数值,再通过模型做出预测。机器学习模型的用途主要有2种,一种称为分类 ,如,对图像的分类;另一种称为回归,如,预测出股票的价格。这2种用途奠定了机器学习应用的基础,据此可应用到情感识别、图像处理等场景中。本书中举的例子也都是这2类用途应用的例子。有关回归的内涵后续还会详细讲解,这里可先有个感性认识。

根据模型的特征,机器学习模型还可以分为监督学习模型、无监督学习模型、强化学习模型和其它模型4类,如图2所示。监督学习模型需要先有训练数据(包括特征数据项和目标数据项),从训练数据中学习到知识。无监督学习模型也需要有训练数据,但训练数据不需要有目标数据项。强化学习则可以边探索数据边学习模型,使得模型越来越"强"。

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

监督学习模型有线性回归、逻辑回归、贝叶斯、决策树、支持向量机、KNN(K-Nearest Neighbor,K近邻算法)、集成学习等,本书主要详细讲解其中的6种。无监督学习包括各种聚类模型和降维模型,如PCA(Principle Component Analysis,主成分分析)。强化学习有Sarsa、DQN(Deep Q-Network,深度Q网络)等。其它模型还有深度学习的各种模型、隐马尔科夫模型、迁移学习模型等。可见,机器学习模型的种类非常丰富,而且事实上还远不止图中列出的这些模型,连我们常听人说起的深度学习也只是其中的一类。

图2 机器学习的模型

说明: 1. CNN:Convolutional Neural Network,卷积神经网络。

  1. RNN:Recurrent Neural Network,循环神经网络。

  2. LSTM:Long Short Term Memory Network,长短记忆网络。

相关推荐
慢半拍iii10 分钟前
CANN算子开发实战:手把手教你基于ops-nn仓库编写Broadcast广播算子
人工智能·计算机网络·ai
User_芊芊君子23 分钟前
CANN数学计算基石ops-math深度解析:高性能科学计算与AI模型加速的核心引擎
人工智能·深度学习·神经网络·ai
小白|26 分钟前
CANN与联邦学习融合:构建隐私安全的分布式AI推理与训练系统
人工智能·机器学习·自动驾驶
艾莉丝努力练剑33 分钟前
hixl vs NCCL:昇腾生态通信库的独特优势分析
运维·c++·人工智能·cann
梦帮科技34 分钟前
Node.js配置生成器CLI工具开发实战
前端·人工智能·windows·前端框架·node.js·json
程序员泠零澪回家种桔子36 分钟前
Spring AI框架全方位详解
java·人工智能·后端·spring·ai·架构
Echo_NGC223739 分钟前
【FFmpeg 使用指南】Part 3:码率控制策略与质量评估体系
人工智能·ffmpeg·视频·码率
纤纡.1 小时前
PyTorch 入门精讲:从框架选择到 MNIST 手写数字识别实战
人工智能·pytorch·python
大大大反派1 小时前
CANN 生态中的自动化部署引擎:深入 `mindx-sdk` 项目构建端到端 AI 应用
运维·人工智能·自动化
程序猿追1 小时前
深度解读 AIR (AI Runtime):揭秘 CANN 极致算力编排与调度的核心引擎
人工智能