机器学习入门:什么是机器学习

我想从机器学习的定义谈起,再讲讲机器学习都有哪些模型。

1 理解机器学习的定义

机器学习是人工智能学科的一个分支。机器学习概念的范畴比人工智能概念的范畴要小,但比深度学习概念范围要大,深度学习的底层是神经网络。这三者的关系大致如图1所示。

图1人工智能、机器学习、深度学习三者之间的关系

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

通常我们口头上讲的人工智能是技术上的概念,这些技术包括但不限于机器学习、深度学习、自然语言处理、智能机器人、图像识别、语音识别、视频识别、手势控制、人机交互、知识推荐与过滤引擎、情境感知等。这些技术并不是完全的并列关系,它们之间又有交叉和重叠,如,机器学习是图像识别、语音识别的基础,图像识别、语音识别都会用到深度学习的很多算法。

上述技术可以广泛的应用到各行各业,包括但不限于互联网、金融业、智能交通、智慧旅游、工业机器人、服务机器人、自动驾驶、智能家居、精准农业、智能安防、翻译助手、博弈游戏、医学诊断、公共服务、场景教学、自动阅卷等。

那什么是机器学习呢?这里的机器指的就是计算机,并不是指的机器人、汽车等机械系统。通常认为,机器学习是指用计算机模拟人类学习行为的技术,用来从已知数据中获得新的知识。计算机相比人类的长处就在于存储容量大、计算速度快、擅长做大量重复的工作,因此在涉及大量的数据及从中学习出知识时,机器学习能发挥出计算机的特长。

有很多人总在争论机器会不会有自主思维?其实从我们做技术研究的人角度来看,要有自主思维还早得很,现有的技术要模拟出人类完整的复杂思维还够现实,我们还是现实一点,学会来用机器帮助我们解决一些工程实践问题吧。

2 机器学习有哪些模型

机器学习先选定模型从已有数据中学习到模型的参数值,再通过模型做出预测。机器学习模型的用途主要有2种,一种称为分类 ,如,对图像的分类;另一种称为回归,如,预测出股票的价格。这2种用途奠定了机器学习应用的基础,据此可应用到情感识别、图像处理等场景中。本书中举的例子也都是这2类用途应用的例子。有关回归的内涵后续还会详细讲解,这里可先有个感性认识。

根据模型的特征,机器学习模型还可以分为监督学习模型、无监督学习模型、强化学习模型和其它模型4类,如图2所示。监督学习模型需要先有训练数据(包括特征数据项和目标数据项),从训练数据中学习到知识。无监督学习模型也需要有训练数据,但训练数据不需要有目标数据项。强化学习则可以边探索数据边学习模型,使得模型越来越"强"。

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

监督学习模型有线性回归、逻辑回归、贝叶斯、决策树、支持向量机、KNN(K-Nearest Neighbor,K近邻算法)、集成学习等,本书主要详细讲解其中的6种。无监督学习包括各种聚类模型和降维模型,如PCA(Principle Component Analysis,主成分分析)。强化学习有Sarsa、DQN(Deep Q-Network,深度Q网络)等。其它模型还有深度学习的各种模型、隐马尔科夫模型、迁移学习模型等。可见,机器学习模型的种类非常丰富,而且事实上还远不止图中列出的这些模型,连我们常听人说起的深度学习也只是其中的一类。

图2 机器学习的模型

说明: 1. CNN:Convolutional Neural Network,卷积神经网络。

  1. RNN:Recurrent Neural Network,循环神经网络。

  2. LSTM:Long Short Term Memory Network,长短记忆网络。

相关推荐
湘美书院--湘美谈教育几秒前
湘美谈教育AI系列经验集锦:赋能整理聊斋志异大寓言
大数据·人工智能·深度学习·神经网络·机器学习
宜昌未来智慧谷3 分钟前
WWDC 2026开发者视角解读:Siri独立App的技术架构与第三方AI模型接入机制
人工智能·架构·apple·wwdc·gemini
协享科技4 分钟前
Spring Boot 与 Go 双服务架构实践:从单体拆分到通信设计
java·人工智能·spring boot·后端·架构·golang·ai编程
piglet1213812 分钟前
把搜索调到 Claude.ai 的水准
前端·人工智能
Linlingu13 分钟前
openClaw不能操作我的电脑提示没有权限如何解决?
人工智能·windows·办公自动化·数字员工·小龙虾
snpgroupcn19 分钟前
SNP亮相2026思爱普中国峰会,助力企业加速数据价值兑现
人工智能
IT乐手20 分钟前
Anthropic 为何限制中国大陆使用 Claude?
人工智能
To_OC22 分钟前
用 ESM 模块化搭建 DeepSeek LLM 调用,顺带用 Prompt 实现轻量 NLP 任务
人工智能·nlp·deepseek
jrjrgood26 分钟前
现货黄金和黄金期货的区别有哪些?如何投资?
大数据·人工智能·区块链
属于自己的天空28 分钟前
确认弹窗太多?一次配好 Claude Code 权限,安心让 AI 干活
人工智能