机器学习入门:什么是机器学习

我想从机器学习的定义谈起,再讲讲机器学习都有哪些模型。

1 理解机器学习的定义

机器学习是人工智能学科的一个分支。机器学习概念的范畴比人工智能概念的范畴要小,但比深度学习概念范围要大,深度学习的底层是神经网络。这三者的关系大致如图1所示。

图1人工智能、机器学习、深度学习三者之间的关系

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

通常我们口头上讲的人工智能是技术上的概念,这些技术包括但不限于机器学习、深度学习、自然语言处理、智能机器人、图像识别、语音识别、视频识别、手势控制、人机交互、知识推荐与过滤引擎、情境感知等。这些技术并不是完全的并列关系,它们之间又有交叉和重叠,如,机器学习是图像识别、语音识别的基础,图像识别、语音识别都会用到深度学习的很多算法。

上述技术可以广泛的应用到各行各业,包括但不限于互联网、金融业、智能交通、智慧旅游、工业机器人、服务机器人、自动驾驶、智能家居、精准农业、智能安防、翻译助手、博弈游戏、医学诊断、公共服务、场景教学、自动阅卷等。

那什么是机器学习呢?这里的机器指的就是计算机,并不是指的机器人、汽车等机械系统。通常认为,机器学习是指用计算机模拟人类学习行为的技术,用来从已知数据中获得新的知识。计算机相比人类的长处就在于存储容量大、计算速度快、擅长做大量重复的工作,因此在涉及大量的数据及从中学习出知识时,机器学习能发挥出计算机的特长。

有很多人总在争论机器会不会有自主思维?其实从我们做技术研究的人角度来看,要有自主思维还早得很,现有的技术要模拟出人类完整的复杂思维还够现实,我们还是现实一点,学会来用机器帮助我们解决一些工程实践问题吧。

2 机器学习有哪些模型

机器学习先选定模型从已有数据中学习到模型的参数值,再通过模型做出预测。机器学习模型的用途主要有2种,一种称为分类 ,如,对图像的分类;另一种称为回归,如,预测出股票的价格。这2种用途奠定了机器学习应用的基础,据此可应用到情感识别、图像处理等场景中。本书中举的例子也都是这2类用途应用的例子。有关回归的内涵后续还会详细讲解,这里可先有个感性认识。

根据模型的特征,机器学习模型还可以分为监督学习模型、无监督学习模型、强化学习模型和其它模型4类,如图2所示。监督学习模型需要先有训练数据(包括特征数据项和目标数据项),从训练数据中学习到知识。无监督学习模型也需要有训练数据,但训练数据不需要有目标数据项。强化学习则可以边探索数据边学习模型,使得模型越来越"强"。

要想打好机器学习的数学基础,请参见清华大学出版社的人人可懂系列,包括《人人可懂的微积分》(已上市)、《人人可懂的线性代数》(即将上市)、《人人可懂的概率统计》(即将上市)。

监督学习模型有线性回归、逻辑回归、贝叶斯、决策树、支持向量机、KNN(K-Nearest Neighbor,K近邻算法)、集成学习等,本书主要详细讲解其中的6种。无监督学习包括各种聚类模型和降维模型,如PCA(Principle Component Analysis,主成分分析)。强化学习有Sarsa、DQN(Deep Q-Network,深度Q网络)等。其它模型还有深度学习的各种模型、隐马尔科夫模型、迁移学习模型等。可见,机器学习模型的种类非常丰富,而且事实上还远不止图中列出的这些模型,连我们常听人说起的深度学习也只是其中的一类。

图2 机器学习的模型

说明: 1. CNN:Convolutional Neural Network,卷积神经网络。

  1. RNN:Recurrent Neural Network,循环神经网络。

  2. LSTM:Long Short Term Memory Network,长短记忆网络。

相关推荐
Java后端的Ai之路2 小时前
【机器学习】- CatBoost模型参数详细说明
人工智能·机器学习·catboost·模型参数
java1234_小锋2 小时前
AI蒸馏技术:让AI更智能、更高效
人工智能·ai·ai蒸馏
饼干哥哥2 小时前
1 个人用AI编程开发的产品卖了8000万美金——Base44的增长策略全拆解
人工智能·ai编程
virtaitech2 小时前
云平台一键部署【Step-1X-3D】3D生成界的Flux
人工智能·科技·ai·gpu·算力·云平台
简叙生活2 小时前
CES2026吹响AI硬件集结号,RTC技术何以成为“隐形引擎”?
人工智能·实时音视频
Elastic 中国社区官方博客2 小时前
jina-embeddings-v3 现已在 Elastic Inference Service 上可用
大数据·人工智能·elasticsearch·搜索引擎·ai·jina
Delroy3 小时前
Vercel 凌晨突发:agent-browser 来了,减少 93% 上下文!AI 终于有了“操纵现实”的手! 🚀
人工智能·爬虫·机器学习
Elastic 中国社区官方博客3 小时前
使用 jina-embeddings-v3 和 Elasticsearch 进行多语言搜索
大数据·数据库·人工智能·elasticsearch·搜索引擎·全文检索·jina
百***78753 小时前
GLM-4.7深度实测:开源编码王者,Claude Opus 4.5平替方案全解析
人工智能·gpt