第一章_机器学习概述_03.机器学习_算法分类

一、有监督学习 & 无监督学习

有监督学习:输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的。

无监督学习:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系。

二、有监督分类问题 & 回归问题

三、半监督学习

工作原理:

1、让专家标注少量数据,利用已经标记的数据(也就是带有类标签)训练出一个模型

2、再利用该模型去套用未标记的数据

3、通过询问领域专家分类结果与模型分类结果做对比,从而对模型做进一步改善和提高

思考有什么好处? 半监督学习方式可大幅降低标记成本

四、强化学习

1、强化学习(Reinforcement Learning):机器学习的一个重要分支

2、应用场景:里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景

3、 基本原理:通过构建四个要素:agent,环境状态,行动,奖励,agent根据环境状态进行行动获得最多的累计奖励。

强化学习:寻找最短路径(最优解),以便获得最多的奖励。

五、总结

相关推荐
凌波粒2 分钟前
LeetCode--108.将有序数组转换为二叉搜索树(二叉树)
算法·leetcode·职场和发展
liulilittle2 分钟前
KCC:在 BBR 思路上的一次探索
网络·tcp/ip·算法·bbr·通信·拥塞控制·kcc
浦信仿真大讲堂24 分钟前
达索系统SIMULIA Abaqus 2026接触和约束的增强新功能介绍
人工智能·python·算法·仿真软件·达索软件
点云侠34 分钟前
PCL 生成三棱锥点云
c++·算法·最小二乘法
兰令水1 小时前
leecodecode【面试150】【2026.6.13打卡-java版本】
java·算法·leetcode
临沂堇1 小时前
刷题日志 | Leetcode Hot 100 哈希
算法·leetcode·哈希算法
安逸sgr1 小时前
《图解机器学习-第四章》:损失函数和梯度下降:模型是怎么被训练出来的?
人工智能·机器学习·图解机器学习
玉小格1 小时前
一次关于Python的总结
算法
伊甸31 小时前
从企业级项目学敏感词过滤:DFA算法与双层缓存实战
java·算法·缓存
bIo7lyA8v1 小时前
算法中的随机化思想及其复杂度收益评估的技术8
算法