1.深度学习基础-有监督学习、无监督学习和强化学习

有监督学习、无监督学习和强化学习

定义

深度学习(机器学习)任务可以简单分为有监督学习、无监督学习、强化学习等。

其中,有监督学习从有标签的训练数据中推导出预测函数,有标签的训练数据是指每个训练的样本都包含输入和对应的真实输出。总结就是一句话:给定数据,给定标签

无监督学习是与有监督学习的另一种学习类别。它从无标记的训练数据中推断结论。其中最典型的无监督学习就是无监督聚类分析,它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。一句话:给定数据,无标签,自行探索隐藏结构

强化学习是机器学习的另一个领域。它更加关注模型在环境中采取某一行为,以便获取最大化某种积累的会报。一句话:给定数据,模型学习一系列行为,并获得最大化收益

特点

有监督学习

  • 有标签
  • 直接反馈
  • 预测未来

无监督学习

  • 无标签
  • 无反馈
  • 寻找隐藏的结构

强化学习

  • 决策流程
  • 激励系统

对应任务

有监督学习

  • 分类
  • 回归

无监督学习

  • 聚类
  • 降维

强化学习

  • 马尔可夫决策过程
  • 动态规划
相关推荐
盘古开天16666 分钟前
从零开始:如何搭建你的第一个简单的Flask网站
后端·python·flask
dxnb2227 分钟前
【Datawhale25年11月组队学习:hello-agents+Task1学习笔记】
人工智能·学习
点云SLAM30 分钟前
方差的迭代计算公式
大数据·深度学习·数据分析·概率论·数学原理·概论率
二进制星轨37 分钟前
Transofrmer架构详解与PyTorch实现(附代码讲解)
人工智能·pytorch·python
weixin_3870021544 分钟前
漏洞修复学习之CVE-2024-10976漏洞复现
数据库·sql·学习·安全·postgresql
生而为虫1 小时前
02.第一个Python程序
开发语言·python
领航猿1号1 小时前
DeepSeek-OCR 上下文光学压缩详解与本地部署及vLLM推理
人工智能·aigc·ocr
东方隐侠安全团队-千里1 小时前
第3节 RSA算法开启公钥加密时代
网络·人工智能·算法
骄傲的心别枯萎1 小时前
RV1126 NO.46:RV1126+OPENCV对视频流进行视频膨胀操作
人工智能·opencv·计算机视觉·音视频·rv1126