1.深度学习基础-有监督学习、无监督学习和强化学习

有监督学习、无监督学习和强化学习

定义

深度学习(机器学习)任务可以简单分为有监督学习、无监督学习、强化学习等。

其中,有监督学习从有标签的训练数据中推导出预测函数,有标签的训练数据是指每个训练的样本都包含输入和对应的真实输出。总结就是一句话:给定数据,给定标签

无监督学习是与有监督学习的另一种学习类别。它从无标记的训练数据中推断结论。其中最典型的无监督学习就是无监督聚类分析,它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。一句话:给定数据,无标签,自行探索隐藏结构

强化学习是机器学习的另一个领域。它更加关注模型在环境中采取某一行为,以便获取最大化某种积累的会报。一句话:给定数据,模型学习一系列行为,并获得最大化收益

特点

有监督学习

  • 有标签
  • 直接反馈
  • 预测未来

无监督学习

  • 无标签
  • 无反馈
  • 寻找隐藏的结构

强化学习

  • 决策流程
  • 激励系统

对应任务

有监督学习

  • 分类
  • 回归

无监督学习

  • 聚类
  • 降维

强化学习

  • 马尔可夫决策过程
  • 动态规划
相关推荐
iAm_Ike4 小时前
Go 中自定义类型与基础类型间的显式类型转换详解
jvm·数据库·python
iuvtsrt4 小时前
Golang怎么实现方法集与接口的匹配_Golang如何理解值类型和指针类型实现接口的区别【详解】
jvm·数据库·python
牧子川4 小时前
009-Transformer-Architecture
人工智能·深度学习·transformer
covco5 小时前
矩阵管理系统指南:拆解星链引擎的架构设计与全链路落地实践
大数据·人工智能·矩阵
沪漂阿龙5 小时前
AI大模型面试题:支持向量机是什么?间隔最大化、软间隔、核函数、LinearSVC 全面拆解
人工智能·算法·支持向量机
lifewange5 小时前
AI编写测试用例工具介绍
人工智能·测试用例
陕西字符5 小时前
2026 西安 豆包获客优化技术深度解析:企来客科技 AI 全域获客系统测评
大数据·人工智能
掘金安东尼5 小时前
GGUF、GPTQ、AWQ、EXL2、MLX、VMLX...运行大模型,为什么会有这么多格式?
人工智能
新知图书5 小时前
市场分析报告自动化生成(使用千问)
人工智能·ai助手·千问·高效办公
无心水5 小时前
【Hermes:安全、权限与生产环境】38、Hermes Agent 安全四层纵深:最小权限原则从理论到落地的完全指南
人工智能·安全·mcp协议·openclaw·养龙虾·hermes·honcho