1.深度学习基础-有监督学习、无监督学习和强化学习

有监督学习、无监督学习和强化学习

定义

深度学习(机器学习)任务可以简单分为有监督学习、无监督学习、强化学习等。

其中,有监督学习从有标签的训练数据中推导出预测函数,有标签的训练数据是指每个训练的样本都包含输入和对应的真实输出。总结就是一句话:给定数据,给定标签

无监督学习是与有监督学习的另一种学习类别。它从无标记的训练数据中推断结论。其中最典型的无监督学习就是无监督聚类分析,它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。一句话:给定数据,无标签,自行探索隐藏结构

强化学习是机器学习的另一个领域。它更加关注模型在环境中采取某一行为,以便获取最大化某种积累的会报。一句话:给定数据,模型学习一系列行为,并获得最大化收益

特点

有监督学习

  • 有标签
  • 直接反馈
  • 预测未来

无监督学习

  • 无标签
  • 无反馈
  • 寻找隐藏的结构

强化学习

  • 决策流程
  • 激励系统

对应任务

有监督学习

  • 分类
  • 回归

无监督学习

  • 聚类
  • 降维

强化学习

  • 马尔可夫决策过程
  • 动态规划
相关推荐
音程9 分钟前
什么是Jaccard 相似度(Jaccard Similarity)
深度学习·数据挖掘
乙真仙人28 分钟前
AI Agents时代,数据分析将彻底被颠覆
人工智能·数据挖掘·数据分析
大模型最新论文速读36 分钟前
指令微调时,也要考虑提示损失
人工智能·深度学习·语言模型·自然语言处理·llama
张较瘦_43 分钟前
[论文阅读] 人工智能 + 软件工程 | AI助力软件可解释性:从用户评论到自动生成需求与解释
论文阅读·人工智能·软件工程
鼓掌MVP1 小时前
巅峰对决:文心4.5 vs DeepSeek R1 vs 通义Qwen3.0——国产大模型技术路线与场景能力深度横评
人工智能
大千AI助手1 小时前
BERT:双向Transformer革命 | 重塑自然语言理解的预训练范式
人工智能·深度学习·机器学习·自然语言处理·llm·bert·transformer
brave_zhao1 小时前
JavaBeanUtils javaBean转map, 实体类转map,实体集合转List<Map>
linux·windows·python
吕永强1 小时前
工厂的神经进化—工业智能体重塑制造本质的技术革命与文明挑战
人工智能·科普
后端小肥肠1 小时前
效率革命!10分钟用Dify+Spring Boot打造AI热点雷达,自媒体选赛道再不难!(附保姆级教程)
人工智能·spring boot·agent
声网1 小时前
对话 AI 陪伴新宠 Tolan 创始人:拒绝「恋爱脑」,「非人」陪伴更受欢迎?丨 Voice Agent 学习笔记
人工智能·笔记·学习