有监督学习、无监督学习和强化学习
定义
深度学习(机器学习)任务可以简单分为有监督学习、无监督学习、强化学习等。
其中,有监督学习从有标签的训练数据中推导出预测函数,有标签的训练数据是指每个训练的样本都包含输入和对应的真实输出。总结就是一句话:给定数据,给定标签
无监督学习是与有监督学习的另一种学习类别。它从无标记的训练数据中推断结论。其中最典型的无监督学习就是无监督聚类分析,它可以在探索性数据分析阶段用于发现隐藏的模式或者对数据进行分组。一句话:给定数据,无标签,自行探索隐藏结构
强化学习是机器学习的另一个领域。它更加关注模型在环境中采取某一行为,以便获取最大化某种积累的会报。一句话:给定数据,模型学习一系列行为,并获得最大化收益
特点
有监督学习
- 有标签
- 直接反馈
- 预测未来
无监督学习
- 无标签
- 无反馈
- 寻找隐藏的结构
强化学习
- 决策流程
- 激励系统
对应任务
有监督学习
- 分类
- 回归
无监督学习
- 聚类
- 降维
强化学习
- 马尔可夫决策过程
- 动态规划