技术栈
马尔可夫
学海一叶
9 个月前
算法
·
机器学习
·
概率论
·
强化学习
·
马尔可夫
强化学习-马尔可夫模型
前文提到了强化学习源自马尔可夫决策过程,本文从马尔可夫概念入手,讲解和马尔可夫有关的模型和概念。马尔科夫模型是一个很大的概念,从模型的定义和性质来看,具有马尔科夫性质、并以随机过程为基础模型的随机过程/随机模型被统称为马尔科夫模型,其中就包含我们悉知的马尔科夫链、马尔科夫决策过程、隐马尔科夫链(HMM)和马尔科夫随机场等随机过程/随机模型。