博弈论03——混合纳什均衡的收益求法

纳什均衡第二部分

性别之战------回顾

背景:

Alice 和 Bob 这两位玩家是朋友,他们想见面喝杯咖啡。Alice 喜欢去 Costa,Bob 更喜欢去星巴克,但最重要的是,对他们来说最重要的是去同一个地方,这样他们才能真正见面。

存在纯纳什均衡

Best response 法

得到两个纯纳什均衡。

存在混合纳什均衡

对于Alice:

EU B C = EU B S σ A C ( 1 ) + ( 1 − σ A C ) ( 0 ) = σ A C ( 0 ) + ( 1 − σ A C ) ( 3 ) σ A C = 3 − 3 σ A C 4 σ A C = 3 σ A C = 3 4 \begin{aligned} \text{EU}{BC} &= \text{EU}{BS} \\ \sigma_{AC}(1) + (1 - \sigma_{AC})(0) &= \sigma_{AC}(0) + (1 - \sigma_{AC})(3) \\ \sigma_{AC} &= 3 - 3\sigma_{AC} \\ 4\sigma_{AC}&=3 \\ \sigma_{AC} &= \frac{3}{4} \end{aligned} EUBCσAC(1)+(1−σAC)(0)σAC4σACσAC=EUBS=σAC(0)+(1−σAC)(3)=3−3σAC=3=43

Alice的混合策略是(3/4 ,1/4)

对于Bob:

EU A C = EU A S σ B C ( 3 ) + ( 1 − σ B C ) ( 0 ) = σ B C ( 0 ) + ( 1 − σ B C ) ( 1 ) 3 σ B C = 1 − σ B C 4 σ B C = 1 σ B C = 1 4 \begin{aligned} \text{EU}{AC} &= \text{EU}{AS} \\ \sigma_{BC}(3) + (1 - \sigma_{BC})(0) &= \sigma_{BC}(0) + (1 - \sigma_{BC})(1) \\ 3\sigma_{BC} &= 1 - \sigma_{BC} \\ 4\sigma_{BC}&=1 \\ \sigma_{BC} &= \frac{1}{4} \end{aligned} EUACσBC(3)+(1−σBC)(0)3σBC4σBCσBC=EUAS=σBC(0)+(1−σBC)(1)=1−σBC=1=41

Bob的混合策略是(1/4 ,3/4)

总结

混合策略的求法:设定自己的概率,让对方无差别,用对方的payoff×自己的概率,并相等。

一个博弈是否可以同时存在纯纳什均衡和混合纳什均衡?

是的,可以同时存在。

许多博弈(如"性别之战")既有纯策略纳什均衡,也有混合策略纳什均衡。

一个博弈是否一定存在至少一种纳什均衡?

是的,每个有限博弈(有限个玩家 + 有限个策略)根据纳什定理(Nash's Theorem),至少存在一个纳什均衡(可能是纯的,也可能是混合的)

payoffs收益求法

计算方法:

  1. 求出每个玩家的混合纳什策略概率;
  2. 相乘,求出每个事件发生的概率;
  3. 每个事件发生的概率乘以这个事件发生对这个玩家的payoff影响。相加求和。

性别之战

相乘,求事件概率

对于玩家1,

P a y o f f 1 = 1 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 2 ∗ 2 / 9 = 5 / 9 Payoff_1 = 1 * 2/9 + 0 * 1/9 + 0 * 4/9 + 2 * 2/9 = 5/9 Payoff1=1∗2/9+0∗1/9+0∗4/9+2∗2/9=5/9

对于玩家2,


P a y o f f 2 = 2 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 1 ∗ 2 / 9 = 2 / 3 Payoff_2 = 2 * 2/9 + 0 * 1/9 + 0 * 4/9 + 1 * 2/9 = 2/3 Payoff2=2∗2/9+0∗1/9+0∗4/9+1∗2/9=2/3

相关推荐
لا معنى له38 分钟前
目标检测的内涵、发展和经典模型--学习笔记
人工智能·笔记·深度学习·学习·目标检测·机器学习
flying robot4 小时前
centos7系统配置
笔记
hh随便起个名4 小时前
力扣二叉树的三种遍历
javascript·数据结构·算法·leetcode
Dingdangcat865 小时前
城市交通多目标检测系统:YOLO11-MAN-FasterCGLU算法优化与实战应用_3
算法·目标检测·目标跟踪
tang&6 小时前
滑动窗口:双指针的优雅舞步,征服连续区间问题的利器
数据结构·算法·哈希算法·滑动窗口
拼命鼠鼠6 小时前
【算法】矩阵链乘法的动态规划算法
算法·矩阵·动态规划
LYFlied6 小时前
【每日算法】LeetCode 17. 电话号码的字母组合
前端·算法·leetcode·面试·职场和发展
式5167 小时前
线性代数(八)非齐次方程组的解的结构
线性代数·算法·机器学习
zhdy567897 小时前
最简单方法 设置matlab坐标轴刻度标签的字号,设置坐标轴标题和图形标题,并指定字号。画出的图片背景设置为白色,
笔记
崇山峻岭之间7 小时前
Matlab学习笔记02
笔记·学习·matlab