博弈论03——混合纳什均衡的收益求法

纳什均衡第二部分

性别之战------回顾

背景:

Alice 和 Bob 这两位玩家是朋友,他们想见面喝杯咖啡。Alice 喜欢去 Costa,Bob 更喜欢去星巴克,但最重要的是,对他们来说最重要的是去同一个地方,这样他们才能真正见面。

存在纯纳什均衡

Best response 法

得到两个纯纳什均衡。

存在混合纳什均衡

对于Alice:

EU B C = EU B S σ A C ( 1 ) + ( 1 − σ A C ) ( 0 ) = σ A C ( 0 ) + ( 1 − σ A C ) ( 3 ) σ A C = 3 − 3 σ A C 4 σ A C = 3 σ A C = 3 4 \begin{aligned} \text{EU}{BC} &= \text{EU}{BS} \\ \sigma_{AC}(1) + (1 - \sigma_{AC})(0) &= \sigma_{AC}(0) + (1 - \sigma_{AC})(3) \\ \sigma_{AC} &= 3 - 3\sigma_{AC} \\ 4\sigma_{AC}&=3 \\ \sigma_{AC} &= \frac{3}{4} \end{aligned} EUBCσAC(1)+(1−σAC)(0)σAC4σACσAC=EUBS=σAC(0)+(1−σAC)(3)=3−3σAC=3=43

Alice的混合策略是(3/4 ,1/4)

对于Bob:

EU A C = EU A S σ B C ( 3 ) + ( 1 − σ B C ) ( 0 ) = σ B C ( 0 ) + ( 1 − σ B C ) ( 1 ) 3 σ B C = 1 − σ B C 4 σ B C = 1 σ B C = 1 4 \begin{aligned} \text{EU}{AC} &= \text{EU}{AS} \\ \sigma_{BC}(3) + (1 - \sigma_{BC})(0) &= \sigma_{BC}(0) + (1 - \sigma_{BC})(1) \\ 3\sigma_{BC} &= 1 - \sigma_{BC} \\ 4\sigma_{BC}&=1 \\ \sigma_{BC} &= \frac{1}{4} \end{aligned} EUACσBC(3)+(1−σBC)(0)3σBC4σBCσBC=EUAS=σBC(0)+(1−σBC)(1)=1−σBC=1=41

Bob的混合策略是(1/4 ,3/4)

总结

混合策略的求法:设定自己的概率,让对方无差别,用对方的payoff×自己的概率,并相等。

一个博弈是否可以同时存在纯纳什均衡和混合纳什均衡?

是的,可以同时存在。

许多博弈(如"性别之战")既有纯策略纳什均衡,也有混合策略纳什均衡。

一个博弈是否一定存在至少一种纳什均衡?

是的,每个有限博弈(有限个玩家 + 有限个策略)根据纳什定理(Nash's Theorem),至少存在一个纳什均衡(可能是纯的,也可能是混合的)

payoffs收益求法

计算方法:

  1. 求出每个玩家的混合纳什策略概率;
  2. 相乘,求出每个事件发生的概率;
  3. 每个事件发生的概率乘以这个事件发生对这个玩家的payoff影响。相加求和。

性别之战

相乘,求事件概率

对于玩家1,

P a y o f f 1 = 1 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 2 ∗ 2 / 9 = 5 / 9 Payoff_1 = 1 * 2/9 + 0 * 1/9 + 0 * 4/9 + 2 * 2/9 = 5/9 Payoff1=1∗2/9+0∗1/9+0∗4/9+2∗2/9=5/9

对于玩家2,


P a y o f f 2 = 2 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 1 ∗ 2 / 9 = 2 / 3 Payoff_2 = 2 * 2/9 + 0 * 1/9 + 0 * 4/9 + 1 * 2/9 = 2/3 Payoff2=2∗2/9+0∗1/9+0∗4/9+1∗2/9=2/3

相关推荐
地平线开发者7 小时前
SparseDrive 模型导出与性能优化实战
算法·自动驾驶
董董灿是个攻城狮7 小时前
大模型连载2:初步认识 tokenizer 的过程
算法
地平线开发者8 小时前
地平线 VP 接口工程实践(一):hbVPRoiResize 接口功能、使用约束与典型问题总结
算法·自动驾驶
罗西的思考8 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
HXhlx11 小时前
CART决策树基本原理
算法·机器学习
Wect12 小时前
LeetCode 210. 课程表 II 题解:Kahn算法+DFS 双解法精讲
前端·算法·typescript
颜酱12 小时前
单调队列:滑动窗口极值问题的最优解(通用模板版)
javascript·后端·算法
Gorway19 小时前
解析残差网络 (ResNet)
算法
拖拉斯旋风19 小时前
LeetCode 经典算法题解析:优先队列与广度优先搜索的巧妙应用
算法
Wect19 小时前
LeetCode 207. 课程表:两种解法(BFS+DFS)详细解析
前端·算法·typescript