博弈论03——混合纳什均衡的收益求法

纳什均衡第二部分

性别之战------回顾

背景:

Alice 和 Bob 这两位玩家是朋友,他们想见面喝杯咖啡。Alice 喜欢去 Costa,Bob 更喜欢去星巴克,但最重要的是,对他们来说最重要的是去同一个地方,这样他们才能真正见面。

存在纯纳什均衡

Best response 法

得到两个纯纳什均衡。

存在混合纳什均衡

对于Alice:

EU B C = EU B S σ A C ( 1 ) + ( 1 − σ A C ) ( 0 ) = σ A C ( 0 ) + ( 1 − σ A C ) ( 3 ) σ A C = 3 − 3 σ A C 4 σ A C = 3 σ A C = 3 4 \begin{aligned} \text{EU}{BC} &= \text{EU}{BS} \\ \sigma_{AC}(1) + (1 - \sigma_{AC})(0) &= \sigma_{AC}(0) + (1 - \sigma_{AC})(3) \\ \sigma_{AC} &= 3 - 3\sigma_{AC} \\ 4\sigma_{AC}&=3 \\ \sigma_{AC} &= \frac{3}{4} \end{aligned} EUBCσAC(1)+(1−σAC)(0)σAC4σACσAC=EUBS=σAC(0)+(1−σAC)(3)=3−3σAC=3=43

Alice的混合策略是(3/4 ,1/4)

对于Bob:

EU A C = EU A S σ B C ( 3 ) + ( 1 − σ B C ) ( 0 ) = σ B C ( 0 ) + ( 1 − σ B C ) ( 1 ) 3 σ B C = 1 − σ B C 4 σ B C = 1 σ B C = 1 4 \begin{aligned} \text{EU}{AC} &= \text{EU}{AS} \\ \sigma_{BC}(3) + (1 - \sigma_{BC})(0) &= \sigma_{BC}(0) + (1 - \sigma_{BC})(1) \\ 3\sigma_{BC} &= 1 - \sigma_{BC} \\ 4\sigma_{BC}&=1 \\ \sigma_{BC} &= \frac{1}{4} \end{aligned} EUACσBC(3)+(1−σBC)(0)3σBC4σBCσBC=EUAS=σBC(0)+(1−σBC)(1)=1−σBC=1=41

Bob的混合策略是(1/4 ,3/4)

总结

混合策略的求法:设定自己的概率,让对方无差别,用对方的payoff×自己的概率,并相等。

一个博弈是否可以同时存在纯纳什均衡和混合纳什均衡?

是的,可以同时存在。

许多博弈(如"性别之战")既有纯策略纳什均衡,也有混合策略纳什均衡。

一个博弈是否一定存在至少一种纳什均衡?

是的,每个有限博弈(有限个玩家 + 有限个策略)根据纳什定理(Nash's Theorem),至少存在一个纳什均衡(可能是纯的,也可能是混合的)

payoffs收益求法

计算方法:

  1. 求出每个玩家的混合纳什策略概率;
  2. 相乘,求出每个事件发生的概率;
  3. 每个事件发生的概率乘以这个事件发生对这个玩家的payoff影响。相加求和。

性别之战

相乘,求事件概率

对于玩家1,

P a y o f f 1 = 1 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 2 ∗ 2 / 9 = 5 / 9 Payoff_1 = 1 * 2/9 + 0 * 1/9 + 0 * 4/9 + 2 * 2/9 = 5/9 Payoff1=1∗2/9+0∗1/9+0∗4/9+2∗2/9=5/9

对于玩家2,


P a y o f f 2 = 2 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 1 ∗ 2 / 9 = 2 / 3 Payoff_2 = 2 * 2/9 + 0 * 1/9 + 0 * 4/9 + 1 * 2/9 = 2/3 Payoff2=2∗2/9+0∗1/9+0∗4/9+1∗2/9=2/3

相关推荐
虾饺爱下棋1 分钟前
FCN语义分割算法原理与实战
人工智能·python·神经网络·算法
Eloudy3 小时前
简明量子态密度矩阵理论知识点总结
算法·量子力学
点云SLAM3 小时前
Eigen 中矩阵的拼接(Concatenation)与 分块(Block Access)操作使用详解和示例演示
人工智能·线性代数·算法·矩阵·eigen数学工具库·矩阵分块操作·矩阵拼接操作
悠哉悠哉愿意4 小时前
【电赛学习笔记】MaixCAM 的OCR图片文字识别
笔记·python·嵌入式硬件·学习·视觉检测·ocr
算法_小学生5 小时前
支持向量机(SVM)完整解析:原理 + 推导 + 核方法 + 实战
算法·机器学习·支持向量机
_Kayo_5 小时前
VUE2 学习笔记5 动态绑定class、条件渲染、列表过滤与排序
笔记·学习
iamlujingtao5 小时前
js多边形算法:获取多边形中心点,且必定在多边形内部
javascript·算法
算法_小学生5 小时前
逻辑回归(Logistic Regression)详解:从原理到实战一站式掌握
算法·机器学习·逻辑回归
DebugKitty6 小时前
C语言14-指针4-二维数组传参、指针数组传参、viod*指针
c语言·开发语言·算法·指针传参·void指针·数组指针传参
qystca6 小时前
MC0241防火墙
算法