博弈论03——混合纳什均衡的收益求法

纳什均衡第二部分

性别之战------回顾

背景:

Alice 和 Bob 这两位玩家是朋友,他们想见面喝杯咖啡。Alice 喜欢去 Costa,Bob 更喜欢去星巴克,但最重要的是,对他们来说最重要的是去同一个地方,这样他们才能真正见面。

存在纯纳什均衡

Best response 法

得到两个纯纳什均衡。

存在混合纳什均衡

对于Alice:

EU B C = EU B S σ A C ( 1 ) + ( 1 − σ A C ) ( 0 ) = σ A C ( 0 ) + ( 1 − σ A C ) ( 3 ) σ A C = 3 − 3 σ A C 4 σ A C = 3 σ A C = 3 4 \begin{aligned} \text{EU}{BC} &= \text{EU}{BS} \\ \sigma_{AC}(1) + (1 - \sigma_{AC})(0) &= \sigma_{AC}(0) + (1 - \sigma_{AC})(3) \\ \sigma_{AC} &= 3 - 3\sigma_{AC} \\ 4\sigma_{AC}&=3 \\ \sigma_{AC} &= \frac{3}{4} \end{aligned} EUBCσAC(1)+(1−σAC)(0)σAC4σACσAC=EUBS=σAC(0)+(1−σAC)(3)=3−3σAC=3=43

Alice的混合策略是(3/4 ,1/4)

对于Bob:

EU A C = EU A S σ B C ( 3 ) + ( 1 − σ B C ) ( 0 ) = σ B C ( 0 ) + ( 1 − σ B C ) ( 1 ) 3 σ B C = 1 − σ B C 4 σ B C = 1 σ B C = 1 4 \begin{aligned} \text{EU}{AC} &= \text{EU}{AS} \\ \sigma_{BC}(3) + (1 - \sigma_{BC})(0) &= \sigma_{BC}(0) + (1 - \sigma_{BC})(1) \\ 3\sigma_{BC} &= 1 - \sigma_{BC} \\ 4\sigma_{BC}&=1 \\ \sigma_{BC} &= \frac{1}{4} \end{aligned} EUACσBC(3)+(1−σBC)(0)3σBC4σBCσBC=EUAS=σBC(0)+(1−σBC)(1)=1−σBC=1=41

Bob的混合策略是(1/4 ,3/4)

总结

混合策略的求法:设定自己的概率,让对方无差别,用对方的payoff×自己的概率,并相等。

一个博弈是否可以同时存在纯纳什均衡和混合纳什均衡?

是的,可以同时存在。

许多博弈(如"性别之战")既有纯策略纳什均衡,也有混合策略纳什均衡。

一个博弈是否一定存在至少一种纳什均衡?

是的,每个有限博弈(有限个玩家 + 有限个策略)根据纳什定理(Nash's Theorem),至少存在一个纳什均衡(可能是纯的,也可能是混合的)

payoffs收益求法

计算方法:

  1. 求出每个玩家的混合纳什策略概率;
  2. 相乘,求出每个事件发生的概率;
  3. 每个事件发生的概率乘以这个事件发生对这个玩家的payoff影响。相加求和。

性别之战

相乘,求事件概率

对于玩家1,

P a y o f f 1 = 1 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 2 ∗ 2 / 9 = 5 / 9 Payoff_1 = 1 * 2/9 + 0 * 1/9 + 0 * 4/9 + 2 * 2/9 = 5/9 Payoff1=1∗2/9+0∗1/9+0∗4/9+2∗2/9=5/9

对于玩家2,


P a y o f f 2 = 2 ∗ 2 / 9 + 0 ∗ 1 / 9 + 0 ∗ 4 / 9 + 1 ∗ 2 / 9 = 2 / 3 Payoff_2 = 2 * 2/9 + 0 * 1/9 + 0 * 4/9 + 1 * 2/9 = 2/3 Payoff2=2∗2/9+0∗1/9+0∗4/9+1∗2/9=2/3

相关推荐
三块可乐两块冰18 分钟前
【第二十九周】机器学习笔记三十
笔记
晚霞的不甘34 分钟前
Flutter for OpenHarmony 可视化教学:A* 寻路算法的交互式演示
人工智能·算法·flutter·架构·开源·音视频
望舒51337 分钟前
代码随想录day25,回溯算法part4
java·数据结构·算法·leetcode
C++ 老炮儿的技术栈1 小时前
Qt 编写 TcpClient 程序 详细步骤
c语言·开发语言·数据库·c++·qt·算法
KYGALYX1 小时前
逻辑回归详解
算法·机器学习·逻辑回归
听麟1 小时前
HarmonyOS 6.0+ 跨端智慧政务服务平台开发实战:多端协同办理与电子证照管理落地
笔记·华为·wpf·音视频·harmonyos·政务
铉铉这波能秀1 小时前
LeetCode Hot100数据结构背景知识之集合(Set)Python2026新版
数据结构·python·算法·leetcode·哈希算法
踢足球09291 小时前
寒假打卡:2026-2-8
数据结构·算法
IT猿手1 小时前
基于强化学习的多算子差分进化路径规划算法QSMODE的机器人路径规划问题研究,提供MATLAB代码
算法·matlab·机器人
千逐-沐风1 小时前
SMU-ACM2026冬训周报3rd
算法