数学建模博弈理论与实践国防科大版

4.博弈模型

4.1.Nash平衡点和帕雷托最优

4.2.囚徒困境

4.博弈模型

本讲介绍博弈模型，包括博弈论（Game theory，又称对策论）中最基本的一些概念，以及非合作博弈论中的纳什平衡和帕雷托最优概念，同时介绍博弈论中的几个著名案例：囚徒困境、智猪博弈、脏脸之谜等。

博弈有5个基本要素：

局中人（选手）参与博弈的个人或团体。
策略（对策）可供局中人选择的行动方案。
赢利（获益）局中人的收益或支付。
信息在策略选择中，信息是最关键的因素。
均衡博弈的最终结果。

n人博弈模型的几个符号约定：

选手集：N={1, 2, ..., n}

策略集：S1, S2, ..., Sn

决策集：D∈S=S1xS2x···x Sn

赢利函数：f1,f2, ..., fn D→R

例如：田忌赛马

S齐=S田={(上中下), {中下上}, {下上中}, {上下中}, {中上下}, {下中上}}

f齐{(上中下), (下上中)} = 0

f田{(上中下), (下上中)} = 1

下面讨论合作与不合作两种情形下的博弈。

如果选手k知道了其他选手的策略xi，(i=1,2,...,n,i≠k），自然希望取策略 xk∈Sk

4.1.Nash平衡点和帕雷托最优

定义选手k的合理反应集为

Rk={(x1,.., xn)∈D|(x1, ..., xn)使得(*)成立}

各选手都希望好、决策在各自的合理反应集中，所以称(x1, ..., xn)∈R1∩···∩Rn

为n人非合作对策的一个纳什平衡点。

对于Nash平衡点，在别人不改变对策的情况下，每个选手的对策都是最好的，故他们都不会轻易去改变自己的对策。所以，非合作博弈的解将在Nash平衡点处出现。

Nash定理 非零和非合作博弈的Nash平衡点一定存在

问题 Nash平衡点对博弈各方是否一定是最优的？

再考虑合作情形。

记f=(f1,f2, ..., fn)

定义：Dn={x∈D|f(x)≥f(x0)} x0是纳什平衡点

Dn称为合理集，最终的合作决策必定出自合理集中。

决策x∈D称为帕雷托（Pareto）最优的是指：D中不存在决策y使得f(y)>f(x)

4.2.囚徒困境

囚徒困境------非零和博弈

设两偷盗犯因被发现藏有被盗物品而被拘留。现被分别单独关押。两人都知道，如果都不承认偷盗，将以窝赃罪各判1年监禁；如果都承认，将以偷盗罪各判5年。但如果一人招认而另一人不承认，则坦白者将从宽处理获得释放，而抗拒者从严被判10年。这两个囚犯该如何选择自己的最优策略？

两个囚犯的策略集都是{x(招认), y(不招认)}

盈利函数分别为：

f1(x,x) = -5

f1(x,y) = 0

f1(y,x) = -10

f1(y,y) = -1

f2(x,x) = -5

f2(x,y) = -10

f2(y,x) = 0

f2(y,y) = -1

各自的合理反应集为：

R1 = {(x,x), (x, y)}

R2 = {(x,x),(y,x)}

4.3.智猪博弈

智猪博弈一弱势方的抉择

猪圈里有一头大猪，一头小猪。猪圈的一头有一个食槽，另一头有一个控制猪食供应的按钮按一次按钮，有10个单位的猪食入槽，但是按按钮要付出两个单位的跑动成本。若大猪先到食槽则大猪吃到9个单位猪食，小猪吃到1个单位；若两猪同时到达食槽，大猪吃7个单位猪食，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。