数学建模博弈理论与实践国防科大版

目录

4.博弈模型

4.1.Nash平衡点和帕雷托最优

4.2.囚徒困境

4.3.智猪博弈

4.4.脏脸之谜

5.军事问题数学建模

5.1.兰彻斯特作战模型

5.1.1.一般战斗模型

5.1.2游击战模型

5.1.3.混合战模型

5.2.硫磺岛战役


4.博弈模型

本讲介绍博弈模型,包括博弈论(Game theory,又称对策论)中最基本的一些概念,以及非合作博弈论中的纳什平衡和帕雷托最优概念,同时介绍博弈论中的几个著名案例:囚徒困境、智猪博弈、脏脸之谜等。

博弈有5个基本要素:

  1. 局中人(选手)参与博弈的个人或团体。

  2. 策略(对策)可供局中人选择的行动方案。

  3. 赢利(获益)局中人的收益或支付。

  4. 信息 在策略选择中,信息是最关键的因素。

  5. 均衡 博弈的最终结果。

n人博弈模型的几个符号约定:

选手集:N={1, 2, ..., n}

策略集:S1, S2, ..., Sn

决策集:D∈S=S1xS2x···x Sn

赢利函数:f1,f2, ..., fn D→R

例如:田忌赛马

S齐=S田={(上中下), {中下上}, {下上中}, {上下中}, {中上下}, {下中上}}

f齐{(上中下), (下上中)} = 0

f田{(上中下), (下上中)} = 1

下面讨论合作与不合作两种情形下的博弈

如果选手k知道了其他选手的策略xi,(i=1,2,...,n,i≠k),自然希望取策略 xk∈Sk

4.1.Nash平衡点和帕雷托最优

定义选手k的合理反应集为

Rk={(x1,.., xn)∈D|(x1, ..., xn)使得(*)成立}

各选手都希望好、决策在各自的合理反应集中,所以称(x1, ..., xn)∈R1∩···∩Rn

为n人非合作对策的一个纳什平衡点。

对于Nash平衡点,在别人不改变对策的情况下,每个选手的对策都是最好的,故他们都不会轻易去改变自己的对策。所以,非合作博弈的解将在Nash平衡点处出现。

Nash定理 非零和非合作博弈的Nash平衡点一定存在

问题 Nash平衡点对博弈各方是否一定是最优的?

再考虑合作情形。

记f=(f1,f2, ..., fn)

定义:Dn={x∈D|f(x)≥f(x0)} x0是纳什平衡点

Dn称为合理集,最终的合作决策必定出自合理集中。

决策x∈D称为帕雷托(Pareto)最优的是指:D中不存在决策y使得f(y)>f(x)

4.2.囚徒困境

囚徒困境------非零和博弈

设两偷盗犯因被发现藏有被盗物品而被拘留。现被分别单独关押。两人都知道,如果都不承认偷盗,将以窝赃罪各判1年监禁;如果都承认,将以偷盗罪各判5年。但如果一人招认而另一人不承认,则坦白者将从宽处理获得释放,而抗拒者从严被判10年。这两个囚犯该如何选择自己的最优策略?

两个囚犯的策略集都是{x(招认), y(不招认)}

盈利函数分别为:

f1(x,x) = -5

f1(x,y) = 0

f1(y,x) = -10

f1(y,y) = -1

f2(x,x) = -5

f2(x,y) = -10

f2(y,x) = 0

f2(y,y) = -1

各自的合理反应集为:

R1 = {(x,x), (x, y)}

R2 = {(x,x),(y,x)}

4.3.智猪博弈

智猪博弈一弱势方的抉择

猪圈里有一头大猪,一头小猪。猪圈的一头有一个食槽,另一头有一个控制猪食供应的按钮按一次按钮,有10个单位的猪食入槽,但是按按钮要付出两个单位的跑动成本。若大猪先到食槽则大猪吃到9个单位猪食,小猪吃到1个单位;若两猪同时到达食槽,大猪吃7个单位猪食,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。

大猪按钮,小猪不动

4.4.脏脸之谜

脏脸之谜一共同知识

三姐妹从外面回到家里,她们的脸都是脏的,但她们自己并不知道。母亲见到她们后说道:"你们三人中至少有一个人的脸是脏的",她们没有反应,因为这是一个显然的事实,她们认为母亲说的是一句"废话"。但当母亲追问一句"你们知道是谁吗?"她们先是互相看了一下,然后都脸红了,都知道自己的脸是脏的,这是为什么?

共同知识一每个人都知道这个事实,每个人都知道每个人都知道这个事实,每个人都知道每个人都知道每个人都知道这个事实,...

5.军事问题数学建模

5.1.兰彻斯特作战模型

第一次世界大战时提出的预测战争结局的模型

只考虑双方兵力多少和战斗力强弱。

兵力:

  1. 因战斗减员而减少

  2. 因非战斗减员而减少

  3. 因增援而增加

战斗力:

  1. 与射击率(单位时间的射击次数)、射击命中率以及战争的类型(常规战、游击战)等有关。

5.1.1.一般战斗模型

假设:

  1. 每一方的战斗减员率取决于双方的兵力和战斗力,用f(x,y)和g(x,y)表示。

  2. 每一方的增员率是给定的函数,用u(t)和v(t)表示。

模型如下:

-f(x,y) 单位时间内因为战斗减员而减少的兵力数

-ax 单位时间内因非战斗减员而减少的兵力数量

u(t) 单位时间内因增援而增加的兵力数量

dx/dt 单位时间内增加或减少的兵力数量

-g(x,y) 则是乙方的

将非战斗减员与增员归于初值中,则模型进一步简化为:

常规战模型相轨线

这就是平方律模型

5.1.2游击战模型

甲乙双方都用游击部队作战。

甲方士兵在乙方士兵看不到的某个面积为S的隐蔽区域内活动,乙方士兵不是向甲方士兵开火,而是向这个隐蔽区域射击,并且不知道杀伤情况。这时甲方战斗减员率不仅与乙方兵力有关,而且随着甲方兵力的增加而增加。

f可简单假设为:

f = ay = (cx)y = cxy

乙方的战斗有效系数

5.1.3.混合战模型

5.2.硫磺岛战役

思考题

相关推荐
old_power31 分钟前
【PCL】Segmentation 模块—— 基于图割算法的点云分割(Min-Cut Based Segmentation)
c++·算法·计算机视觉·3d
Bran_Liu1 小时前
【LeetCode 刷题】字符串-字符串匹配(KMP)
python·算法·leetcode
涛ing1 小时前
21. C语言 `typedef`:类型重命名
linux·c语言·开发语言·c++·vscode·算法·visual studio
Jcqsunny1 小时前
[分治] FBI树
算法·深度优先··分治
黄金小码农1 小时前
C语言二级 2025/1/20 周一
c语言·开发语言·算法
謓泽2 小时前
【数据结构】二分查找
数据结构·算法
00Allen003 小时前
Java复习第四天
算法·leetcode·职场和发展
攻城狮7号3 小时前
【10.2】队列-设计循环队列
数据结构·c++·算法
懒羊羊大王&4 小时前
179最大数(贪心算法)分析+源码+证明
算法·贪心算法
小小志爱学习4 小时前
提升 Go 开发效率的利器:calc_util 工具库
数据结构·算法·golang