一、博弈论概述

知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。

一、什么是"博弈"

(一)博弈的定义

博:博览全局;弈:对弈棋局,最后做到谋定而动。

博弈的标准定义是指在一定的游戏规则约束下基于直接相互作用 的环境条件,各参与人依据所掌握的信息 ,选择各自的策略 (行动 )以实现利益最大化的过程。

直接相互作用,是指决策者之间做出的决定会相互影响,你做出的决定会影响他,他的决定又会反过来直接影响你。

信息,博弈时经常会产生信息不对称,每个人只能根据自己所掌握的信息做出最优决策。

博弈,必须学会换位思考!

博弈,只需领先一步,高人一筹!(不用思考到太深,太远)

博弈就是你中有我,我中有你。由于直接相互作用 (互动) ,每个博弈参与者的得益不仅取决于自己的策略 (行动) ,还取决于其他参与者的策略 (行动) 。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略 (行动) ,从而选择最有利于自己的策略 (行动)。

(二)罗森赛蜈蚣博弈

蜈蚣博弈规则如下:有1,2两个同学面前放一个纸箱,字母A表示合作,字母D表示不合作,1,2两个同学轮流做出合作/不合作的决策。纸箱里一开始有50元,在这个游戏中,选择不合作的人所获得金额,始终是另一方4倍。流程如下:

第一次,让同学1做选择,选择不合作(D),同学1获得40元,同学2获得10元,游戏结束。同学1选择合作(A),则箱子里的钱会增加一倍,即由50元变为100元,游戏继续,来到第二轮;

第二次,轮到同学2做选择,选择不合作(D),同学2获得80元,同学1获得10元,游戏结束。同学2选择合作(A),则箱子里的钱会增加一倍,由100元变为200,游戏继续,来到第三轮;

。。。。。

第五次,如果双方持续合作,最后该游戏也要在总金额为800元,也就是最初50元金额16倍时结束,此时同学1得到640元,同学2得到160元。

蜈蚣博弈对应的现实问题有:炒股、买房

如上图解所示,如果游戏玩到最后一步(第5步),同学1一定会选择不合作而结束游戏(就算不想结束,根据游戏规则,也不得不结束),如此一来,同学2就会在倒数第二步(第4步)时选择不合作,因为这样可以让自己获得320元收益,而不是玩到最后只得到160元收益。

问题在于,同学1也会像同学2那样运用倒推法,预测到同学2会在第4步选择不合作,就会在第3步选择不合作,以此增加自己收益,让自己获得160元收益,而不是80元收益。

同样,同学2也会预测到同学1会如是预测,就会再抢先一步,在第2步时选择不合作。如是持续倒推、递归,同学1最佳选择就是在第1步时就选择不合作,提前结束整个游戏。

蜈蚣博弈典型特征是:合作双赢,不合作单赢。一个参与者选择是否合作前提是看对方是否合作:如果对方合作,最佳策略是合作;如果对方不合作,最佳策略是不合作。

另一个参与者想法也是如此,如果预期你接下来会合作,他就会选择合作;反之,就会选择不合作。

也就是说,对任意一个参与者而言,理论最佳策略是,在对方选择不合作之前提前选择不合作。根据倒推法,对蜈蚣博弈任意一个参与者而言,理性做法都是,一开始就选择不合作。

经过统计,在每个环节结束的人的数量分布如下:

二、发展简史

(一)古诺模型

参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。

(二)伯川德模型

该模型与古诺模型的不同之 处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。

(三)斯塔克尔伯格模型

该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。

(四)理论的诞生与发展

1、20世纪40年代的社会变化:寡头的竞争,垄断的竞争,资本主义发展到一定地步导致的社会变化

2、约翰·冯·诺依曼的卓越贡献:1944年冯·诺依曼和摩根斯坦发表《博弈论和经济行为》

3、约翰·福布斯·纳什的发扬光大,1994年获得诺贝尔奖

4、后来的发展

  • 其一个对纳什均衡的弱化 (或一般化)
  • 其二是对纳什均衡的精炼 (或筛选》。
  • 其三是对博弈论的基本假设的研究。
  • 其四是对博弈论的应用研究。

三、术语解读

(一)常见术语

1、参与人 (players): 理性选择的主体。

2、信息 (information) : 参与者有关博弈的知识。"知己知彼,百战不殆。

3、行动 (action) : 参与者能够选择的变量。

4、策略 (strategies) : 参与者在行动之前所准备好的一套完整的行动方案 (预案)。具有(1)完整性(2)多样性(3)不可观察性。

5、损益(payoff):参与者的得与失。

6、结局(outcome):所有参与者选择各自策略后的结果。

7、均衡( equilibrium):所有参与者的最优策略组合。

8、博弈的规则(rules of the game):参与者、行动和结果合起来称为博弈的规则。

9、博论 (game theory) :是一种研究人们怎么做策略(行动) 选择及其最后的均衡结果会是什么的理论。

(二)博弈的分类

1、合作博弈和非合作博弈

合作博弈:指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略。

非合作博弈:指参与者无法达成这样一种协议。非合作博弈不一定是竞争的关系。

2、静态博弈和动态博弈

静态博弈:指在博弈中,参与者同时选择,或虽非同时选择,但是在逻辑时间上是同时的。如剪刀石头布

动态博弈:指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者的行动。如下棋

3 、完全信息博弈与不完全信息博弈

完全信息博弈:指在博弈中,每个参与者对其他参与者的类型、策略空间及损益函数都有准确的信息。

不完全信息博弈:总有一些信息不是所有参与者都知道的。

4、零和博弈和非零和博弈

零和博挛:指博弈前的损益总和与博弈后的损益总和相等。

非零和博弈:指博弈后的损益大于(小于)博弈前的损益总和。(正和或负和)。

不玩负和游戏,少玩零和游戏,多玩正和游戏。

5、博弈的组合

|-----------|----------------------------------|-------------------------------------------------------------------------|
| | 静态 | 动态 |
| 完全信息 | 完全信息静态博弈 纳什均衡 纳什(1950,1951) | 完全信息动态博弈 子博弈精炼纳什均衡 泽尔腾(1965) |
| 不完全信息 | 不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968) | 不完全信息动态博弈 精炼贝叶斯纳什均衡 泽尔腾(1975) Kreps和Wilson(1982) Fudenberg和Tirole(1991) |

相关推荐
SSL_2021_DRL建极殿大学士3 个月前
博弈论学习笔记【施工中】
笔记·学习·数学·算法·概率论·博弈论
liangbm34 个月前
数学建模笔记—— 最大最小化规划模型
笔记·数学建模·matlab·开源·线性规划·博弈论·最大最小化
blind58837 个月前
博弈论(Nim 游戏)
c++·数论·博弈论·nim游戏
lithuim_8 个月前
2024/5/28 P1247 取火柴游戏
c++·博弈论
Williamtym10 个月前
数学建模博弈理论与实践国防科大版
算法·数学建模·matlab·博弈论·数模竞赛·华中杯·军事问题数学建模
一根老麻花1 年前
LeetCode每日一题 | 1686. 石子游戏 VI
算法·leetcode·游戏·博弈论
feiyu666661 年前
汤姆·齐格弗里德《纳什均衡与博弈论》笔记(6)量子论与博弈论
笔记·学习·数学·其他·量子力学·博弈论
feiyu666661 年前
汤姆·齐格弗里德《纳什均衡与博弈论》笔记(7)博弈论与概率论
笔记·学习·数学·其他·概率论·博弈论
feiyu666661 年前
汤姆·齐格弗里德《纳什均衡与博弈论》笔记(1)冯·诺伊曼与博弈论
笔记·学习·数学·其他·博弈论
贾贾20231 年前
基于博弈论的频谱分配(MATLAB实现)
数据库·matlab·博弈论·频谱分配