博弈论——议价博弈(Bargaining)

议价博弈(Bargaining)

0 引言

议价(bargaining) 是市场经济中最常见的事情,也是博弈论最早研究的问题。这里介绍一种议价的动态博弈模型。同样地,对于动态博弈模型,我们还是用常见的逆推归纳法去寻找该博弈的子博弈完美纳什均衡。

1 议价博弈

议价博弈有很多种情况,因为议价其实就是一个反复讨价还价的过程,有些人一发即中,有些人讨价还价一小时也不一定有结果,那这里我们简单介绍一下三回合的议价博弈,大家看懂后,也就能根据该博弈去推导四回合、五回合甚至是无限回合的议价博弈了。

甲乙两人谈判分1万元现金,定下了如此规则:先由甲提出分配方案,乙接受则议价结束,拒绝则由乙提方案;后一种情况如果甲接受乙的方案议价结束,拒绝则由甲提新方案,此时乙不再有拒绝权,必须接受。再设由于谈判费用和利息损失等,议价每多进行一个回合,双方分得现金都有一个消耗系数 δ ( 0 < δ < 1 ) δ(0<δ<1) δ(0<δ<1)。

该议价博弈可以描述为:

第一回合:

甲提出方案,甲得 S 1 S_1 S1,乙得 10000 − S 1 10000-S_1 10000−S1。

如果乙接受,则甲得益为 S 1 S_1 S1,乙得益为 10000 − S 1 10000-S_1 10000−S1;若乙不接受,则进行第二回合议价。

第二回合:

乙提出方案,甲得 S 2 S_2 S2,乙得 10000 − S 2 10000-S_2 10000−S2。

如果甲接受,则甲得益为 δ S 2 δS_2 δS2,乙得益为 δ ( 10000 − S 2 ) δ(10000-S_2) δ(10000−S2);若甲不接受,则进行第三回合议价。

第三回合:

甲提出方案,甲得 S S S,乙得 10000 − S 10000-S 10000−S。

在该回合,不论甲提出什么样的方案,乙都必须接受。则甲得益为 δ 2 S δ^2 S δ2S,乙得益为 δ 2 ( 10000 − S ) δ^2 (10000-S) δ2(10000−S)。

2 求解议价博弈

使用逆推归纳法 进行求解。假设用 π i j π_i^j πij表示第 j j j回合中,博弈方 i i i的得益,其中 i ∈ { 甲 , 乙 } , j ∈ { 1 , 2 , 3 } i∈\{甲,乙\},j∈\{1,2,3\} i∈{甲,乙},j∈{1,2,3}。

(1)先求解第三回合 ,在该回合甲提出方案,甲得 S S S,乙得 10000 − S 10000-S 10000−S,并且乙都必须接受。则甲得益为 π 甲 3 = δ 2 S π_甲^3=δ^2 S π甲3=δ2S,乙得益为 π 乙 3 = δ 2 ( 10000 − S ) π_乙^3=δ^2 (10000-S) π乙3=δ2(10000−S)。有读者会反应过来,在该回合甲完全可以提出自己得10000元,是的,没错,但是为了更好地使用逆推归纳法,让模型更有一般性,我们还是假设第三回合甲得S,而不是10000

(2)再到第二回合 ,该回合乙提方案,但为了让甲能够接受,在乙方案下甲的得益必须要不小于第三回合甲的得益,且乙要让自己的得益尽可能大 ,即需要满足以下两个条件:
π 甲 2 ≥ π 甲 3 ( 1 ) π_甲^2≥π_甲^3 \quad\quad (1) π甲2≥π甲3(1)
m a x s 2 π 乙 2 = m a x s 2 [ δ ( 10000 − S 2 ) ] ( 2 ) \underset{s_2}{max} π_乙^2 =\underset{s_2}{max} [δ(10000-S_2 )] \quad\quad (2) s2maxπ乙2=s2max[δ(10000−S2)](2)

根据上面的方程(1),就进一步有:
δ S 2 ≥ δ 2 S ⇒ S 2 ≥ δ S δS_2≥δ^2 S⇒ S_2≥δS δS2≥δ2S⇒S2≥δS

但又因为乙需要让自己的得益尽可能大,即让 ( 10000 − S 2 ) (10000-S_2) (10000−S2)尽可能大,所以 S 2 S_2 S2取最小值,即
S 2 = δ S S_2=δS S2=δS

将该式代入方程(2)中得到:
m a x s 2 π 乙 2 = m a x s 2 [ δ ( 10000 − δ S ) ] \underset{s_2}{max}π_乙^2 =\underset{s_2}{max} [δ(10000-δS)] s2maxπ乙2=s2max[δ(10000−δS)]

所以第二回合:
π 甲 2 = δ S π_甲^2=δS π甲2=δS
π 乙 2 = δ ( 10000 − δ S ) = 10000 δ − δ 2 S π_乙^2=δ(10000-δS)=10000δ-δ^2 S π乙2=δ(10000−δS)=10000δ−δ2S很明显甲在第二回合的得益不小于(等于)第三回合的得益,而乙在第二回合的得益大于第三回合的得益,即 δ ( 10000 − δ S ) ≥ δ 2 ( 10000 − S ) δ(10000-δS)≥δ^2 (10000-S) δ(10000−δS)≥δ2(10000−S)。

(3)最后回到第一回合 ,第一回合由甲提出方案,并且甲知道 π 甲 2 = δ S , π 乙 2 = δ ( 10000 − δ S ) π_甲^2=δS,π_乙^2=δ(10000-δS) π甲2=δS,π乙2=δ(10000−δS)。因此,同样根据第二回合的思路,由于在该回合是由甲提方案,因此为了让乙能够同意,乙需要得到不低于在第二回合的得益,而甲也需要让自己的得益尽可能大 ,即满足以下条件:
π 乙 1 ≥ π 乙 2 ( 3 ) π_乙^1≥π_乙^2\quad\quad(3) π乙1≥π乙2(3)
m a x s 1 π 甲 1 = m a x s 1 S 1 \underset{s_1}{max}π_甲^1 =\underset{s_1}{max} S_1 s1maxπ甲1=s1maxS1

因此根据公式(3)就有了
10000 − S 1 ≥ 10000 δ − δ 2 S 10000-S_1≥10000δ-δ^2 S 10000−S1≥10000δ−δ2S


S 1 ≤ 10000 − 10000 δ + δ 2 S S_1≤10000-10000δ+δ^2 S S1≤10000−10000δ+δ2S

又因为 m a x s 1 S 1 \underset{s_1}{max} S_1 s1maxS1,因此
π 甲 1 = S 1 = 10000 − 10000 δ + δ 2 S π_甲^1=S_1=10000-10000δ+δ^2 S π甲1=S1=10000−10000δ+δ2S
π 乙 1 = 10000 δ − δ 2 S π_乙^1=10000δ-δ^2 S π乙1=10000δ−δ2S

所以,根据逆推归纳法得的结果,很明显:
π 甲 1 ≥ π 甲 2 ≥ π 甲 3 π_甲^1≥π_甲^2≥π_甲^3 π甲1≥π甲2≥π甲3
π 乙 1 ≥ π 乙 2 ≥ π 乙 3 π_乙^1≥π_乙^2≥π_乙^3 π乙1≥π乙2≥π乙3

其中 π 甲 1 = 10000 − 10000 δ + δ 2 S , π 甲 2 = δ S , π 甲 3 = δ 2 S , π 乙 1 = 10000 δ − δ 2 S , π 乙 2 = 10000 δ − δ 2 S , π 乙 3 = δ 2 ( 10000 − S ) π_甲^1=10000-10000δ+δ^2 S,π_甲^2=δS,π_甲^3=δ^2 S, π_乙^1=10000δ-δ^2 S,π_乙^2=10000δ-δ^2 S,π_乙^3=δ^2 (10000-S) π甲1=10000−10000δ+δ2S,π甲2=δS,π甲3=δ2S,π乙1=10000δ−δ2S,π乙2=10000δ−δ2S,π乙3=δ2(10000−S)

所以此时的 ( π 甲 1 , π 乙 1 ) = ( 10000 − 10000 δ + δ 2 S , 10000 δ − δ 2 S ) (π_甲^1,π_乙^1)=(10000-10000δ+δ^2 S,10000δ-δ^2 S) (π甲1,π乙1)=(10000−10000δ+δ2S,10000δ−δ2S)是该博弈的子博弈完美纳什均衡。

3 灵敏度分析

在前面我们也提到过,第三回合因为不管甲提啥方案,乙都必须接受,所以甲可以在第三回合让自己的得益 S = 10000 S=10000 S=10000,将该变量代入到 ( π 甲 1 , π 乙 1 ) = ( 10000 − 10000 δ + δ 2 S , 10000 δ − δ 2 S ) (π_甲^1,π_乙^1)=(10000-10000δ+δ^2 S,10000δ-δ^2 S) (π甲1,π乙1)=(10000−10000δ+δ2S,10000δ−δ2S)可以得到
( π 甲 1 , π 乙 1 ) = [ 10000 ( 1 − δ + δ 2 ) , 10000 ( δ − δ 2 ) ] (π_甲^1,π_乙^1)=[10000(1-δ+δ^2 ),10000(δ-δ^2)] (π甲1,π乙1)=[10000(1−δ+δ2),10000(δ−δ2)]

可以发现,双方的最终得益其实是取决于消耗系数的 。我们将结果中的 1 − δ + δ 2 以及 δ − δ 2 1-δ+δ^2以及δ-δ^2 1−δ+δ2以及δ−δ2拿出来,以函数的形式进行绘制,如下图所示:

可以发现,两图像均关于 δ = 0.5 δ=0.5 δ=0.5对称,越接近1,代表甲越不怕旷日持久谈判,甲越接近能得到全部利益。 δ δ δ越接近0,代表乙的争夺越接近会毁掉全部价值,甲也越接近得到全部利益。乙分得的利益与 δ − δ 2 δ-δ^2 δ−δ2正相关,当 δ = 0.5 δ=0.5 δ=0.5时, δ − δ 2 δ-δ^2 δ−δ2有最大值0.25,此时乙可以分得最多的2500元。因此消耗系数δ是乙议价的关键筹码 , δ = 0.5 δ=0.5 δ=0.5,也就是多进行一个回合会折损一半价值的折损率,给乙带来的议价能力最大。

4 模型扩展------无限回合议价博弈

无限回合议价博弈假设议价过程不会在第三回合被强制结束,只要双方互不接受对方的出价方案,议价就不断进行下去,奇数回合由甲出价,乙选择是否接受,偶数回合由乙出价,甲选择接受与否,这可理解成缺乏有强制效力司法仲裁的情况。

无限回合议价博弈没有可作为逆推归纳分析起始点的最后回合,按常规思路无法运用逆推归纳法进行求解。但是请注意,如果结合三回合议价模型进行分析,根据从第三回合开始的无限回合议价博弈和从第一回合开始的相同这一关键点,这个难题就可以下手了。

先假设该博弈有一个逆推归纳解,其中甲和乙得益分别为S和10000-S,即甲第一回合提出S,乙接受。从第三回合开始这个无限回合博弈的结果与从第一回合开始一样,即甲第三回合提出S,乙接受,双方得益 S S S和 10000 − S 10000-S 10000−S。

由于甲在第三回合的出价是甲得 S S S、乙得 10000 − S 10000-S 10000−S,而我们前面假设该博弈存在逆推归纳解,且该解与第三回合的解相同,因此这个无限回合博弈相当于三回合议价模型,即该模型演变为甲的第三回合出价有强制力的三回合议价博弈。根据三回合议价博弈的逆推归纳法结论可知,该博弈的解是甲在第一回合提出的 S 1 = 10000 − 10000 δ + δ 2 S S_1=10000-10000δ+δ^2 S S1=10000−10000δ+δ2S,乙接受,双方得益为 ( π 甲 1 , π 乙 1 ) = ( 10000 − 10000 δ + δ 2 S , 10000 δ − δ 2 S ) (π_甲^1,π_乙^1)=(10000-10000δ+δ^2 S,10000δ-δ^2 S) (π甲1,π乙1)=(10000−10000δ+δ2S,10000δ−δ2S)。

由于这个三回合博弈等于从第一回合开始的无限回合议价博弈,因此, S = S 1 = 10000 − 10000 δ + δ 2 S S=S_1=10000-10000δ+δ^2 S S=S1=10000−10000δ+δ2S,求解得 S = 10000 / ( 1 + δ ) S=10000/(1+δ) S=10000/(1+δ),因此均衡结果为
π 甲 = 10000 / ( 1 + δ ) π_甲=10000/(1+δ) π甲=10000/(1+δ)
π 乙 = 10000 − 10000 / ( 1 + δ ) = 10000 δ / ( 1 + δ ) π_乙=10000-10000/(1+δ)=10000δ/(1+δ) π乙=10000−10000/(1+δ)=10000δ/(1+δ)

相关推荐
清梦20201 小时前
经典问题---跳跃游戏II(贪心算法)
算法·游戏·贪心算法
Dream_Snowar1 小时前
速通Python 第四节——函数
开发语言·python·算法
Altair澳汰尔2 小时前
数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
人工智能·算法·机器学习·数据分析·知识图谱
A懿轩A2 小时前
C/C++ 数据结构与算法【栈和队列】 栈+队列详细解析【日常学习,考研必备】带图+详细代码
c语言·数据结构·c++·学习·考研·算法·栈和队列
Python机器学习AI2 小时前
分类模型的预测概率解读:3D概率分布可视化的直观呈现
算法·机器学习·分类
吕小明么3 小时前
OpenAI o3 “震撼” 发布后回归技术本身的审视与进一步思考
人工智能·深度学习·算法·aigc·agi
1 9 J3 小时前
数据结构 C/C++(实验五:图)
c语言·数据结构·c++·学习·算法
程序员shen1616113 小时前
抖音短视频saas矩阵源码系统开发所需掌握的技术
java·前端·数据库·python·算法
汝即来归4 小时前
选择排序和冒泡排序;MySQL架构
数据结构·算法·排序算法
咒法师无翅鱼4 小时前
【定理证明工具调研】Coq, Isabelle and Lean.
算法