论文阅读《Game Theory with Simulation of Other Players》

以下是纯翻译

带有其他玩家模拟的博弈论 (Game Theory with Simulation of Other Players)

摘要 (Abstract) 与 AI 智能体的博弈交互可能在很多方面不同于传统的人与人之间的交互。其中一个区别是，模拟一个 AI 智能体可能是可行的（例如，因为它的源代码是已知的），这使得其他人能够准确预测该智能体的行为。这可能会降低信任和合作的门槛。在本文中，我们形式化了其中一个玩家可以花费一定成本模拟另一个玩家的博弈。我们首先推导了此类博弈的一些基本性质，然后证明了关于它们的一系列结果，包括：（1）将模拟引入具有通用收益（generic-payoff）的正规形式博弈（normal-form games）使其更容易求解；（2）如果合作的唯一障碍是缺乏对可能被模拟的智能体的信任，那么模拟能够促成改善双方结果的均衡；并且然而（3）在某些设定下，引入模拟会导致对两个玩家都严格更差的结果。

1 引言 (Introduction) 原则上，博弈论对玩家的性质是不可知的：除了个体人类，他们还可以是家庭、公司、国家，当然也可以是 AI 智能体。尽管如此，在该领域发展的大部分时间里，博弈论学者心目中的玩家要么是人类，要么是由人类做出决定的实体；并且与任何理论一样，在发展该理论时心目中的例子很可能会影响其关注点。如果我们尝试专门针对 AI 智能体重新发展博弈论，该理论会有何不同？当然，传统博弈论中的定理不会仅仅因为关注点的改变而突然变得虚假。相反，我们预期任何差异都将存在于我们为其开发模型、分析和计算工具的设定和现象的类型中。

在本文中，我们关注在 AI 智能体背景下更相关的一种特定现象：智能体能够互相模拟。如果一个智能体的源代码是可用的，另一个智能体就可以模拟前者将要做什么，直觉上这似乎会在战略上显著改变博弈。我们考虑其中一个智能体可以模拟另一个智能体的设定，如果他们这样做，他们就会了解到另一个智能体在实际博弈中会做什么；然而，模拟对模拟者来说是有成本的，因此在均衡中是否以及何时会实际使用模拟并不立刻明朗。

特别是，我们有兴趣理解这种模拟的可用性是否以及何时会导致更具合作性的策略。例如，在合作行为需要信任的设定中 $Berg et al., 1995$ ，人们可能会预期模拟另一个玩家的能力有助于建立这种信任。但这在均衡中确实会发生吗？如果会，模拟的能力是否能在所有博弈中促进合作，或者是否存在适得其反的博弈？我们甚至能够计算带有模拟能力的博弈的均衡吗？

在相关工作方面，我们的设定类似于可信承诺（credible commitment）的设定 $von Stackelberg, 1934$ ，区别在于玩家需要决定是否为允许另一个玩家进行承诺而支付成本。另一个视角是，我们研究的是程序均衡（program equilibria） $Tennenholtz, 2004$ ，区别在于只有一个玩家的程序可以读取另一个玩家的源代码，并且必须为此支付成本。有关进一步的讨论和参考文献，请参见第 7 节。

在本引言的其余部分，我们描述了一个信任博弈的具体例子，并用它来概述稍后介绍的技术结果。我们还给出了几个例子来说明，当超越信任博弈时，模拟如何导致不同的结果。为了快速概览，关键要点在第 1.1 节中以斜体突出显示。

图2：左上角：图1中信任博弈的规范形表示，在加入模拟前后。下方：TGc sim 的极值均衡。非极值纳什均衡恰好是最后两列的凸组合。右上角：各纳什均衡下的合作概率与收益。非极值纳什均衡以浅红色标出，虚线表示命题11中的纳什均衡轨迹。注意，所有红色的纳什均衡（即满足 π1(WO) = 1 的均衡）均导致 u1 = u2 = 0。

图3：左图：承诺博弈，其中行方玩家更倾向于无法进行模拟。详情请参见例22。右图：具有多个模拟纳什均衡的信任博弈变体。