《博弈论》书摘|博弈是生活的一种基本形态

博弈实际上是为了让人们更加精细地活着，是为了让人们更加精细地梳理生活，梳理人际关系，而这也是本书的一个宗旨，即博弈不是钩心斗角的工具，不是尔虞我诈的方法，而是打造美好生活所需要的一个新概念。

为什么我们常常做出了最好的选择，却产生了最坏的结果?

一个高中生通过努力考了第一名，希望以此换取父亲买iPad作为奖励。他以为父亲一定会答应，但父亲虽认可他的成绩，却担心iPad会影响学习，更希望等他考上好大学再买。儿子从自身需求出发，认为付出就该获得想要的回报；父亲则从长远角度考虑，认为奖励的时机和方式不合适。双方立场不同，导致期望落空。

类似情况也常见于上下级关系中。比如下属为追求业绩铤而走险、违规操作，虽然取得成果，却因违背规则被领导惩罚------领导看重结果，但更重视可控性和合规性。另一种情况是下属死守指令、不敢变通，结果任务失败，而领导其实更在意结果而非过程。这两种做法都源于下级仅从自身理解出发，忽略了上级的真实考量。

**人们做决策时往往只考虑自身利益和期望，认为自己的选择是最好的，却忽视了他人立场和可能的反应。**而现实是，人与人相互关联，任何决定都可能引发他人的非预期回应。正因如此，自认为"最优"的选择常带来意外后果，甚至适得其反。高期望容易带来更大失落，而忽略互动中的不确定性，正是许多决策失误的根源。

囚徒困境：这不是一个人的游戏

1950年，美国兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔提出了一个博弈理论，后由顾问艾伯特·塔克以"囚徒困境"为例进行通俗阐释：两名共谋犯人被分开审讯，无法沟通。警方给出以下几种可能结果：

两人都抵赖 → 各判1年；

两人都坦白 → 各判8年；

一人坦白、一人抵赖 → 坦白者释放，抵赖者判10年。

由于彼此不知对方选择，每个犯人都会理性地认为：无论对方如何选择，自己坦白都更划算------若对方抵赖，自己坦白可获释；若对方坦白，自己抵赖则判10年，不如也坦白只判8年。因此双方都会选择坦白，结果各判8年。

但这并非最优解。若两人合作抵赖，仅各判1年，才是对整体最有利的"帕累托最优"------即在不损害他人利益的前提下提升整体收益。然而因缺乏信任与沟通，理性个体反而导致集体次优结果。

为破解此困境，有人提出"重复囚徒困境"：通过多轮互动，用惩罚机制促使合作。例如，若一方背叛，下一轮另一方也会背叛以示报复，从而激励双方长期合作。

但若重复次数固定（如十局），问题重现：在最后一局，双方无未来顾虑，倾向于背叛；由此倒推，第九局合作已无意义，依此类推，从第一局起就会相互背叛。因此，只有在无限或未知次数的重复博弈中，合作才可能稳定达成帕累托最优。

这一模型揭示了现实中的核心矛盾：个体理性常阻碍集体最优，而信任、沟通与长期关系是促成合作的关键。

纳什均衡：利己主义者的优先策略

在囚徒困境中，两个"理性"的犯人出于自保，都会选择坦白。一旦双方都坦白（各判8年），就形成了一种稳定状态：任何一方若单方面改为抵赖，刑期将从8年增至10年，得不偿失。因此，没人愿意率先改变策略------这种"谁都不愿单独偏离"的状态，就是纳什均衡。

纳什均衡由约翰·福布斯·纳什于1950年提出，指在博弈中，所有参与者都选定了策略，且任何一人单独改变策略都无法获得更好结果。它强调的是个体理性下的稳定，而非整体最优。

这一点可通过一个生活化例子说明：兄弟二人打猎。

合作打野猪 → 各得150斤；
各自抓兔子 → 各得100斤；
一人打野猪、一人抓兔子 → 打野猪者得0，抓兔者得100斤。

这里存在两个纳什均衡：

都合作打野猪：若一方退出，收益从150斤降到100斤，不划算；

都抓兔子：若一方改去打野猪，可能一无所获（0斤），风险太大。

这两个组合中，无人愿单方面改变，故为纳什均衡。但显然，"合作打野猪"是更优的整体结果（总产出300斤 > 200斤）。

某种意义上来说，纳什均衡并非最优或者最理性的，但却是在面对不可控的状况时(信息不明确)，自己所能获得的最好选择，可以说，纳什均衡寻求的是个人的最优解，对个人而言，这是一种稳定的均衡。

纳什的这一理论极大推动了博弈论的发展。尽管博弈论早在1944年冯·诺依曼与摩根斯坦的《博弈论与经济行为》中已奠基，但纳什提出的非合作博弈中的均衡概念，因其广泛适用性，成为现代经济学、金融、政治学等领域的核心分析工具。

经典博弈论和行为博弈论

博弈论的发展从经典博弈论演进到行为博弈论，反映了理论向更加贴近现实生活的方向迈进。经典博弈论基于"理性人"假设，认为参与者是完全理性的，并且总是追求个人利益的最大化，不考虑信任他人，这种理论通过复杂的数学模型构建了一个自洽的体系。然而，随着心理学和行为科学的研究深入，发现人类的行为模式远比经典博弈论所描述的复杂。

研究表明，在实际决策过程中，人们常常表现出与"理性人"假设不符的行为。例如，在团队合作中，成员可能会因为公平心理而为那些他们认为被分配较少利益的人发声，即使这样做可能不会直接增加自己的利益。这揭示了人类在做经济决策时不仅受到自身利益的驱动，还会考虑到社会偏好如公平、互惠等原则。

此外，心理学研究指出，人们的决策过程还受到诸如思考成本（人类认知能力有限）、情绪波动以及过往经验等因素的影响，导致推理出现系统性误差。这些误差表明，人的决策并非总是理性和最优的。

行为博弈论将这些因素纳入考量，认为个人的社会偏好、对信任的理解以及现行的社会、制度、经济环境都会影响个体间的互动。因此，行为博弈论不仅仅是简单地扩展了经典博弈论的应用范围，而是从根本上改变了我们看待决策制定的方式，强调了理解人类行为复杂性和非理性成分的重要性。它试图更准确地模拟真实世界中的决策场景，使理论更加符合实际情况，从而更好地解释和预测人类在各种情境下的行为。

负和博弈、零和博弈、正和博弈

博弈按结果可分为三种基本类型：负和博弈、零和博弈和正和博弈，这是最常见且直观的分类方式。

负和博弈：
双方因冲突不可调和或互不妥协，导致彼此采取对抗性策略，最终造成的总损失大于任何一方所得。结果是"损人不利己"，两败俱伤。
零和博弈：
一方的收益恰好等于另一方的损失，博弈各方的得失总和为零。这是一种纯粹的竞争关系，不存在合作空间。其本质是"利己损人"------你的赢就是我的输。
正和博弈：
通过协作或协调，使至少一方获益而另一方不受损，甚至双方都受益，实现整体利益增长。这是"利人利己"的双赢，或至少"利己不损人"。
这三种类型揭示了互动关系的不同本质：从对抗到竞争，再到合作。现实中的许多博弈往往介于三者之间，但理解这三种基本形式，有助于我们判断何时应坚持立场、何时应寻求合作，从而推动更优的结果。

要理解负和、零和与正和博弈的区别，可以用夫妻看电视的例子来说明：

丈夫喜欢体育频道，妻子喜欢肥皂剧，但家里只有一台电视。假设如愿看到自己喜欢的节目得分为 +1，否则为 -1。

零和博弈：两人约定当晚只有一人能看电视，通过"剪刀石头布"决定。胜者得 +1，败者得 -1，总和为 0。一方的满足建立在另一方的失落之上，属于典型的"利己损人"。
负和博弈：因争抢遥控器爆发争吵，丈夫抢到遥控器，妻子一气之下拔掉电源；或两人赌气切换到都不喜欢的"动物世界"频道。结果谁都没看成，双方满意度均为 -2，总和为 -4，形成"两败俱伤"的局面。
正和博弈：夫妻互相体谅，协商轮流观看------丈夫先看30分钟体育，妻子再看30分钟肥皂剧。双方都获得满足，总和为 +2，实现"利人利己"的双赢。
这个例子清晰展示了三种博弈的本质差异：零和是此消彼长，负和是双输，而正和则通过合作创造共同收益。

博弈有时是一场控制与反控制的游戏

许多人对博弈并不了解，甚至会出现诸多的误解，认为博弈就是一种利益获取的工具，它具有自私的特性，但真正的博弈具有更高维度的思想和境界。事实上，获取利益的方式可以有很多种，人们也可以表现得更加直接、更加粗鲁、更加自私自利，可是这些方法都不像博弈一样具有更深的内涵，尽管博弈过程中也存在争斗，存在利益的划分，也存在压制他人的欲望，但总体上来说，博弈不过是一场和谐的游戏。

生活中，这样的博弈无处不在。比如，罗小姐想请闺密明早5点送她去车站。如果她开门见山："明天早上5点你能送我去车站吗？"对方很可能婉拒。毕竟天没亮、天气冷，单程就要一个多小时，来回近4小时，谁愿意周末起这么早？

但如果罗小姐换种方式，先示弱："你有空的话能送我一趟吗？我知道太早太冷很为难，但我真的没别的办法了，迟到老板又要发火......"这种低姿态容易唤起对方的共情，答应的可能性自然提高。

而更高明的做法，是

不直接提要求，而是引导对方主动走进你的节奏

。

她可以先轻松地问一句："明天周末，你有什么安排吗？"

闺密随口答："没什么事。"

罗小姐顺势接话："那能不能送我去车站？我得出差。"

对方没多想，爽快答应："好啊，几点？"

这时，罗小姐先说"7点"，等对方承诺后，再补充："其实得5点出发，因为中途还要给客户送份文件，他6点的飞机。"

既然已经答应了，闺密虽惊讶，也不好反悔，只能勉强应下。

这三种方式，效果截然不同：

第一种直来直往，容易碰壁；
第二种以情动人，赢得理解；
第三种则通过巧妙设问和信息分步释放，让对方在不知不觉中做出承诺------既达成目的，又不显得强人所难。

但聪明的人知道，博弈不是单方面赢，而是让关系继续走下去。

所以事后，罗小姐最好补一句："真是不好意思，下次我请你吃饭！"无论对方是否接受，这份心意都能缓解潜在的尴尬。

当然，博弈从来不是单向的。闺密也可能悄然反制。

比如，当罗小姐问"周末有安排吗"，闺密立刻警觉："你该不会又想拉我出去玩吧？"接着顺势说："我整个周末都泡汤了。"------提前封住对方的请求，却不伤和气。

又或者，她先答应，但留个活口："修理工明天要来修水管，时间不确定。"等罗小姐说出5点的需求，她便自然回应："可能赶不上，要不你晚点走？"既没直接拒绝，又守住自己的边界。

这些看似平常的对话，其实暗藏策略。

一方怕被拒绝，小心翼翼试探；另一方怕被麻烦，委婉设防。双方都在维护自己的利益，同时努力不破坏关系------这正是日常人际博弈的真实写照。

所以，博弈从来不是冷冰冰的输赢游戏，而是一场关于理解、尊重与智慧的共舞。

最高级的博弈，不是控制别人，而是在彼此的需求之间，找到一条谁都走得舒服的路。