博弈论
阿维纳什·迪克斯特&巴里·内尔巴夫
1 博弈论是有关策略的科学。它试图以数学和逻辑的方法来帮助博弈者作出决策,在一系列纷繁复杂的博弈中应采取何种策略来保证自身获得最大利益。博弈论所研究的博弈的范围包括了从下棋到抚养儿童,从网球竞技到公司并购。但是所有的博弈都具有一个共同的特征:相互作用。也就是说,每一个博弈者的博弈结果取决于所有博弈参与者的策略选择。在零和博弈中,博奔者的利益之间是完全冲突的,因此一方的得利必然导致另—方的损失。更多具有代表性的例子还有会导致共同得利(正和)博弈和共同损失(负和)傅弈,同样的情况还会发生在另外一些冲突中。
2 博弈论研究的先驱者是普林斯顿数学家约翰·冯·诺依曼。在早先的一段时间里,研究的重点被放在了完全冲突(零和博弈)上,其他的博弈当时被认为是以合作形式出现的。也就是说,当时的研究假定博弈者共同地选择和实施他们的行为。最近的研究则把重点放在了那些既不属于零和博弈也不属于绝对合作博弈的情况上,在这些博弈中,博弈者自主地选择博弈行为,但他们之间的相互关系中充满了竞争与合作。
3 博弈行为与我们在中性环境中所作的各种决定有着根本性的不同。要说明这一点,我们可以思考一下伐木工人和军队将军所作决定之间的不同。当一个伐木工人决定要如何砍树时,他不会考虑树木本身会有什么反抗,他所处的环境为中性。而当一位将军决定要消灭敌军时,他必须提前预料到他的计划会遇到哪些阻力,并设法消除。与这一例子中的将军相类似,一个博弈者必须认识到他与其他机智且怀有争胜之心的竞争者之间的相互作用,他自己所作的决定也必须能够同时应对可能出现的合作或冲突。
4 博弈的实质是博弈者采取策略之间的相互依赖性。这种策略性的相互依赖表现为两个不同的类别:连续策略之间的相互作用以及联立策略之间的相互作用。就前者而言,博弈者依次采取行动,每个人都知道其他博弈者先前的行为。就后者而言,博弈者同时采取行动,每个人对其他博弈者的行为并不知情。
5 对连续策略博弈中的某一博弈者来说,一个总的原则就是放眼前方,逆向推理。每个博弈者都应该弄清楚其他博弈者会对他当前的策略行为作出怎样的回应,他自己又将如何应对,等等。这个博弈者要预料到他最初的决定会最终导致何种结果,并且运用这一信息来推断出当前的最佳策略。在考虑其他博弈者会如何应对时,博弈者必须能设身处地地换位思考,而不能把自己的主观判断强加于人。
6 从理论上说,采取固定次序行动的任何连续博弈都可以圆满地“解决”。我们可以通过预测每个可能的结果来决定各个博弈者的最佳策略。像井字棋这样的简单游戏由于可以以这样的方式解决,因而并不具有挑战性。但诸如象棋等其他博弈,即使是借助电脑的帮助,也会由于其本身的计算过程过于复杂而难以在实践中去实施。因此,博弈者往往会依据经验提前对形势作出判断并尽可能地评估最终的局面。
7 与连续策略博弈的线形思维不同,联立策略的博弈涉及逻辑循环。尽管博弈者们同时采取行动而且彼此对于对方当前的策略一无所知,但是每一个参与者都必须清楚意识到其他的参与者的存在。这时的思维模式可描述为:我想他认为我会这样考虑„。因此,博弈者必须从全体博弈者的立场出发并努力判断出最终的博弈结果。每个参与者的个人最佳行为都是全局谋划中不可或缺的一部分。
8 运用普林斯顿数学家约翰·纳什提出的均衡概念,可以推导出这种逻辑思维的结论。我们寻求一系列的策略组合,每个博弈者都会有自己的选择,当所有的对手们在实施他们决定的最佳策略时,我们所做的选择应该对自己是最有利的。换句话说,每个博弈者都会对其他人的策略作出最优化的应对。
9 有时,无论其他博弈者如何行动,一个博弈者的最佳策略始终如一,这被称作这一博弈者
的优策略。在其他情况下,如果博弈者的策略始终于己不利,则被称作劣策略,其含义是指无论其他博弈者如何行动,都有别的对自己更有利的策略。因此,谋求策略均衡应该从寻找优策略和消除劣策略开始。
10 当我们把博弈的结果表述为一种均衡的时候,并不是基于以下假设,即博弈的每个参与者的个人最佳策略将会带来共同的最优化结果。的确有一些众所周知的例子,比如囚徒困境(见下文),由于囚徒们都追求个人的私利而导致了不好的结果。
11 纳什关于均衡的概念还不能完全解决联立策略博弈中逻辑循环的问题,有些博弈包含多种此类的均衡,而有些博弈却并不包含这样的均衡。纳什均衡也还没有清楚地说明关于导致均衡的动态过程。尽管有这样的一些缺陷,纳什均衡的定义在对很多策略性互动的分析中已经表现出了极为重要的作用。
12 以下策略性互动的实例可以说明博弈论的一些基本理论框架: 13 囚徒困境。两个嫌疑犯分别被审问,每个人都可以招供或保持沉默。如果嫌犯A保持沉默,嫌犯B可以通过招供而获得较轻的发落。如果嫌犯A招供,嫌犯B最好选择招供以免被从重处理。这时招供就是嫌犯B的优策略。同样的情况也适用于A。因此,在均衡的情况下双方都选择招供。如果双方都保持沉默对他们更有利。由于合作破裂所导致的长远性损失远比招供而获得的暂时性得利严重,所以这样的合作行为会在重复进行的博弈中实现。在这种情况下,—般推荐采取针锋相对的策略。
14 混合性策略。在一些冲突中,任何规律性的行为都会被对手发觉并利用。因而,通过采取混合性策略来迷惑对手就显得非常重要。我们可以从体育运动中找到一些典型的例子,比如足球运动中的特定情况下选择跑位还是传球,网球比赛中选择击打斜线球还是底线球。博弈论为提高洞察力和掌握混合性策略恰当的火候提供了参考。
15 战略性行动。博弈者可以通过运用威胁和许诺来改变其他对手对其行动的预测,从而诱使他们采取对其有利的行为或阻止他们对已不利的行为。为了取得成功,威胁和许诺必须是可信的。这往往会导致一些问题,原因就在于实施威胁和许诺往往会付出较大的代价。博弈论研究几种提高可信度的方法,基本的原则就是威胁和许诺要在符合博弈者利益的前提下减少自身未来行动的自由度。通过这样的方式,博弈者可以避免自己违背承诺,或者避免产生对对手越轨的纵容。
16 例如,当科尔蒂斯到墨西哥后,烧掉了战船,故意没有给自己留下撤军的退路。由于没有返家的船只,科尔蒂斯面对的只有战胜并征服对手或被对手消灭掉这两种可能。尽管他的士兵在人数上处于绝对劣势,但这种血战至死的威胁削弱了对手的士气,敌人面对这样意志坚定的对手时,选择了退却。宝丽来公司在拒绝共享即时成像市场时也采取了类似的策略,当时它决定与任何挤占该市场的对手拼个你死我活。当柯达公司试图染指即时成像业时,宝丽来调动了所有的资源进行反击。14年后,宝丽来公司在与柯达公司的诉讼中获胜,重新赢得了在即时成像市场的垄断地位。
17 使威胁变得可信的另—个方法是运用冒险性的边缘化策略,这一策略的风险在于:如果其他博弈者未能按照威胁的要求去做的话,结果对大家将是一损俱损。托马斯·谢林在他的《冲突策略》一书中介绍说,边缘化策略就是故意使局势变得无法控制的策略。正是由于局势的无法收拾可能令其他对手难以接受,从而迫使对手作出妥协。
18 讨价还价。两个博弈者一起来分蛋糕,每个人都想要一个大块,双方都倾向于尽快达成—致。当两个人依次开始提议分配时,放眼前方和逆向推理的博弈原则决定了均衡的份额,双方这时可以立即达成一致,但时间的延误决定了双方的份额,竞争中缺乏耐心的一方只能分得较少的份额。
19 隐瞒和公开信息。当博弈的一方掌握其他各方不了解的信息时,他会急于隐瞒这一信息(例如纸牌游戏中抽到的牌),其他情况下他也可能想把信息令人信服地公布出来(例如公司对产品质量的承诺)。这两种情况下,总的原则就是要少说多做。如果要隐瞒信息,就要采取混合性策略,比如纸牌游戏中虚张声势的方法就决不能干篇一律。我们还可以回忆起温斯顿·丘吉尔关于把真相置于谎言保卫下的名言。如果要公布信息,就要采用传递可信信息的策略,而且如果形势
发生变化时策略也必须相应进行改变,例如,提供长期的质量保证是企业生产高质量产品信心的显示,对消费者来说也是一个可以信赖的信号。
20 博弈论研究的最新进展已经成功地解释和规范了在各种冲突和合作情况下应采取的恰当策略,然而博弈论研究仍有待进一步完善,从多角度设计成功策略也有待进一步去研究。
Translation Practice
I. Exercises for Practicing the Skill
1.无线网状网的首次应用是在社区接入网中,例如在加州的Cerritos社区,采用Tropos Networks或Garland的设备,由NexGen City建网,所用的专用芯片来自MeshNetworks。 2.变压器是—种利用互感原理的重要实用装置。
3.在19世纪,潮汐振荡和声重力振荡的理论曾经是饶有兴趣的课题。 4.增加了对成本的极小化的刺激,成本更具透明度。 5.在蜂窝网中布设911系统可以分三个阶段来进行。
6.由于己投入使用的或者处于研发阶段的纳米制品的范围极广,因此确定先测试哪一种材料以及如何进行测试是至关重要的。
7.但是所有的博弈所具有的共同特征就是相互作用。
8. 技术发展造成的成本的降低、性能的提高以及网络的广泛应用使得建造更大的工程、人工智能(智能代理、知识库系统、数据挖掘及智能过滤等等)将愈加可行。 II. Word and phrase Translation
A.1.互赢博弈和互败博弈 2.连续策略博弈 3. 联立策略博弈 4.直线推理 5.循环推理 6.纳什均衡 7. 优势策略 8.最优化结果 9.合作破裂 10.边缘化策略
III. Sentence Translation
1.博弈的实质是博弈者采取策略之间的相互依赖性。这种策略性的相互依赖表现为两个不同的类别:连续策略之间的相互作用以及联立策略之间的相互作用。
2.当我们把博弈的结果表述为一种均衡的时候,并不是基于以下的假设,即博弈的每个参与者的个人最佳策略将会带来共同的最优化结果。
3. 在一些博弈的冲突中,任何条理化和计划性的行为都会被对手发现并加以利用。因此,通过采用组合性策略迷惑对手就显得非常重要。我们在体育运动中可以发现典型的例子——比如在足球比赛中特定情况下选择跑位或传球,在网球比赛中击球时选择斜线球或底线球。
4. 边缘政策“是一种故意使局势变得有些无法控制的策略,正是这种无法控制性可能会使另一方无法接受从而迫使其妥协”。
5. 当博弈的一方了解其他人所不掌握的信息时,他会急于隐瞒这—信息(比如牌局中所拿到的牌),在其他一些情况下,他还会想令人信服地公开某些信息(比如公司对产品质量的承诺)。在这两种情况下,“行胜于言”是博弈者遵循的基本原则。
第三单元
准备好了吗?人体胚胎干细胞向临床迈进
至少有一家公司说它已准备好将人体胚胎干细胞用于患者。但还存在着诸多难题有待解决。
1 国会以员詹姆斯·郎之万告诉他的同事:“我相信有一天我将能重新走路。”这位罗得岛的民主党人在上个月刚刚投票,支持放宽联邦法规对干细胞研究的资金投入的限制。郎之人16岁时因枪伤而瘫痪,他恳求同事跟他一起投票。“干细胞研究给了我们希望和信任的理由。····我们面临一个改变数百万美国人命运的历史机遇。”
2 诸如此类的强烈呼吁加上数亿美元私人和国家研究资金的注入,似乎预示着人体胚胎干细胞的治疗性应用即将到来。
3 但是,干细胞是否真能用于治愈像郎之万这样的患者还难以确定。细胞疗法比药物治疗更为复杂,而且人体胚胎干细胞具有分化成体内任何类型细胞的能力,因此会带来特殊的危险性。
第四单元
十大热门通信技术(I)
第八单元
第9单元
第10单元
因篇幅问题不能全部显示,请点此查看更多更全内容