博弈论的概念范文

时间：2024-04-18 16:10:37

博弈论的概念

博弈论的概念范文第1篇

本文以进化博弈理论的基本均衡概念----进化稳定策略的提出、发展及不断完善为主线，在指出原初概念缺陷的基础上，文章从非对称博弈、有限群体、随机因素及动态过程四个方面分别介绍了博弈论理论家们对该概念的拓展。

关键词：进化稳定策略；渐近稳定性；严格N群体ESS；随机稳定集；群体稳定集

引言

进化博弈理论来自于达尔文的生物进化论，至少自雷威丁(Lewontin 1960）用于解释生态现象 ②就已经产生了。但直到1973年梅纳德·史密斯和普莱斯（Maynard Smith and Price）、梅纳德·史密斯（1974）提出了该理论的基本均衡概念----进化稳定策略[3]（evolutionary stable strategy, ESS）及泰勒和乔克（Taylor and Jonker）提出该理论的基本动态概念---模拟者动态以后，进化博弈理论得到了理论界的普遍关注。特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开，正式确定了进化博弈理论在经济学上的学术地位，此后，该理论在经济学便上获得了迅速的发展及广泛的应用。越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981)；阿克赛尔罗德（1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向［康利斯克（Conlisk 1980）；利奈尔和罗尔（Cornell and Roll 1981)］、消费者对品牌的选择[凯思和史培罗（Katz and Shapiro 1985）]、社会学习过程[弗登博格（Fudenberg 1995）]及社会习俗形成[彼特·杨，（H. Peyton Young 1993，1998）等领域的相关问题。进化稳定策略是进化博弈理论最基本的均衡概念，它具有广泛的应用并在发展中得到了不断完善。本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。

一、原初ESS定义及其缺陷

在梅纳德·史密斯和普莱斯(1973）；梅纳德·史密斯(1974）提出进化稳定策略概念以前，进化博弈理论的发展还仅仅处于萌芽阶段。在这一时期生态学家们主要应用纯数学理论如极限环、分岔、奇异吸引子（罗森，Rosen 1970）等概念来描述生态演化系统并用于解释生态现象，同时把生物之间的互动行为纳入到进化模型之中(威尔·艾德瓦兹，Wynne-Edwards 1962)，他们处理问题的方法已经蕴含了进化博弈理论的基本思想。

在七十年代，生态学理论和博弈理论在各自领域中都获得了迅速的发展，同时实验经济学作为一门学科也获得了经济学界的一致认同，这些条件为进化论与博弈论的结合提供了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973）在总结以前理论的基础上，提出进化博弈理论的基本均衡概念----进化稳定策略③ ，该均衡概念的提出使得进化博弈理论的研究有了明确的方向，为进化博弈理论的进一步发展奠定了坚实的基础。

所谓进化稳定策略就是指：如果占群体绝大多数的个体选择进化稳定策略，那么小的突变者群体就不可能侵入到这个群体。或者说，在自然选择压力下，突变者要么改变策略而选择进化稳定策略，要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973）所定义的进化稳定策略（文献[3]对此有详细的介绍）：

说是进化稳定策略，如果，存在一个④，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入界限（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。从定义可以看出，当系统处于进化稳定状态时（群体选择进化稳定策略时所处的状态就是进化稳定状态），除非有来自外部强大的冲击，否则系统就不会偏离进化稳定状态，即系统会“锁定”（Lock in）于该状态。定义的直观意思就是，当一个系统处于进化稳定均衡的吸引域范围之内时，它就能够抵抗来自外部的小冲击。显然，进化稳定策略是一个静态概念，但它却可以描述出系统的局部即吸引域内的动态性质。

原初进化稳定策略定义为以后的研究者提供了理论基础，但它是建立在许多理想化的假定之上，存在着许多不够完善的地方：第一，梅纳德·史密斯等是在研究生态现象时提出的进化稳定策略概念的，由于动植物的行为完全是由其基因决定的。因而，每个种群体都被程式化为一个纯策略，整个生态环境的所有种群也被看作一个大群体。然而，同一种群的个体由于其性别不同、需要不同、能力不同、基因突变或基因遗传⑤ 等因素都会影响到它们的行为，把每一个种群行为程式化一个纯策略是没有太强说服力的，把一个生态环境中所有种群看作一个大群体也存在不妥之处；第二，从梅纳德·史密斯等提出的进化稳定策略定义可以看出，它仅适应于互不重叠且相互独立的突变因素的影响，其吸引域半径只与单个突变因素y有关，也就是说只有等到一个突变因素对群体的影响消失之后，才能出现另一个突变因素，现实中出现这种现象是非常偶然的；第三，梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体规模无限大 ⑥，即隐含地假定博弈的支付⑦ 空间是一个连通、闭集，这个假定不符合现实；第四，从原初的进化稳定策略定义可以看出，它是一个静态概念，只能描述系统的局部动态性质，没有涉及到动态系统整体的调整过程，而现实中许多系统的均衡依赖于系统的整体动态性质。

从生态意义上说，进化稳定策略把种群之间的互动行为纳入到模型之中，推广了达尔文的优胜劣汰理论，然而与纳什均衡概念相比，进化稳定策略并不能解释群体如何达到稳定的。它只能回答一旦达到了这种稳定状态，原群体就对突变者群体者具有较强的抵抗力。也就是说，它只能回答当系统处于某一个均衡点的吸引域时，在一定条件下，随着时间的演化,该系统就会趋于这个均衡点，而当系统有多重均衡或者多个吸引域时，原初的定义就显得无能为力了。事实上梅纳德·史密斯和帕克（Maynard Smith and Parker 1976）、梅纳德·史密斯（1978；1979）已经识到原初定义的某些缺陷，梅纳德·史密斯（1982）给予了一定程度的修进并提出了修进的ESS（Modified ESS）概念。下面我们从四个方面来介绍理论家对进化稳定均衡所作的拓展。

二、非对称群体中的ESS概念

梅纳德·史密斯早在1979年就已经意识到，原初的进化稳定策略在处理多群体非对称博弈时遇到了困难。他发现，在现实中，如生态学、经济学和其他社会科学中的许多策略互动行为可能发生于两个或多个群体的个体之间，个体之间进行的是非对称博弈，单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化稳定标准拓展到多群体情形呢？在单群体中，所有的个体都被程式化了一个纯策略（梅纳德·史密斯假定只有纯策略是可以遗传的），个体之间进行的是两两重复匿名博弈；并且在单群体中，规模很少的突变因素对群体所产生的影响是可以忽略的，因此，非严格纳什均衡策略不可能侵入到最优反应的严格纳什均衡策略群体。在多群体中，突变因素可能来自于各个群体，突变策略者的互动行为会对群体行为产生不可忽略的影响。因此，原初的进化稳定标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。Selten(1980)认为，把均衡概念由单群体拓展到多群体不是一个简单的过渡，而是涉及到系统的动态调整过程及动态稳定性等一系列的变化。哈曼斯顿（Hammerstein 1981）认为，在非对称博弈中，个体更加倾向于应用稳定策略来选择行为并决定竞争结果，而这些稳定策略与进化稳定策略相比，可能会有更少的“吸引域”。因此，由进化稳定策略定义所得的结论就显得有点似是而非了，但他没有作出进一步解释。

泽尔腾(Selten (1980))首次深入地研究了非对称博弈动态稳定性并利用两群体博弈情形证明 “在非对称博弈原初进化稳定策略必定是严格纳什均衡”。后来，Van Damme（1987）在更一般的情形下证明了这个命题⑧ 。我们知道，严格纳什均衡本来就显示出很好的性质，如果一个理论把其主要的注意力集中于研究严格纳什均衡，那么它就没有任何理论价值；更重要的是许多非对称博弈根本就不存在严格纳什均衡，因而也就无法研究动态系统的稳定性；在非对称博弈中，渐近稳定性（Asymptotic Stability）实质上也蕴含了严格纳什均衡，因此，渐近稳定性在非对称博弈中也不是一个合适概念；进化稳定策略是一个静态概念，虽然能够描述系统的局部动态性质，但在非对称博弈中，原初的进化稳定均衡与动态演化过程极限结果之间的对应关系却不明显（即出现了局部与全局的矛盾）。因此，要研究非对称博弈的动态稳定性就必须通过考察系统的动态演化过程来寻求能够适应于对称博弈与非对称博弈的稳定性概念。为了能够更精确地描述非对称博弈，泽尔腾（1983,1988）通过对引入角色限制行为（Role Conditioned Behavior）而提出了适应于非对称博弈的ESS概念。

他的定义如下：在有角色限制的博弈G中，一个行为策略称为进化稳定策略，

如果（ⅰ）对任意的，满足

（ⅱ）如果那么对任意的有。

然而，泽尔滕的ESS概念尽管适应于描述两群体非对称博弈的情形，但它只能描述系统的局部动态性质，而且该定义并不能够显示出均衡概念与动态演化过程极限结果之间的关系。因此，要更好地描述非对称博弈均衡，就必须正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是，弗里德曼（Friedman 1991）考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论：（1）每一个纳什均衡都是动态系统的静止点（rest point）⑨ ；（2）渐近稳定结果必定是纳什均衡；（3）在对称和非对称博弈中，对所有单调调整过程而言ESS不一定是渐近稳定的；（4）对某些单调调整过程而言，正规ESS是渐近稳定的。在此基础上，他得出了“渐近稳定结果必定是纳什均衡”结论。莱瑞·萨谬尔森和张建波（Larry Samuelson and Jianbo Zhang 1992）在弗里德曼（1991）的基础上进一步考察了非对称博弈的累积单调选择动态（Aggregate Monotonic Selection Dynamic）并得出：在非对称博弈中，单调调整过程能够剔除所有严格劣的纯策略,并且能够确保均衡结果必定是纳什均衡。同时，他们证明了“稳定点必定是纳什均衡”及“渐近稳定结果必定是严格纳什均衡”，进而强化了弗里德曼（1991）的“渐近稳定结果必定是纳什均衡”的结论。

Swinkels(1992)认为，进化稳定标准不对突变策略组合给予适当限制是说不过去的。特别地，在处理某些经济问题时，突变策略可能来自于参与人或者企业的创新、试验等活动，这些突变策略组合本身可能会影响系统的稳定性。因此，考察相对于后进入突变群体最优反应策略组合的稳定性可能会更合理，并且这些稳定性概念很容易由单群体情形推广到多群体N-人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。

定义：称之为相对于均衡进入者的稳健策略（Robust against Equilibrium Entrants REE），如果存在对所有的策略组合及满足：。其中表示突变策略；表示选择突变策略者在群体中所占的比例；表示混合群体；表示突变策略相对于策略x的最优反应策略，他并且证明了REE是ESS的一个子集。然后，他又把REE概念推广到了N-人非对称博弈的情形而提出了均衡进化稳定（Equilibrium Evolutionarily Stable EES）概念：

定义：称集合是均衡进化稳定的（EES），如果它是相对于下面性质的最小集： X是纳什均衡策略集合一个非空闭子集，存在，如果及，那么。

换句话说，EES集是纳什均衡策略集的最小闭集，它能够保证任何小规模的均衡进入突变者不可能使得群体离开进化稳定均衡的吸引域。

三、有限群体上的ESS概念

梅纳德·史密斯等提出的ESS概念另一个缺陷就是，他们为了在技术上处理的方便而认为群体规模无限大，这个假定与现实尤其应用于解决经济问题时并不相符。为了使理论与现实更接近，许多博弈论理论家对有限群体的均衡问题进行了深入的研究。沙弗尔（Schaffer 1988)首次放开群体规模无限大的假定，考察了有限规模群体的进化稳定性并提出了有限群体ESS（Finite Population Ess）概念。他证明“在一般情况下，有限群体ESS并不是纳什均衡策略”。汉森和萨谬尔森（Hansen and Samuelson 1988）分析了经济博弈的演化过程，并把有限群体ESS称之为“普遍生存策略”（universal survival strategy）。他们认为，在现实世界竞争中，未来的利润和可供选择的策略具有不确定性，这就会阻碍企业选择最优化策略，企业必须通过不断的试验、学习过程来寻求有利可图的满意策略 ⑩（不一定是最优策略）。沙弗尔(1989)应用“普遍生存策略”来研究寡头企业之间的竞争并得出结论：通过经济自然选择过程 ⑾而得以生存下来的策略是相对的而不是绝对的利润最大化策略。泰尼克（Tanaka 2000）利用模拟者动态，考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”（Globally Surviving Strategy GSS）。他得出结论的是：在价格与数量竞争的寡头模型中，GSS都是随机稳定的并且在两种情况下它们是等价的。

以上所得到的均衡概念基本上是适应于单群体有限个体情形，并不适应于有限个体多群体博弈。哈佛保尔和西格蒙德（Hofbauer and Sigmund 1988）证明了“两群体对称博弈中不存在混合策略ESS”。泽尔腾(1988)在考察了大量的两人对称博弈的基础上也得出了类似的结论。克瑞斯曼（Cressman 1992）定义了有限两群体非对称博弈的进化稳定策略，1996年对他所定义的概念作了进一步说明。他认为，在模拟者动态下，至少一个群体的突变者所得到的平均支付少于选择稳定策略者所获得的支付，才能保证静止点的渐近稳定性。Garay and Varga(2000)认为，定义有限数目多群体的均衡概念应该满足如下三点：其一是突变者不能侵入他自己的群体；其二是现有群体对来自外部的随机冲击具有较强的抵抗力；其三是多群体ESS定义应该与非对称博弈理论的基本结论一致。众所周知，纯策略模拟者动态的渐近稳定集并不一定是ESS。那么，哪一种动态稳定概念等价于ESS呢？克瑞斯曼(1990)指出，在单群体条件下强稳定性等价于ESS，那么多群体的ESS定义也应该满足多群体稳定性概念等价于多群体ESS。根据这个标准，Garay and Varga(2000)定义了严格N群体ESS概念。其定义如下：

定义：策略组合称之为N-群体进化稳定策略，如果对每一个，存在，对所有的都有：

框架。

四、随机因素影响下ESS概念

梅纳德·史密斯等提出的ESS概念第三个缺陷是要求突变因素是不连续且不重叠的。原初ESS定义由于仅仅考虑单个因素对系统的影响，所以任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态。帕克和菲尔德曼（Peck and Feldman 1988）认为，由于群体规模和后代数目很大，因而随机因素对动态系统的影响是可以忽略不计的。现实并不是这样，经济演化系统常常会受到来自突变和其他偶然事件的冲击，这些因素可能会对系统产生不可忽略的影响。福斯特和杨（Foster and Young 1990)认为，首先，ESS概念把影响系统的因素都看成是一个个孤立的事件，而在现实中系统常常会受到连续的随机冲击。如果假定有一个因素的影响消失以后，再考虑另一个因素对系统的影响，那么，系统当然就不会远离原来的均衡状态；其次，现实中出现上述情况纯属偶然现象，一个只能处理偶然现象的理论是没有任何存在价值。现实中，尽管单个随机因素对动态系统的影响较少，但它们却可能对系统产生累积作用而定量地改变系统的稳定性，使得系统离开进化稳定状态，系统什么时候回复到当初的进化稳定状态，依赖于动态过程的全局结构，而ESS定义是一个局部概念，因此在考虑随机冲击时就不能作为判断系统稳定性的标准；再次，由于系统的极限行为依赖于初始条件，同时在吸引子集合中只有一部分状态是随机稳定的，且随机稳定状态的选择还依赖于随机过程特定的结构，因此，ESS和一般意义上的吸引子（Attractors）由于没有充分地考虑到随机因素对进化系统的影响，在描述随机系统的稳定性时也很不理想。于是，他们首次把影响系统的随机因素纳入到进化模型之中并提出了一个既不同于传统ESS也不同于吸引子（Attractor）概念的随机稳定性（Stochastic Stability）概念。他们的定义如下：

定义：群体向量是随机稳定的，如果随着随机影响，极限密度对的每一个小邻域都赋有正概率；更精确地说，其中。其中是当时，的极限分布，表示随机因素对系统所产生的影响。

粗略地说，一个状态P是一个随机稳定的，如果在长期中，随着随机冲击因素影响的不断变少，系统几乎一定（nearly certain）不会离开P的任意少的邻域。随机稳定的群体向量总是存在的，它有如下性质：随着及，它是一个最小闭集。接着，他们又提出了更一般的概念----随机稳定集（Stochastic Stable Set）。随机稳定集是一个满足如下条件的状态集合，即从长期来看，随着随机冲击的不断变少，系统几乎一定处于包含于S的任何一个开邻域中。随机稳定集概念的提出把传统确定性动态模型中的ESS拓展到随机性动态系统中，并且它是一个比进化稳定策略集更精练的概念，是进化稳定集的子集。随机稳定集已经成为描述随机动态系统的基本均衡概念。

五、ESS与动态的结合

从ESS的定义可以看出，它只能描述系统的局部动态性质而与系统的全局动态过程无关，然而，要更准确地描述一个系统的动态性质就必须对仔细考察整个系统的动态调整过程。泰勒和乔克(Taylor and Jonker 1978）首次把传统的ESS定义用模拟者动态模型表示出来，他们证明在一个多群体的模型中，进化稳定策略是渐近稳定的充分但非必要条件。但他们没有作出进一步的研究。鉴于此，吉尔博和马特休(Gilboa and Matsui （1991）)在考察群体行动态调整过程的基础上，提出了“循环稳定集”（Cyclically Stable Set）又一均衡概念。“循环稳定集”直接来源于群体行为的调整过程，其基本思想是“可接近性”（Accessibility）。一个策略分布f称为可以从另一个策略分布g接近是指，如果存在一条从f到g的道路，且在该道路方向上任何一点都是相对于该点的最优反应。“循环稳定集”是指在满足“可接近性”条件下是封闭的策略分布集合（在该集合中任何两个分布之间都是接近的）。与一般均衡理论不同，仅当参与人按照均衡策略而作出选择时才有效，CSS并不要求群体保持这种决策状态。CSS的直观意义是，在一个很短的时间间隔内，只有少部分人离开或者死亡并且由一些新来的人（新生的孩子）代替，这些新来者从他们的母体那里继承一些行为模式，并且在现行预期（也就是说他们并不关心行为模式未来的变化）条件下作出最优的反应，一旦新来者选择了某一行动，他就会一直坚持下去（转换成本的存在是他坚持这个行动的一个重要原因）。马特休（Matsui 1992）给出了一个“稳定”策略的静态表述，在存在对原群体中各策略的初始分布冲击的情况下该策略能够保持这种分布。斯温克斯（1992）在马特休的基础上提出了“群体稳定策略”（Socially Stable Strategy SSS）。相对于均衡的进入者而言，所谓“群体稳定策略”是指如果存在一个突变群体（或者进入者群体，譬如说群体A），其支付高于原群体的支付，那么必定存在另外一个群体（如群体B），在这个包含大部分原群体个体而有一少部分群体A的个体的群体中，群体B将获得高于群体A的支付。这个概念也称为“稳健策略组合”。当然在某些情况下，“群体稳定策略”可能并不存在，但不是这个概念本身的缺点，出现这种情况与我们所研究的动态过程本身是分不开的。然而，我们可能会问，实际的行为模式又是怎么样呢？如果这个过程并不是稳定状态，那么稳定状态又是什么呢？在对这个问题作出回答时，马特休利用了吉尔博和马特休（1991）所提出的集值解的概念（Set-valued Solution），同时他也证明了循环稳定集的存在性。Binmore and Samuelson(1993)把参与人的学习过程纳入到了进化模型中并提出了自我强化均衡[10]（Self-confirming Equilibrium）。他们认为，每个参与人都会通过自己的经验来推断对手可能选择的策略而作出最优反应，这个学习过程可能使得系统在不同自我强化均衡的吸引域之间漂移而不会停留在某一个均衡，由于在非均衡路径上的推断不一定正确，所以自我强化均衡可能不一定是纳什均衡。

结束语

进化博弈理论从发展到现在虽然只有二十几年的历史，但它却受到社会学、经济学、生态学们的普遍关注。特别是该理论的基本均衡概念----进化稳定均衡提出以后，理论界已经从不同的方面对它进行了拓展，并取得了令人瞩目的成果，使进化博弈理论体系得到了在发展中不断完善。进化博弈理论具有较强的实用性和广阔的发展前景 ⑿，相信它会引起更多经济学家的兴趣，必将成为主流经济学的一部分。

注释： ①张良桥：中山大学岭南学院经济学系数量经济学硕士研究生，广东省顺德职业技术学院经济管理系教师（邮政编码：528300；联系电话：0765-2338029；13825507060，值此文发表之际谨向他们致以深深的谢意，同时要感谢经济管理系的仇颖老师对此文中英文名字进行了认真的翻译。 ②生物学家在研究生态现象时发现，利用纳什均衡可以很好地解释生物进化结果。然而，生物是没有思维的更谈不上理性要求了，它们的行为却可以趋于纳什均衡，因此，理性要求并不是纳什均衡的必要条件。这样，生物进化论与博弈论的结合便成为可能，为进化博弈理论的产生奠定了基础。进化博弈理论以群体（Population）为研究对象，主要处理群体中近视且幼稚的(Navie)个体进行重复、匿名博弈的动态调整过程。其基本思想为：给定群体所处的状态，随着时间的演化更合适的策略会被更多参与者采用，其目的是为预测群体最终行为提供一个理论依据。 ③此后本文称之为原初定义 ④实际上相当于吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。 ⑤如长颈鹿进化的过程。 ⑥对群体模型为无限大的要求有两个原因：其一是机械式的，为了假想的“侵入界限”（Invasion Barriers）也就是突变者群体在大群体中所占的份额（Population Share），当突变群体模型超过1/n时，n是大群体的个体数，突变群体就有可能侵入到大群体，进化稳定策略的条件就有不满足了。其二是技术上的，群体模型足够大，就可以忽略掉现行群体个体的行为对其他突变者群体未来行为的影响，即不考虑学习过程。 ⑦其中的支付是生态学上的适应度（Fitness）或繁殖成活率。 ⑧下面我给出Van Damme1987的证明：首先设是进化稳定的，并且令所有参与人都选择不变的策略。令，对所有的。令，其中，那么对所有，满足及，因此，由进化稳定性可知。所以，而是任意的，所以。其次，设是一个严格纳什均衡策略，并且，那么至少存在一个满足，由的连续性可知，至少存在一个，对所有及，至少存在一个满足：，这就说明是进化稳定的。 ⑨静止点（Rest Point）就是当动态系统处于静止点时就不会离开该点。 ⑩Alchian(1950)指出，企业必须通过对所观察到的市场参与者的行动与结果之间的比较来得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的选择过程，每一个企业所能够选择的策略不随环境的变化而变化。在每一个阶段结束时，如果企业1的利润大于企业2的利润，那么企业1在下一阶段生存下来的概率就大于企业2在下一阶段生存下来的概率。相应地可以把企业的生存规则看作为策略的幸存，成功策略在群体中所占的比例通过企业之间对策略的模仿而得以增长 ⑿杨小凯教授（1995）认为，博弈理论当前最有趣的研究成果及日后有可能获得诺贝尔奖的工作就是信息不对称的动态博弈模型，以及对策游戏规则演化模型（也就是进化博弈模型）。事实上1996年及2001年的诺奖都属于研究信息经济学的经济学家，这说明杨教授具有超前的预见性，进化博弈理论研究者虽然还没有获得诺贝尔经济学奖，但也可以说明杨教授非常看重对进化博弈理论的研究。

[参考文献]

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .

[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.

[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.

[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.

[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.

[10] Fudenberg, D. （1998）: Learning in Games, Cambridge MIT Press.

[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.

[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.

[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.

[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.

[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.

[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.

[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.

[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.

[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.

[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.

[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.

[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.

[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.

[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.

[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.

[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.

[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.

[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.

[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.

[31] Wynne-Edwards, V. C. (1962): “Animal Dispersion in Relation To Social Behavior,” Hofner, New York.

博弈论的概念范文第2篇

关键词：博弈论高校韩国语笔译教学作用

一、博弈论概念

博弈论，又称游戏理论，是一种源自游戏的数学研究，其主要目的是通过寻求最佳的游戏，使得游戏的局中人能够获得最大的赢得。由于在游戏中，每一个参与者得到的结果不仅取决于自身的策略选择，同时也取决于其他参与者的策略选择，因此博弈论对于策略问题的研究，并不仅仅局限于决策方的立场和策略，还包括对各决策方策略之间的相互作用的分析，综合考虑各方因素后得出具有最理性的策略，从而实现最大收益。博弈可分为合作博弈和非合作博弈两种，若参与人在博弈过程中能够达成具有约束力的协议，则为合作博弈，反之则为非合作博弈。目前来看，合作博弈主要强调集体主义、公平公正，而非合作博弈主要强调个人理性及个人的最优决策，两者在社会、政治、国防等领域都有着广泛的应用。

二、笔译的博弈形式

在外语翻译中，面对两种不同的语言文化背景，对翻译人员的策略选择形成了一定的约束和限制。由于翻译人员与源语作者很难达成一个双方认同的具有约束力的协议，因此表现为大量的非合作博弈及少量的合作博弈。

例如，在高校外语笔译教学中，教师往往针对课本中的例句进行讲解，这种对既定内容的传授，使得学生普遍认可教材中的翻译结果，从而形成一种合作博弈的形式。这种形式的本质是一种模仿性学习，同时也是笔译教学的初级阶段。教师在教学以及课外作业的布置中，同样是对既定内容的传播。换言之，教师认可教材中提到的“标准答案”，在这种情况下，教师与原译者之间建立起一种有约束力的协议，同样属于合作博弈。因此，如果笔译教学仅仅停留在对教材的模仿和认可阶段，只是一种初级的合作博弈。

要想促进教学水平的提高，实现笔译教学从初级到高级的提升，就必须敢于打破常规，引导学生对教材内容提出质疑，对不合理的地方进行摒弃和纠正，推动教学活动进入到讨论和研究的层面，实现探究性学习。这种形式实际上是对原译者的质疑，属于一种非合作博弈形式，同时也是笔译教学中的高级阶段。

三、笔译的博弈教学

对于外语的翻译通常有直译和意译两种形式。一方面，由于文化背景的差异性，不同民族和地域有着自己独特的语言，在翻译中很难做到一一对应，这时就只能通过词语与文章的上下联系，进行意译。例如：‘그 사람은 구두쇠입니다’，意译为“那人是个吝啬鬼”，这里的구두쇠在韩国语中是一个派生词，如果直译，会让人不知所云。另一方面，人类的生活在本质上存在许多相通之处，且中韩两国文化也有很多相似之处，很多词语和句子采用直译的方式也不会产生歧义。例如，‘철수는 소와 같이 자기의 투박한 본성을 지켜왔으며 꾸준히 일만 하였다’，就可直译为“哲秀就像头老黄牛，有着忠厚老实的本性，光知道埋头干活。”从博弈论角度分析，直译属于合作博弈，而意译则属于非合作博弈。但这两种翻译方式是十分简单的二分法，对于较为复杂的作品，很难使用直译和意译进行解释，需要从更高的层面，也就是从归化与异化的博弈策略进行审视。

在笔译过程中，译者需要对各种意义要素进行综合分析，选择归化策略或者异化策略。影响策略选择的因素，不仅包括两种不同的语言体系和文化背景，也涉及不同的社会制度和意识形态，甚至包括一些主观因素，如源语作者的要求、读者的期待等。归化，就是要把原文本土化，以目标语或译文读者为归宿，采取目标语读者所习惯的表达方式来传达原文的内容。归化翻译有助于读者更好地理解译文，增强译文的可读性和欣赏性。例如，‘그 동안 우리 고향은 모든 것이 몰라 보게 변했다’，应该译为“这期间，家乡发生了翻天覆地的变化”。通过中文里一个常用的成语，能使读者准确地把握句子的意思，这种翻译策略主要是在综合考虑中国读者阅读期待的前提下作出的选择。反之，异化的原则是在翻译上迁就外来文化的语言特点，要求译者向作者靠拢，采取相应于作者所使用的源语表达方式，来传达原文的内容。使用异化策略的目的在于保存和反映异域民族特征和语言风格特色，为译文读者保留异国情调。例如，韩国有一种传统表演艺术叫做‘판소리’，是一种具有民族特色的曲艺形式。对‘판소리’有多种译法，如“板声”、“清唱”、“南唱道”等。《高丽亚那》期刊中将它翻译为“盘瑟俚”，无论在译义上还是在译音上，“盘瑟俚”都与‘판소리’吻合，较好地保留了源语的构词形式和文化内涵，可以说翻译得天衣无缝。

从实际应用方面看，笔译教学应该坚持直译策略、意译策略与归化策略、异化策略的辩证统一，培养学生灵活机动的策略反应能力，将翻译动机与制约因素相互结合，培养学生形成相对成熟的翻译理念，才能切实保证高校韩国语笔译教学的有效性，提升教学水平。

四、结语

总之，将博弈论概念引入高校韩国语笔译教学中，可以有效提高教学的质量和水平，培养出专业素质高且具有创新思维能力的翻译人才，推动社会的发展和进步。

参考文献：

博弈论的概念范文第3篇

〔关键词〕理性；博弈论；完全理性；有限理性

中图分类号：F22432文献标识码：A文章编号：10084096(2012)05001006

一、引言

理性是经济理论和管理决策理论的基础性概念。理性概念起源于古希腊哲学，是指合客观性（区别于信仰）和合逻辑性（区别于感性、情感和欲望等非理性），即在人的意识中能以数理逻辑表达的思维意识，是人所特有的、体现出人之为人而有别于动物的一种能力。理性是人类主体意识的标志，只有人类才具有理性的能力。具体地说，理性是指概念、判断和推理等系统化、理论化的思想、理论和学说，以及按照逻辑思维合理解决问题的能力［1］。

自从经济理论系统化以来，它一直是以某种理性概念为基础的［2］。在古典经济学中，自亚当·斯密提出“看不见的手”的原理以来，自利的“理性经济人”假设成为主流经济学的核心假设。新古典经济学分别从消费者效用最大化和生产者利润最大化角度，进一步完善主流经济学的理性基础。20世纪70—80年代以来国际上兴起了演化经济学、行为经济学等理论分支，分析视角逐渐从传统经济学的“理性经济人”假设拓展到人的有限理性（boundedrationality）或非理领域，并与行为科学、心理科学等其他科学相互交融。

作为现代经济学的前沿领域，博弈论不仅沿袭了主流经济学的理性假设，而且进一步要求“目标—手段”之间的一致性，即过程理性。传统博弈理论的理性概念将现实世界中人类复杂的互动行为加以高度的抽象和规范，在此基础上建立起数学模型进行演绎推理，分析人类冲突与合作行为达到的均衡结果。20世纪90年代以来兴起的实验博弈和演化博弈等分支领域，逐渐放宽传统博弈理论中行为主体完全理性的核心假设，转而研究参与者的有限理性和非理性互动行为。理性概念不仅构成了博弈均衡的分析基础，而且根据理性假设的不同限制产生了博弈论的理论分支。因此，理性概念在博弈论中占据核心地位。自20世纪40年代博弈论学科诞生以来，许多著名的博弈论学者如纳什、海萨尼和奥曼等人，在各个博弈论分支领域不断深化和丰富着人类互动行为中理性概念的内涵。本文首先回顾了西方哲学对理性概念的认识过程；第三节分别剖析了经济学和博弈论中理性概念的内涵；第四节分别从均衡概念的形成和各理论分支的基本假设等角度，论述理性概念在博弈论中占据着核心地位。

二、西方哲学对理性概念的认识过程

在哲学意义上，理性概念包含着如下四条基本原则：第一，人们只接受经过彻底的、批判的考察证据和正当的推理之上的真理。真理的产生途径只有两种：实证法和演绎法，“理性代表着精神对真理的追求和把握”。第二，现实是可知的。因为现实世界具有一种理性的，因而人类从理智上可以理解的结构。该原则将理性与命运说和不可知论等哲学观点分开。第三，强调自我认识的重要性。人的理性不是无所不能的，正如康德在《纯粹理性批判》的序言中所说，“一些问题困扰着理性，而理性则无法避开这些问题，因为这些问题是理性自己的本性强迫理性接受的，理性必须回答；但是，理性的能力是有限的，它不能回答这些问题，因为这些问题超出了理性力所能及的范围。理性不是由于自身的过错而陷于此种困境的，而是由于理性的界限”［3］。第四，实践理性，强调人类在选择手段和目的方面合理地指导自身行为的能力。正是实践理性的要求，构成了传统博弈理论大夏的基石：理性的行为主体不仅追求自身利益的最大化，而且具有理性的能力使得给定参与者对外部环境的信念后最大化自己的报酬。

自古希腊罗马时代起，理性就一直是哲学家们关注的焦点问题之一。在近代自然科学的推动下，理性主义认识论哲学思想逐渐发展成为近代乃至现代意义上的理论形态。

1古希腊时代的西方理性主义

作为西方哲学思想的发源地，在希腊哲学多种多样的形式中，差不多可以找到以后各种观点的胚胎、萌芽［3］。古希腊时代的理性开端于自然哲学对世界“本原”的思考。在德尔菲的阿波罗神庙上刻着一句箴言“认识你自己”，指出了人与动物的区别是人具有自我意识，具有反省和认识自己的能力，这种意识和能力即为理性。柏拉图认为在人的灵魂中蕴藏着作为其他一切知识起点的最真实、最普遍的某些知识、原理、观念或理念，其他知识都是这些最基本的知识的推演，人们学习和得到知识的过程，就是灵魂逐渐“回忆”的过程。亚里士多德将数学证明方法用三段论的形式表述为演绎逻辑。

2近代的西方理性主义

在西方近代哲学中有关理性主义和经验主义的认识论争议上，理性主义的“自明原则+演绎”方法与自然科学中的数学公理方法密切相关，而经验主义的“经验+归纳”方法与自然科学中的观察实验方法密切相关［4］。法国哲学家和数学家笛卡儿是西欧近性主义演绎法的奠基者，他认为对真理的认识不用靠实践来证实，而是要看我的思想、概念的清晰性和明确性，他还认为真理存在于理性之中。与之相对应的是作为近代经验科学奠基人的英国哲学家培根，他看到了经验科学（知识）的蓬勃生命力，提出“知识就是力量”的口号。怀疑主义哲学家休谟也认为，客观实在是否存在的问题是人的理性所不能加以解释的。

博弈论的概念范文第4篇

罗伯特•奥曼作为一名杰出的经济学家，在决策制定理性观点方面有着杰出的贡献，对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此，他于1983年获得了以色列技术机构颁发的科学技术哈维奖，1994年获得了以色列颁发的经济学奖。本文就他在博弈论方面的贡献以及相关思想作一评析。

一、弈论：交互式条件下“最优理性决策”

一般认为，博弈理论始于1944年。数学家约翰•冯•诺伊曼(john von neumann)和经济学家奥斯卡•摩根斯坦(oskar morgenstern)合作出版了《博弈论与经济行为》一书，概括了经济主体的典型行为特征，提出了策略型与广义型（扩展型）等基本的博弈模型、解的概念和分析方法，奠定了经济博弈论大厦的基石，也标志着经济博弈论的创立。

那么，什么是博弈论？奥曼认为，较具描述性的名称应是“交互的决策论”。可以看到，奥曼对博弈论的定义是十分简洁凝练的。因为博弈论是研究决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题的，就是说人们之间的决策与行为将形成互为影响的关系，一个经济主体在决策时必须考虑到对方的反应，所以用“交互的决策”来描述博弈论是再简洁不过的了。奥曼还以经济主体的理性为分析的出发点，认为博弈论是交互式条件下“最优理性决策”，即每个参与者都希望能以其偏好获得最大的满足。如果仅有一个参与者，通常就会产生划分明确的最优化问题。而在多人参与者的博弈论中，一个参与者对结果的偏好等级并不意味着是他的可能决策的等级，这个结果也取决于其他参与者的决策。

奥曼还分析了一般和特殊模型中的“解概念”，指出，就社会科学的理性方面而言，博弈论是一种概括或“统一场论”。这里的“社会”是广义的，包括人类和非人类的参与者（如计算机、动物、植物等）。与探讨像经济学或政治学等学科的他种方法不同，博弈论不利用个别的、特定的结构讨论各种具体问题，如完全竞争、垄断、寡头垄断、国际贸易、征税、表决、威慑等等。更确切地说，博弈论发展了原则上应用于所有交互情形的一套方法，并进而探讨这些方法在每一具体应用中所导致的结果。从一般博弈论方法得到的结果与用较为特殊的方法得到的结果之间，常常出现密切的联系。然而在其他的情形下，博弈论方法会得出一些其他方法未能得出的新见解。

二、完全竞争经济：参与者连续统模型

众所周知，完全竞争经济模型描述了一种存在着许多参与者（居民和厂商），并且每个参与者的影响都是微不足道的市场情形。就是说，在完全竞争的经济状态下，每个居民或厂商的交易量相对于市场总量来说是很小的，任何一个人交易的商品数量并不会影响总供给和总需求。然而，奥曼认为：“事实上，只要仅存在有限多的参与者，个别参与者对经济的影响就不能被忽视。因此，适合于完全竞争的直观上的概念的数学模型必须包括无限多的参与者。我们认为适合这个目的的最自然的模型包括了参与者连续统(continuum)，类似于一条线上点的连续统或流体中粒子的连续统。”

在经济理论中，“连续统”观点的引入对经济学的学科发展有很大的影响。奥曼指出，连续统可以被看作接近于存在许多但是数量有限的粒子（或经济主体，或策略，或可能的价格）的真实情形。采用连续统的粗略估计的目的是使称为“分析”的数学分支的强有力的、精确的方法得以应用，而使用有限的方法将会更困难甚至是无望的。古典经济学假定每个人接受既定的所有商品的价格（单个居民或厂商的决策不能影响价格）。为了使经济处于稳定的状态，价格必须使总需求等于总供给，这就是瓦尔拉斯的竞争均衡(walrasian competitive equilibrium)。奥曼证明了它的存在，并用商人连续统的市场作了明确的说明。

奥曼还考虑了称为联盟的团体和它们之间以互益的方式进行的交易。竞争均衡定义假定厂商允许市场力量决定价格，他们根据市场价格进行交易；而对埃奇沃思著名的“契约曲线”(contract curve)进行概括的博弈论概念的核心，则认为这个核心由在此之上没有联盟可以有所进步的所有分配组成，它忽视了价格机制，仅仅涉及参与者之间的直接交易。奥曼指出，竞争分配的核心和模式与厂商连续统的市场相一致。奥曼通过精确表达完全竞争观点的连续统模型，成功地使最初由埃奇沃思提出，经许多其他模型改进的理论精确化，并从此成为经济理论的基本准则之一。

此外，1975年，奥曼还获得了另一个完全竞争经济中竞争分配和值分配之间等价性的结果。在奥曼看来，博弈论和经济理论中最显著而独有的现象或许是竞争市场经济的价格均衡与对应的博弈的主要解概念（除一个以外）之间的关系。直观上看，等价性原理是说，市场价格的建立是从在完全竞争市场上运转的基本力量自然地产生的，几乎不管我们假定这些力量是怎样运转的。

综上所述可以看到，完全竞争分析所获得的基本观点，使对完全竞争之外的基本经济问题的研究成为可能并且更加容易。在这方面，奥曼最重要的贡献和影响是利用一个或更大的参与者的连续统建立的垄断和寡头垄断竞争模型，以及公共经济学基于经济活动和政治过程相互交织的税收模型，如表决、固定价格模型等。

三、重复博弈论：理论系统性的发展

重复博弈是指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容，它可以是完全信息的重复博弈，也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代，被称为“佚名定理”。该定理认为，重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而，虽然所有可行的个体理性结局确实代表了合作博弈的解观点，但是它相当模糊，并且不提供信息。而奥曼认为，完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁（自我破坏或其他）等现象。博弈论和新古典经济学模式的现象，可能一开始看起来是非理性的。

奥曼还考察了许多具体的合作行为，定义了“强均衡”概念，即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出，重复博弈的“强均衡”与一次性博弈的核（更精确的是“6核心”）相一致。为此，奥曼定义和研究了经济理论中极为重要的“一般”合作博弈，即非转移效用(non-transferable utility)博弈，这开拓了该领域的研究空间，因为在此之前，仅有“单边支付”博弈被研究，即每个联盟可以任意在其成员中分享一定数额的赢得。

其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始，奥曼和其他合作者一起，在其学生的辅助下，发展了不完全信息的重复博弈论。1966年，奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中，建立了不完全信息的重复博弈模型。他们指出，信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中，其中一个参与者比另一个拥有更多的信息（这就是所谓的单边的不完全信息），拥有更多信息的参与者所使用（并揭露）的信息数量是被精确地决定的；有时是完全揭露或根本没有揭露；有时是部分揭露。这种分析被扩展至更一般的模型，即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如，奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的”(jointly controlled lottery)的概念，即没有参与者可以单方面地改变不同结果的可能性，这个概念与非零和博弈密切相关。之后，奥曼在重复博弈上的研究获得了丰硕成果。事实上，他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科，诸如寡头垄断、委托人与人、保险等等。

四、合作与非合作博弈论：非转移效用与理性的假设

博弈论还可以划分为合作博弈与非合作博弈。在20世纪50年代，既是合作博弈发展的鼎盛期，又是非合作博弈的开创期。奥曼在该方面的贡献在于，一方面把“可转移效用”理论扩展为一般的非转移效用理论；另一方面发展并提炼了“什么是理性”，使之形成统一的观点。

合作博弈理论不讨论理性的个人如何达成合作的过程，而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈，它隐含的假设是存在一个在参与者之间可以自由转移的交换媒介（“货币”），每个参与者的效用在其中是线性的。

这些博弈被称为“单边支付”博弈，或“可转移效用”博弈(tu-games)。奥曼把“可转移效用”理论扩展到一般的非转移效用理论，发展并加强了可转移效用和非转移效用的合作博弈论。他先是界定了非转移效用联盟形式的博弈概念，然后提出了相应的合作解的概念。他研究了不同模型中的合作解，同时，将非转移效用值公理化，这是奥曼对合作博弈论基本原理所作的贡献之一。在1985年，奥曼还成功地制定了描述非转移效用值的一个简单公理集，这不仅拓展了这一领域的研究，而且产生了许多新的研究方向。

非合作博弈论的重点是对个体的战略选择，即每个参与者如何博弈，或者说选择什么策略达到他的目标。与之不同，合作博弈理论的重点则是对群体，并仅从更一般的意义上阐述了每个联盟的赢得，而没有说明如何赢得。奥曼通过多年的努力，发展并提炼了“什么是理性”。他认为：“如果一个参与者在既定的信息下最大化其效用，他就是理性的。”因此，一个理性人选择他最偏好的行动，当然“最”是相对于他所掌握的（关于环境和其他参与者的）知识而言的。令人惊讶的是，这个看上去简单清晰的表述可以以不同的方式理解，当然，也有些是互相矛盾的。什么是“参与者的信息”？他知道其他人的什么情况？是他们的理性吗？奥曼在他的许多影响深远的研究工作中解决了这些问题，并为这些模型制订了标准。

首先，他考察了知识和信息问题。对于这个问题，奥曼相当精确地概括出具有常识性的概念。他指出，如果开始时两个参与者具有了相同信念，但在对于一个具体事件的较晚的信念（基于不同的个人信息）是常识的，则这些较晚的信念必然形成一致。奥曼的观点对非博弈论产生了重大的影响。一方面，它导致了涉及多人情形下知识的正式概念的“交互认识论”整个领域的发展。另一方面，它形成了许多应用范畴。从经济模型——诸如只要人们有相同的最高执行官，他们的行为是人所共知的，那么具有不同信息的人们之间就不会产生交易——到计算机科学——用于分析分布环境，诸如多重处理器网络等。

其次，他假定参与者是“贝叶斯理性的”(bayesian rational)。这在一人决策论中或许是标准的，但是它在多人模型中是否也适用？奥曼引入了相关均衡的基本理论概念。相关均衡出现在经济和其他许多领域，引起了对不同交流程序和通常所说的“机制”的更重要的研究。

同时，奥曼还研究了“达到古典纳什均衡所需要的理性和理性知识的范围”的基本问题。他的观点与专业人士相反，认为答案并不一定是“理性的常识”。严格的理性是对决策者行为复杂的假设，由此产生了对边界理性模型的考察，该模型放宽了假定。奥曼指出，在交互情形下，微小的非理性是如何起很大作用的。实际上，在某些情形下，它能够导致重复博弈的合作。

五、其他贡献

奥曼在值集函数（即值为点集而非单独一点的函数）领域，也作出了许多重要的贡献，如“奥曼可衡量选择定理”、值集函数积分结果等。大部分问题产生于对不同博弈论和经济模型的研究，经济人连续统和数学理论是这些模型演化和分析的重要工具。奥曼所获得的诸如一般均衡、最优分配、非线性编制程序、控制理论、测量理论、定点理论等结果是基本的，它们被应用于经济学、数学、运筹学等许多领域。此外，奥曼把库恩(kuhn)著名的完全检索有限博弈中的行为和混合战略的均衡结果扩展为无限的情形，克服了复杂的技术困难。除了他发表的书外，奥曼多年来对许多人的研究产生了直接的影响。他向他们建议并提出了重要的问题和研究的渠道，与他们分享了深层的理解，帮助并鼓励他们从事研究工作。奥曼总是引导他的学生走向这一领域，与学生之间形成了双向反馈的相互作用，所获得的结果又被他用于塑造和提炼他的观点和理解。

六、简评

在过去的几十年中，奥曼对博弈论和经济理论的发展作出了重要贡献。可以说，在当代的博弈论研究中几乎没有他未涉足过的领域。他的研究具有与众不同的广度和深度，他的科学贡献从基本概念、学科的发现与形成到适当工具与方法的发展在分析不同具体问题中的应用，都具有开创性的进展。值得注意的是，奥曼的大部分研究与经济理论的中心问题联系密切。一方面，这些问题为他的工作提供了刺激和推动力；另一方面，他研究的结果产生了经济学新的见解和思维。

同时，奥曼的哲学论文和研究也具有相当的影响力。事实上，奥曼成功地以许多不同的受众可以接受的方式解释了甚至是最复杂的观点。他的研究并不止是一张简单列表，而是展示了所有美丽和清晰的宏伟画面，指出了成就、需要解决的困难以及将来研究的领域。毫无疑问，奥曼的观点从总体上说，在建立并使博弈思想和经济理论思想的轮廓更加清晰方面起了重要的作用。

【参考文献】

1.aumann,r.j.,1964,markets with a continuum of traders,econometrica 32.

2.aumann,r.j.and shapley,l.s.,1974,values of non-atomic games,princeton:princeton university press.

3.aumann,r.j.,1976,agreeing to disagree,annals of statistics 4.

4.aumann,r.j.,1985,an axiomatization of the nontransferable utility value,econometrica 53.

5.aumann,r.j.,1985,notes and comments on the nontransferable utility value:a comment on the roth-shafer examples,econometrica 53.

6.aumann,r.j.,1987,value,symmetry,and equal treatment:a comment on scafuri and yannelis,econometrica 55.

博弈论的概念范文第5篇

【关键词】博弈论，发展，前景

一、导论

博弈论理论的发展为很多问题的研究提供了非常有效的研究思路。但是博弈论的发展历程是怎样的、它是如何受到大家重视的、它的未来发展前景又是如何？本文通过对相关文献的搜集和整理，对上述问题进行梳理，有助于对博弈论有个更为清晰的认识。对博弈论发展的历史、现状和趋势有所了解，对我们更好的掌握这门学科有很大的好处。

二、博弈论的早期研究

很多学者想追溯博弈论的起源，但是针对这个问题并没有一个公认的答案。如果按照把博弈问题应用到决策问题和对决策问题的研究标准，那么可以说博弈论的历史非常悠久。因为在人们的日常生活和生产中常常都会进行博弈分析。有文献记载的最早具有博弈思想的事例可追溯到两千多年前我国的“齐威王田忌赛马”、一千五百年前巴比伦犹太教法典中的“婚姻合同问题”等。如果按照现代经济学和博弈论中经常引述的最早包含博弈思想的文献标准，古诺1838年关于寡头之间通过产量决策进行竞争的模型可以看做博弈论早期研究的起点。1883年伯特兰德的通过价格进行博弈的寡头竞争模型也是包含博弈思想的经典文献。对博弈论问题比较系统密集的研究开始于二十世纪初期。齐默罗和波雷尔对象棋博弈等的系统研究可以代表系统研究博弈理论的开端。诺依曼和摩根斯坦一九二八年给出了扩展形博弈定义。但是，这些研究都没有完成博弈论的理论体系。尽管如此，这些早期的研究还是对博弈论理论的产生起到了非常重要的作用。

三、博弈论的形成

对于一个理论的真正发展来说，仅有一些零星的研究还是不足以发展出博弈论的理论体系的，更重要的不是谁曾经有过零星的研究，而是谁的工作或者文章发表以后，它的思想或方法就引起了人们的兴趣和重视，并开始有越来越多的追随者。就像哥伦布并不是到达美洲的第一人，但却因为他的发现新大陆没有“失落”过，所以哥伦布享有发现新大陆发现者的荣誉。同样的道理，冯・诺依曼和摩根斯坦1944年出版的《博弈论和经济行为》，应该被看做博弈论历史的真正起点。在《博弈论和经济行为》中引入了博弈论的扩展表示和正规形表示，并定义了极小化极大解，指出这种解在所有两人零和博弈中都存在。该书在总结以往研究成果的基础上，给出了博弈论研究的一般框架，概念术语和表述方法，提出了相对系统的博弈理论。尽管现在看来该书某些地方还不全面，但是，其对博弈理论发展所起的巨大作用是不可否认的。

四、博弈论的成长和发展

博弈论第一个研究高潮出现在20世纪40年代末和50年代初。在第二次世界大战期间，博弈论的思想和研究方法在军事领域的应用推动作用下，这时博弈论的研究队伍已经有了很大的发展。纳什加入到博弈论的队伍是这个时期最重要的事件之一。纳什在1950年将博弈论扩展到非零和博弈，并提出纳什均衡概念和证明了纳什均衡存在性的纳什定理，发展了非合作博弈的理论基础。除了纳什的研究成果以外，这个时期还出现了很多博弈理论家和博弈论研究成果。例如，囚徒困境博弈的实验。五十年代中后期一直到七十年代也是博弈论发展历史中产生重要理论成果的阶段。例如：“微分博弈”的概念、“强均衡”的概念、关于重复博弈的“民间定理”。这个期间最重要的成果有赛尔腾1965年提出的在博弈方选择“相机计划”的博弈中不是所有的纳什均衡都是合理的，因为可能存在空头威胁的问题。1975年又提出了“颤抖手均衡”的概念。70年代博弈论发展中最重要的事件还包括“进化博弈论”的发展。此外“共同知识”在博弈论中的重要性也受到重视。

五、博弈论的成熟与主流经济学的融合

80、90年代是博弈论走向成熟的时期，在这个时期博弈论在经济学中的应用领域越来越广泛，在经济学中的地位达到了最高峰。这个时期的重要理论进展包括“顺退归纳法”、“序列均衡”的概念、《进化和博弈论》的出版、“完美贝叶斯均衡”的概念。正是这个时期，博弈论受到经济学家真正的广泛的重视，并被看做经济学核心的分析方法。也正是这个阶段开始，博弈论的思想、词汇开始在经济学杂志上大量出现。博弈论之所以会在经济学中的地位上升的这么快答案首先是现代经济活动的规模越来越大，对抗性竞争性越来越强，因此，经济活动的博弈性越来越强。其次，信息技术和社会经济信息化的发展使得人们认识信息的作用和规律的要求不断提高。从而促进了信息经济学的发展要求。因此信息经济学的发展也对博弈论的发展起到了促进作用。

六、博弈论的发展前景

由于博弈论本身优美深刻的本质魅力，新的博弈分析工具和应用领域的不断发现，一定会吸引大量学者加入。而且随着博弈理论的发展和博弈研究的不断深入，人们认识到这种理论还存在不少问题，特别是它的理论基础方面还存在一些没有很好解决的根本问题，这充分保证了博弈论在未来相当长的时间内的发展潜力。在金融、贸易、法律、政治等领域不断提出新的博弈论应用课题这也是今后博弈论进一步发展的巨大动力。而且，在合作博弈和非合作博弈两大博弈中，非合作博弈是博弈的主流，但是，合作博弈也具有相当重要的作用，而且要比非合作博弈理论更加复杂。正是由于这些原因，博弈论在未来一段时间内必然会有更进一步的发展，也会对经济学和其他学科的发展做出更大贡献。

参考文献：

博弈论的概念范文第6篇

为了让读者对进化博弈理论的基本概念——进化稳定策略（Evolutionarily Stable Strategy）有一个基本的了解，本文主要介绍进化稳定策略概念的提出及其发展。为了便于理解，文中利用一些具体例子简要地介绍进化稳定均衡（就是系统选择进化稳定策略时所处的均衡）求法、应用以及它与纳什均衡之间的关系。最后指出了传统进化稳定策略定义的缺陷及经济学家们对此所作的进一步研究。

关键词：进化博弈；进化稳定策略；进化稳定状态；纳什均衡

Abstract:

This paper is mainly about the concept of Evolutionarily Stable Strategy (ESS) and its developments. For the convenience of the readers’ better understanding of this basic concept in Evolutionary Game Theory, we use some cases to introduce the solution of Evolutionarily Stable Equilibrium (ESE, that is, the equilibrium when the system selects ESS), its applications and the relationships between Nash Equilibrium and ESE. Finally, we point out the flaws of the traditional concept of ESS and some economists’ researches on this.

Key words:

Evolutionary Game; Evolutionarily Stable Strategy; Evolutionarily Stable Status; Nash Equilibrium

摘要

关键词：进化博弈；进化稳定策略；进化稳定状态；纳什均衡

引言

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。进化博弈理论由于对参与人的理性要求较少而与现实更为接近，因此在短短的时间内就获得了迅速的发展。特别是Maynard Smith（1973，1974）等提出基本均衡概念----进化稳定策略（Evolutionarily Stable Strategy ESS）及Taylor and Jonker(1978)提出基本动态概念----模仿者动态（Replicator Dynamics）以后，进化博弈理论被广泛地应用于生物学、社会学等领域。1992年进化博弈理论的国际学术会议在康奈尔大学的召开，正式确定了它在经济学上的学术地位。越来越多的经济学家应用进化博弈理论来解释并预测参与人的群体行为，在多数情况下，它比利用纳什均衡预测人的行为更现实、更准确。由于历史原因，我国经济理论界到目前为此还没有对进化博弈理论的基本均衡概念进行系统介绍的文献。本文试图对进化稳定策略作出简要的介绍，并把该概念与传统博弈论的基本概念—纳什均衡进行比较。

进化稳定策略的定义及性质

进化博弈理论（Evolutionary Games Theory）来自达尔文的生物进化理论。在生物进化过程中不同种群在同一个生存环境中竞争同一种生存资源时，竞争的结果只有那些获得较高适应度（后代成活率）的种群 ③生存下来，那些得到较低适应度的种群在竞争中被淘汰(即优胜劣汰)；在进化过程中个体常常会发生突变、迁移、死亡，同时自然条件也会发生剧烈变化等都会对生物进化过程产生影响，因而要对种群进化进行比较完整的分析就必须建立一些能够综合考虑这些因素影响的模型。一般的进化博弈模型主要基于两个方面而建立起来的：选择（Selection）和突变(Mutation)。选择即是指本期中好（能够获得较高支付）的策略在下期变得更为盛行（被更多的参与者采用）；突变一般很少发生，它是以随机（无目的性）的方式选择策略（可能是能够获得高支付的策略，也可能是获得较低支付的策略）。新的突变也必须经过选择，并且只有较好的策略才能生存（Survive）下来。选择也可能包括许多形成机制，这些机制可能是生态的（支付决定后代的数量），也可能是个人的（试验、刺激反应等），也可能是社会的（学习与模仿等）。就较好策略变得更为盛行而言，这个过程是适应性（Adaptive）且是不断改进（Improving）的。

Maynard Smith and Price(1973)以及Maynard Smith(1974)在考察种群个体适合度由其行为共同决定条件下个体对成功策略选择的效果时，提出了一个能够综合描述上述各种因素的均衡概念----进化稳定策略，它后来成为进化博弈理论的一个基本均衡概念。

进化稳定策略的基本思想是：假设存在一个全部选择某一特定策略的大群体和一个选择不同策略的突变小群体，突变小群体进入到大群体而形成一个混合群体，如果突变小群体在混合群体弈所得到的支付大于原群体中个体在混合群体弈所得到的支付，那么小群体就能够侵入大群体，反之就不能够侵入大群体而在演化过程中消失。如果一个群体能够消除任何小突变群体的侵入，那么就称该群体达到了一种进化稳定状态，此时该群体所选择的策略就是进化稳定策略。下面我们利用一个简单的模型来给出进化稳定策略的定义。

进化稳定策略是在研究生态现象时提出来的，生态学中每一个种群的行为都可以程式化为一个策略，所以在一个生态环境中所有种群就可以看作一个大群体，群体中个体之间进行的是对称博弈④ 。下面就以为对称博弈为例来介绍进化稳定策略的定义。假定存在一个个体数为n（N={1，2，…，n }）的大群体 ⑤，其中n是一个充分大的数。群体中每一个个体都有相同的纯策略集合（行动集），于是混合策略⑥集合S可定义为：

稳定状态，此时系统所达到的均衡称为进化稳定均衡（Evolutionarily Stable Equilibrium）。上面的假定（c）并不是进化稳定策略的定义，下面我们给出进化稳定策略的正式定义：

策略是一个进化稳定策略，当且仅当对任何策略，存在使得不等式（1）对所有的成立。

由进化稳定策略的定义，可以得到一些简单的性质，下面给出并证明其中的两个重要性质。为了说明的方便，定义符号为的最优反应策略集。如果一个参与人选择策略s而其对手选择策略，他的支付为，策略s就称为对策略的反应策略，对策略的所有最优反应策略集记为。

性质1、如果策略s是进化稳定策略，那么对任何都有。

证明性质（1）说明策略s是相对于其自身的最优反应策略之一，也就是。（下面用反证法证明）如果策略s不是其自身的最优反应策略，那么必定存在另一个策略满足，由期望支付函数的连续性及期望支付函数是关于混合策略概率的线性函数，条件（1）可变为：

间进行的是对称博弈，在此基础上提出了进化稳定策略的定义，那么这个在考察对称博弈时得出的概念对群体进行非对称博弈时是否适应呢？有许多博弈论理论家对此进行了详细的讨论并得出：传统ESS并不适应于非对称博弈（Selten 1980），并且存在这样的博弈：单群体时没有进化稳定均衡而在多群体时却存在进化稳定均衡。Selten同时证明在非对称博弈中传统的进化稳定均衡与严格纳什均衡是一个等价概念。此外，从Maynard Smith and Price 所提出的原初定义还可以看出：传统ESS定义仅考虑到系统受到独立且不重叠突变的影响的情形，而没有考虑到当系统受到离散且重叠或者连续冲击时对均衡的影响，因此传统的ESS不适合后一种情形。要对群体行为的动态调整过程进行更为全面的分析，传统的ESS定义作用的局限性就表现出来了。

为了克服这些缺点，使理论能够更好地与现实接近，许多经济学家及生态学家对传统的ESS概念进行了不断的修进并提出了许多新的均衡概念。Selten(1980)首次探讨了非对称博弈中的均衡问题，他通过引入角色限制行为（Role Conditioned Behavior）提出了极限ESS （Limit ESS）概念，从而把传统的ESS引入到非对称博弈中。Schaffer, M. E., (1988) 首次研究了有限群体的均衡问题进而提出了有限群体进化稳定策略的新概念，他同时证明了有限群体进化稳定策略并不总是纳什均衡策略；Foster, D., and P. Young (1990) 首次把连续随机因素引入动态系统，并提出随机稳定性（Stochastic Stable Set）概念；Gilboa and Matsui(1991)提出的循环稳定集（Cyclically Stable Set），他们把传统的ESS引入到随机动态系统。Maynard Smith(1982)提出了一个比ESS更一般的中性稳定策略（Neutrally Stable Strategy）的概念，Binmore and Samuelson(1992)提出了类似的修正的ESS（Modified ESS）概念。这些概念的提出进一步丰富和完善了进化博弈理论的基本内容。

进化博弈理论的发展简介

进化博弈理论于二十世纪六十年代被生态学家们用于解释生态现象就已经产生了；在七十年随着ESS(Maynard Smith and Price1973; Maynard Smith1974)概念的提出，它就被越来越多的生态学家们所利用，在这个阶段有少数经济学家(Jones 1976, Hirshleifer, J.,1977)开始把生态观点引入到经济学领域，Hirshleifer认为应用进化博弈模型来解释经济规律是一个很自然的事情，Jones（1976）利用进化理论来解释一些货币现象；八十年代随着对经典博弈论研究的深入，许多经济学家把进化博弈理论引入到经济学领域，用于分析社会制度变迁(Axelrod and Hamilton(1981); Axelrod(1984))、行业演化(Porter, M1980)以及股票市场(Conlisk 1980; Cornell and Roll 1981)等等，同时对进化博弈理论的研究也开始由对称博弈向非对称博弈深入（Selten 1980；1983），并取得了一定的成果；进入九十年代，尤其是1992年在关于进化博弈理论的会议在康奈尔大学召开，进化博弈理论在经济学上的学术地位得到正式的认可，在这个阶段经济学家对进化博弈理论的研究进入了一个崭新的阶段，理论家们不仅考察了离散非重叠冲击对演化系统的影响，而且也把离散重叠冲击（Kandori, M. G. Mailath, and R. Rob 1993; Bergin and Barton 1996）及连续冲击对进化系统的影响（Foster, D., and P. Young 1990; Fudenberg, D. and C. Harris 1992）纳入到模型之中并对之进行深入的研究，进化博弈理论的应用已经渗透到了经济学领域中的各个方面，如Peyton Young（1993，1998）等利用进化博弈理论来研究社会习俗的形成、Fudenberg（1995）等利用进化博弈理论来研究社会学习过程、青木昌彦等（1996）利用进化博弈理论来分析社会经济体制形成的原因等等。

结束语

在生态学中，由于不同种群的行为可以被程式化为不同的纯策略，因而种群之间的博弈是对称的，另外种群所受到的影响（自然灾害、基因突变等）也是不连续的，所以传统的ESS概念能够很好地解释生态现象。然而，把进化博弈理论用于解释人的群体行为时，由于人与动物不同，人可以通过学习、模仿、试验等活动而作出行动选择，这样就使得系统的复杂程度增加。研究人的群体行为所建立的博弈模型一般是非对称的，而在非对称博弈中，传统ESS概念等价于严格纳什均衡策略，而严格纳什均衡本来就显示出许多理想的性质，如果把注意力集中于对严格纳什均衡的研究是没有任何实际意义的。此外，进化博弈理论利用系统论的观点来考察群体行为的演化过程，其均衡概念与进化动态的调整过程有关，而群体行为的动态过程是相当复杂的，所以要用一个统一的均衡来描述进稳定状态的困难就比较大。到目前为止还没有一个既能描述对称博弈又能描述非对称博弈且对所有动态过程都适应的均衡概念，并且进化博弈的理论体系还比较粗糙且存在许多不完善之处，但从进化博弈的应用及其发展趋势来看，我们有理由相信在不久的将来该理论一定会走向成熟，会成主流经济学的一个重要组成部分。

附录：

下面我们利用模仿者动态来证明，定义，则由模仿者动态可得

由博弈的具体数据得到：，应用关系及模仿者动态可得：

考文献

王则柯（1999）：《博弈论评话》，中国经济出版社。

张维迎（1996）：《博弈论与信息经济学》，上海三联出版社。

青木昌彦，奥野正宽（1996）：《经济体制的比较制度分析》，中国经济出版社。

Axelrod, R. (1984): The Evolution of Cooperation, Harper-Collins, HBJ, Press.

Axelrod, R. and W. Hamilton(1981): The Evolution of Cooperation, Science 211, 1390-1396.

Bergin, J. and L. L. Barton (1996): Evolution With State-Dependent Mutations, Econometrica, 64, 943-956.

Binmore ,K. and Larry Samuelson (1992), Evolutionary Stability in Repeated Games Played by Finite Automata, Journal of Economic Theory 57, 278-305.

Conlisk, J., (1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1, 275-293.

Cornell, B., and Roll, R., (1981): Strategies for Pairwise Competitions in Markets and Organizations, Bell Journal, 12, 201-213.

Foster, D., and P. Young(1990):Stochastic Evolutionary Game Dynamics, Theoretical Population biology, 38, 219-232.

Fudenberg (1995): Learning in Games, Cambridge, MIT Press.

Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 57, 420-441.

Hirshleifer, J.,(1977): Economics from a Biological Viewpoint, The Journal of Law and Economics, 20, 1-52.

Jones, R.,(1976): The Origin and Development of Media of Exchange, Journal of Political Economy, 84, 757-775.

Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

Maynard Smith, J. (1974): The Theory of Games and the Evolution of Animal Conflict, Journal of Theor. Biol. 47, 209-212.

Maynard Smith, J. (1982): Evolution and the Theory of Games, Cambridge, United Kingdom: Cambridge University Press.

Maynard Smith, J. and G. R. Price (1973): The Logic of Animal Conflicts, Nature, 246, 15-18.

Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical . Biology. 84, 93-101.

Schaffer, M. E. (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of theoretical Biology, 132, 469-478.

Selten, R. (1983): Evolutionary Stability in Extensive Two-person Games, Math. Soc. Sci. 5, 269-363.

Taylor, P. D. and L. B. Jonker (1978): Evolutionarily Stable Strategy and Game Dynamics, Math Biosci. 40, 145-156.

Van Damme, E. (1991): Stability and Perfection of Nash Equilibria (2nd edn), Berlin: Springer-Verlag.

博弈论的概念范文第7篇

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

博弈论的概念范文第8篇

Abstract: The aim of all the node enterprises to join the supply chains of agricultural products processing industry is to generate over the interests of the supply chain. Over the distribution of benefits become a hot research. The paper analyzes the problem of benefits distribution about supply chains of agricultural products processing industry through evolutionary game and constructs an evolutionary game model, ultimately determines the distribution benefits formula of coefficient λ.

关键词：农产品加工业；供应链；利益分配；演化博弈

Key words: the processing industry of agricultural products；supply chains；profit distribution；evolutionary game

中图分类号：F250 文献标识码：A文章编号：1006-4311（2011）08-0034-02

0引言

在传统的博弈理论中，认为参与人是完全理性的，并且参与人是在完全信息的条件下进行博弈的，但是现实经济生活中，参与人的这种完全理性与完全信息是很难做到的。所以，演化博弈论认为参与人是有限理性的，作为有限理性的参与人不可能完全正确地对博弈信息进行分析，要通过反复地模仿、学校、突变等动态过程，最终达到一种均衡的状态。演化博弈理论概念的重要组成是“演化稳定策略”（Evolutionarily Stable Strategy，ESS）和复制动态模型（Replicate Dynamic，RD）[1]。

1演化博弈论在农产品加工业供应链利益分配中的优势

在一定程度上，演化博弈论对传统博弈理论关于理性假设和完全信息假设的问题进行了补充和修正。与传统的博弈论相比，在对农产品加工业供应链利益均衡分配问题的研究上，演化博弈理论具有如下的优势：

1.1 强调参与人是有限理性的传统博弈理论对参与人的假设是具有完全理性[2]，在整个的博弈过程中，参与人至始至终都是以实现自身利益最大化为目标的，无论是在确定还是在非确定环境下，做出的决策以及判断都是正确的，都能实现自身的利益最大化。在农产品加工业供应中，各个节点企业与演化博弈中的参与者一样是具有有限理性的，他们的多数决策都是在复杂多变的环境下做出的，很难做到完全理性，并且对于博弈信息的掌握也是有限，参与人最后的博弈结果很难达到均衡的状态。演化博弈论放弃了完全理性这一假设，认为参与人在博弈过程中具有有限理性，这种有限理性是由参与人的知识水平、判断能力以及对博弈信息收集分析能力的有限性所决定的，由于参与人的有限理性决定了其决策的过程是一个非常复杂的调整过程，通过不断的调整，最终得到均衡的博弈结果。所以，运用演化博弈理论对农产品加工业供应链利益分配问题进行研究，通过各个节点企业间的不断博弈，最终得到农产品加工业供应链利益均衡分配的方法。

1.2 强调博弈的动态过程传统博弈理论与演化博弈理论中都有动态博弈的概念，但是两者之间却存在着本质的区别。传统博弈理论中的动态博弈是由于参与人在进行策略选择时有先后次序之分所产生的，它是用来检验作为完全理性的参与人对于信息传递的处理能力的。而演化博弈理论中的动态博弈指的是博弈的调整过程，这种调整过程实质上是在各种影响因素的共同作用下使一个动态系统达到均衡的过程，并认为这个均衡可以用一个函数来表示，这个函数是均衡过程的函数，可以将与均衡有关的各种影响因素都引入到该函数中，即演化博弈模型[3]。农产品加工业供应链具有很强的动态性，在利益分配问题上，各个节点企业之间通过反复地学习、模拟、协商谈判等动态调整过程而最终达成一致。而演化博弈理论强调的正是这种动态调整过程，所以，比传统博弈理论更适合描述农产品加工业供应链的利益分配过程。

1.3 提出了演化稳定策略这一均衡概念传统博弈理论的均衡概念主要讨论的是博弈均衡，研究的主要是纳什均衡及其精炼纳什均衡。而那是均衡点是一个静态的概念，指的是系统中的一个fixed point，这个不动点不能用来描述系统的动态性。而演化博弈理论中的演化稳定策略，是指群体达到一种能够消除任何小的突变的状态时群体所选择的策略[1]。从演化稳定策略的概念来看，它也是一个静态的概念，但是它可以用来描述动态系统中的一些动态性质，更准确地预测参与人的策略。运用演化稳定策略，可以更好地描述农产品加工业供应链的稳定状态，从而确定其利益分配的均衡方案。

2农产品加工业供应链利益均衡分配博弈模型

2.1 模型建立本文主要研究的是农产品加工业供应链上农户组织，农产品加工企业，销售商之间的利益分配问题，在整条供应链上的利益分配问题是以农产品加工企业为核心的，由农产品加工企业进行主导的，考虑到在农产品加工业供应链上的农户组织和农产品加工企业之间的供应关系与销售商和农产品加工企业的供应关系是相似的，所以在这里只对农户组织和农产品加工企业之间的利益分配问题进行研究，而销售商和农产品加工企业之间的利益分配问题用类似的方法解决就可以了。

假设农产品加工业供应链中有一群农户组织（或销售商，本文以农户组织为例）与农产品加工企业，双方面临着两种策略选择，合作与不合作，合作主要是指农户组织与农产品加工企业之间进行纵向合作，农产品加工企业出对农产品生产资料进行加工外，还向农户组织提供优良的种子，化肥、农药、先进的种植技术和科学的管理方法等支持，通过这些合作能够提高农产品加工企业产品质量安全水平，降低交易成本，提高顾客的满意度，最终提高农产品加工业供应链的竞争优势，从而获得超额利益。而不合作主要是指农户组织与农产品加工企业各自选择独立运营，互不干涉，双方严格按照交易合同之间交易。双方在考虑自身群体的因素和其他成员的策略选择情况的基础上，对其策略进行选择和调整。所以，农户组织与农产品加工企业之间的博弈属于两种群的演化博弈。

各假设信息如下：

v1，v2分别为农户组织和农产品加工企业不合作时单位产品所获得的利润，v1、v2>0；

Q表示农户提供给农产品加工企业的原材料销售量，Q>0；

C1，C2分别为农户和农产品加工企业选择合作时所投入的初始成本；

ΔV为为农户和农产品加工企业选择合作时所创造的超额收益；

λ为农户组织获得的合作产生的超额收益的分配系数，0

博弈方：农产品加工企业和农户组织，且双方具有有限理性；

策略：农户组织与农产品加工企业的策略集均为（合作，不合作）；

策略的采用比例：农户组织群体中采取合作的概率为x（0?燮x?燮1），不合作的概率为1-x；农产品加工企业采取合作的概率为y（0?燮y?燮1），不合作的概率为1-y。

因此，农户组织与农产品加工企业之间的博弈矩阵如表1。

综上所述可得，农户组织选择合作策略的期望支付为：

E=yλΔV+vQ-C

农户组织选择不合作的期望支付为：

E=vQ

因此，农户组织的平均期望支付为：

=xE+（1-x）E=λΔVxy-Cx+vQ

同理，农产品加工企业的平均期望支付为：

=yE+（1-y）E=（1-λ）ΔVxy-Cy+vQ

由以上各式可得，农户群体和农产品加工企业对x、y的复制动态方程为：

=xE-=x（1-x）λΔVy-C=yE-=y（1-y）（1-λ）ΔVx-C

2.2 模型分析令=0，=0，得到：在区域{（x，y）；0?燮x，y?燮1}中，存在A（0，0），B（0，1），C（1，0），D（1，1），E，5个均衡点。根据Friedman提出的方法[4]，仅有（0，0）和（0，1）是稳定的，是进化稳定策略（ESS），分别对应于农户与农产品加工企业间（合作，合作）和（不合作，不合作）两种策略。

农户组织与农产品加工企业博弈的动态演化过程可以用图1进行描述[5]。其中，折线BEC表示系统收敛于不同状态的临界线，在折线上方（CDBE部分）系统向（合作，合作）方向进行演化，收敛于（合作，合作），农户组织和农产品加工企业形成了完全合作的关系；在折线下方（ACEB部分）系统向（不合作，不合作）方向进行演化，收敛于（不合作，不合作），农户组织和农产品加工企业各自完全独立运营。

2.3 分配系数λ取值的分析根据以上分析，农户组织与农产品加工企业演化博弈的长期均衡结果是完全合作还是完全不合作，取决于区域CDBE和区域ACEB的面积。当SCDBE>SACEB时，农户组织与农产品加工企业合作的概率大于不合作的概率，系统将沿着路径ED向完全合作的方向演化；当SCDBE

农户组织与农产品加工企业加入供应链的直接目的就是获得超额利益，而农产品加工业供应链超额利益的分配是否公平合理是影响整体供应链稳定性的决定性因素，在这里我们用λ表示农户组织获得的超额利益的分配系数，λ的取值可以直接反应利益分配的合理性问题。下面讨论分析λ的取值。

根据图1，得出区域ACEB的面积为

S=•x+•y=+

S对λ求导有：

进一步求导得：

可见>0，所以S有极小值，则S有极大值，即农户组织与农产品加工企业向完全合作的概率有极大值。

令=0，得到：

求得：

λ=，

λ=

可见，利益分配系数λ的取值与农户组织与农产品加工企业合作时投入的初始成本有关，具体是取λ还是λ视具体情况而定，λ的取值范围为0

4结论

近年来，我国农产品加工业得到了较快的发展并成为我国国民经济发展的潜力增长点。随着经济的不断发展，以农产品加工企业为核心的农产品加工业供应链也得到了一定的发展。农产品加工业企业之间的竞争逐渐转变为农产品加工业供应链之间的竞争，而农产品加工业供应链的利益分配问题是影响农产品加工业供应链稳定发展的关键因素。所以，如何公平、合理地对农产品加工业供应链的利益进行分配成为学者们的研究重点。本文运用演化博弈理论对农产品加工业供应链中农户组织与农产品加工企业之间的博弈进行了演化分析，建立了农户组织与农产品加工企业的动态模型，并在此基础上确定了分配系数的取值，实现了农产品加工业供应链利益的均衡分配。

参考文献：

[1]张维迎.博弈论与信息经济学[M].上海：上海三联书店/上海人民出版社，1996.

[2]范如国，韩民春.博弈论[M].武汉：武汉大学出版社，2006：4-5.

[3]周F.产业集群供应链及其演化博弈分析[D].2008：48.

博弈论的概念范文第9篇

关键词博弈；不完备偏好；序贯均衡；纳什均衡；颤抖手完美均衡

中图分类号 F016 文献标识码 A

Sequential Equilibrium in Extensive Games with Incomplete Preferences

SHI Qi 1，2， CHEN Yiqing 1

(1.School of Economics and Management, Nanchang University, Nanchang, Jiangxi 330031,China;

2.School of Economics, Shanghai University of Finance and Economics, Shanghai 200433,China)

Abstract The Kreps and Wilson’s solution concept of sequential equilibrium was generalized to the extensive games with incomplete preferences.First a revised concept of trembling hand perfect equilibrium was given, and then was applied to verify the existence of sequential equilibrium in extensive games with incomplete preferences.

Key words game；Incomplete preference；Sequential equilibrium；Nash equilibrium；Trembling hand perfect equilibrium

1 引言

上个十年不完备偏好理论得到了复兴［1-3］. Bade［4］把它应用到博弈论中, 广泛地探讨了在参与者具有不完备偏好时的纳什均衡概念. Bade将经典纳什均衡概念扩展到不完备偏好的环境下, 发现一个博弈的纳什均衡恰好就是该博弈的所有完备化博弈的纳什均衡集的并集. 而且, 如果不完备偏好可以被一个多效用函数［1］所表示, 那么在一定假设下, 纳什均衡集恰好就是该博弈所有线性完备化博弈的纳什均衡集的并集.

纳什均衡是博弈论中最重要的解概念, 但是, 它可能会给出了太多均衡; 当博弈存在不完美信息的时候, 它甚至可能造成误导. Kreps和Wilson提出的序贯均衡［5］是纳什均衡的精练, 其基本思想在于均衡不仅应该描述参与者的策略, 还要描述参与者在每个信息集上关于究竟是哪个历史发生了的信念. 一个很自然的问题是: 当去掉完备偏好的假设, 是否仍然能够定义一个序贯均衡的概念, 使得它在每个有限扩展式博弈都存在呢?与Kreps和Wilson类似, 想使用原扩展式博弈的人标准式表示的颤抖手完美均衡来证明序贯均衡的存在性. 然而, 对于不完备偏好, 颤抖手完美均衡可能不是一个纳什均衡. 幸运的是, 任意有限博弈都有一个颤抖手完美纳什均衡(THPNE), 这样就能得到与Kreps和Wilson类似的结论.

2 基本概念

在本文中, Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}表示一个完美记忆有限扩展式博弈. 其中, N为有限的参与人集合, c为自然, H为历史集合, P 为参与人函数,fc为每个P(h)=c 的历史h指定一个A(h)上的概率测度fc(・|h)), 而且, 集合Ιi∈Ii为参与人i的一个信息集.

终结历史集合标记为Z. 每个参与人i∈N拥有一个定义在Z上的(可能为不完备的)偏好关系≥i.假设每个偏好关系≥i都是传递的, 反身的, 但是, 与经典理论不同, 不一定是完备的. 参与人 i 在 x和y之间无差异, 标记为x～iy, 当且仅当x≥iy 且y≥ix. 参与人 i 严格偏好x甚于y, 标记为x＞iy, 当且仅当x≥iy但不是y≥ix.

与不完备偏好表示理论的最近文献［2］相似, 考虑偏好关系≥i 是可以被函数表示的, 也即, 存在一个函数u:ZRn使得x≥y当且仅当u(x)≥u(y). 在下文中, 将用Γα:={N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈N}表示博弈

Γα:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}, 其中函数ui:ZRmi表示偏好≥i. 更具体而言, 对于任意向量α={α1,…,αI},αi∈Rmi, 定义一个博弈

Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I，

其中, αiui:ZR定义为αi和ui的点积, 或αiui=∑mij=1αijuij. 进一步的, 定义

Δ:={α={α1,…,αI},αi∈Δmi,i},

经济数学第 29卷第1期时奇等：不完备偏好扩展式博弈的序贯均衡

且

Δ+:=Δ∩R∑mi+ +,

其中,Δmi表示mi－1维单纯形.

如果≥′和≥都是定义在Z上的偏好关系,≥≥′且＞＞′, 那么称≥′是≥的完备化. 说一个扩展式博弈Γ′:={N∪{c},H,P,fc,(Ii)i∈N,(≥′i)i∈N}是另一个扩展式博弈Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}的完备化，如果对于每个参与人i, ≥′i都是≥i的完备化. 那么, 对于任意αi>>0, 函数αiui代表了由ui所代表的偏好关系的完备化. 因此, 对于任意α∈Δ+, 博弈Γα是原博弈Γ的线性完备化.

仿照Kreps和Wilson的证明方法, 考虑博弈Γα的人标准表示(ANFR)［6］. 但在此之前, 给出一些术语. 用Ii标记参与人i应该行动的那些信息集的集合, 用 s 标记任意信息集, 用 i.s 标记应该在信息集s∈Ii行动的那个人. 而且, 用Ds标记信息集s可以采取的行动; 更具体的说, 如果知道在信息集s采取行动的应该是参与人i, 那么称他可以采取的行动集为Di.s. 那么，博弈Γα的ANFR可以表示为

Γaα:={I∪{c},(Di.s)i.s∈I,(ui)i∈N},

其中, I表示所有人的集合.

3 纳什均衡和颤抖手完美均衡

给定博弈Γα, 定义人 i.s 的最优反应映射BRui,使得

BRui(σ－i.s):=arg max di.s∈Di.sui(di.s,σ－i.s),

其中,-i.s表示除i.s之外的其他人. 那么, 对于任意y(σ－i.s)∈BRui.s(σ－i.s), 给定其他人的行为策略σ－i.s, 不存在y′(σ－i.s)使得(σ－i.s,y′(σ－i.s))＞i(σ－i.s,y(σ－i.s)).

对于博弈Γa的完备化Γaα, 也可以定义参与人i.s的最优反应映射BRαiui使得

BRαiui(σ－i.s):=arg max di.s∈Di.sαiui(di.s,σ－i.s).

定理1 对于所有人i.s, 以及所有αi∈Δmi+,有

BRαiui(σ－i.s)BRui(σ－i.s).

证明用反证法. 假设定理1不成立, 那么必存在σ－i.s和di.s使得 di.s∈BRαiuiσ－i.s但di.s∈BRuiσ－i.s成立. 这样必存在d′i,s使得di,s. 因为αi∈Δmi+, 那么αid′i,s＞αidi,s, 这与di.s∈BRαiuiσ－i.s相矛盾.

定理2 对于所有人i.s和所有σ－i.s，BRuiσ－i.s是上半连续的.

证明因为博弈是有限的, BRuiσ－i.s总是紧值的. 根据最大值定理［7］, 有, 对于所有人i.s, 所有αi∈Δmi+, 以及所有是上半连续的. 那么, 对于任意序列(σk－i.s)σ－i.s和yk∈BRuiσk－i.s, 存在yk的一个子序列收敛于BRuiσ－i.s中的一点. 但是, 根据定理1, 有BRαiuiσ－i.sBRuiσ－i.s. 那么BRuiσ－i.s也是上半连续的.

一个随机策略组合σ:=(σ1,σ2,…,σI)是博弈Γaα的纳什均衡, 如果不存在一个人i.s有策略σ′i,s∈Δ(Di,s)使得(σ′i,s,σ-i,s)＞(σi,s,σ-i,s). 将一个扩展式博弈的所有纳什均衡集合标记为NEΓ.

一个随机策略组合σ:=(σ1,σ2,…,σI)是博弈Γaα的一个颤抖手完美均衡, 如果存在一个序列σk∞k=0使得

σk∈×i.s∈IΔ+Di.s,k∈1,2,3,…，

lim k∞σki.sdi.s=σi.sdi.s,i.s∈I,di.s∈Di.s,

σi.s∈arg max uiσk－i.s,τi.s,i.s∈N，

但是, 如果允许不完备偏好, 一个颤抖手完美均衡可能不是纳什均衡, 这与完备偏好情形时是不同的. Bade ［4］给出了一个简单的反例，并且建议应该把目光集中在那些也是纳什均衡的颤抖手完美均衡上, 这就产生了一个新概念，即颤抖手完美纳什均衡(trembling hand perfect Nash equilibrium, THPNE). 幸运的是, 在一个有限扩展式博弈的人战略式中, 总是可以找到一个THPNE, 这一点由Bade［4］的推论1所保证.

定理3 (Bade)任意有限博弈Γaα都有一个颤抖手完美纳什均衡.

4 序贯均衡

现在进入到本文的核心部分, 原博弈Γ的序贯均衡的存在性. 先考虑这样一个评估σ,μ［8］, 其中σ为行为策略组合, μ为一个这样的信念函数：为每个信息集的历史指定一个概率测度.

定义, 结果Oσ,μs为给定信息集s已达到由行为策略σ决定的终结历史的概率分布. 一个评估σ,μ是序贯理性的, 如果对于每个参与人i∈N和每个信息集s∈Ii不存在一个σ′i,s使得

O((σ′i,s,σ-i,s),μ)＞iO((σi,s,σ-i,s),μ).

注意到对序贯理性的定义不同于经典定义, 这是因为在结果空间引入了不完备偏好.

说一个评估σ,μ是一个扩展式博弈Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I的序贯均衡, 如果σ,μ是序贯理性的且具有一致性. 一致性的定义是标准的［5］.

定理4 假设Γα:{N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈I}为一个完美记忆扩展式博弈, 且σ为Γα的人标准式表示的一个颤抖手完美纳什均衡. 那么必存在一个信念向量μ使得σ,μ为Γα的一个序贯均衡.

证明对于博弈Γα中的任意参与人i,用s表示Ii中任意信息集. 那么s中的历史集合被表示为Hs. 以Xs表示不被Hs中所有节点所达到的终结历史集合；以σ∞k=1表示在×r∈IΔ+Dr中的行为策略组合序列. 对于Γα的人标准式表示而言，它们既是颤抖手完美均衡又是纳什均衡. 对于任意k和Hs中的任意h, 令

μksh=Phσk∑g∈HsPgσk,

其中, Phσk代表如果该博弈按照σk进行给定信息集s达到而历史h达到的条件概率. 注意到对于任意h∈Hs有Phσk>0, 那么∑g∈HsPgσk＞0. 令

μsh=lim h

那么μ为一个与σ一致的信念向量.

令vs(・)表示ANFR中人i.s的效用函数. 当这个人使用随机策略ρi.s∈ΔDs, 而其他人使用σk规定的策略 (可能包括了该参与人的其他人). 给定历史h达到, 人i.s使用随机策略ρi.s, 其他人使用σk－i.s, 令Uiσ－i.s,ρsh代表此时参与人i的期望多效用函数. 那么,

vsσk－i.s,ρs=∑h∈HsPhσk－i.s,ρsUiσk－i.s,ρsh

+∑x∈XsPxσk－i.s,ρsuix

=∑h∈HsPhσkUiσk－i.s,ρsh

+∑x∈XsPxσkuix

=∑g∈HsPgσk∑h∈HsμkshUiσk－i.s,ρsh

+∑x∈XsPxσkuix.

因为σ为一个颤抖手完美均衡, 有σi.s∈arg max ρi.s∈Δsvsσki.s,ρi.s, 这意味着

σi.s∈arg max ρi.s∈Δs∑h∈HsμkshUiσk－i.s,ρi.sh.

那么, 根据最优反应映射的上半连续性,有

σi.s∈arg max ρi.s∈Δs∑h∈HsμshUiσ－i.s,ρi.sh.

这就是序贯均衡的序贯理性条件, 因此σ,μ为博弈Γα的一个序贯均衡.

证毕

根据定理3和定理4, 下面的定理成立.

定理5 所有完美回忆的有限扩展式博弈都有一个序贯均衡.

5 结论

Bade［4］为不完备偏好的标准式博弈定义了纳什均衡的概念，本文是其在扩展式博弈中的扩展。采用 Kreps和Wilson［5］的思路, 先给出了一个修正的颤抖手完美均衡的概念, 然后应用它去证明不完备偏好扩展式博弈的序贯均衡的存在性. 如何将其应用到博弈论其他领域（例如产业组织理论）中去，将是进一步研究的方向.参考文献

［1］时奇, 谌贻庆, 陈剑. 不完备偏好理论及其应用综述［J］. 经济评论, 2010, (3):116-123.

［2］ E OK. Utility Representation of an incomplete preference relation［J］. Journal of Economic Theory, 2002, 104(2):429-449.

［3］ J DUBRA,F MACCHERONI, E Ok. Expected utility theory without the completeness axiom［J］. Journal of Economic Theory, 2004, 115(1): 118-133.

［4］ S BADE. Nash equilibrium in games with incomplete preferences［J］. Economic Theory, 2005, 26(2):309-332.

［5］ D KREPS, R WILSON. Sequential equilbria［J］. Econometrica, 1982, 50(4): 863-894.

［6］ R SELTON. Reexamination of the perfectness concept for equilibrium points in extensive games［J］. International Journal of Game Theory, 1975,4(1):25-55.

博弈论的概念范文第10篇

关键词：新闻传播学　博弈论　方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究。不能缺少博弈论的思想。

上个世纪90年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008年10月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归人人际传播理论。说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性

德国著名数学家哥德尔1931年提出不完备性定理：第一不完备性定理――任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理――任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方。找到双方的契合点，从新的角度描述新闻传播现象与活动的规律。调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何。有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与

活动过程中，有没有相类似的情况?其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定?其二，均衡概念在新闻传播过程中能否实现?其三，新闻传播活动的行为主体是不是理性的?情况允许的话，自己的利益最大化是否是追求的目标?其四，竞争与合作的契约关系，在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态。即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用。但归根结底的因素是生产力与生产关系的矛盾对立统一。博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此。博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播应用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯・麦奎尔、瑞典人斯文・温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说。研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响。人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论。并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”。进行专门的新闻传播学新领域探索。

博弈论的概念范文第11篇

关键词：新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80 年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90 年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004 年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008 年10 月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。[论文网 Www.LunWenData.Com]

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。

从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播应用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35 个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说，研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

由于受经济学的影响，人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论，并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”，进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年，但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意，原因是新闻传播理论界对博弈论尚不太熟悉，对博弈论的理解也参差不齐，甚至还存在部分抵触心理，致使研究成果的质与量不甚理想。新闻传播研究需要理论创新，对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论，对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上，在新闻传播研究领域都有用武之地，关键在于我们的观念。

参考文献：

1.肯尼斯·赫文［美］、托德·多纳著：《社会科学研究的思维要素》，重庆大学出版社，2008年版。

2.施锡铨著：《博弈论》，上海财经大学出版社，2000 年版。

博弈论的概念范文第12篇

如果一个人可以不止一次获得诺贝尔经济学奖，那么泽尔腾一个人也许早就可以收获两个甚至三个诺贝尔奖了。

莱茵哈德・泽尔腾（Reinhard Selten）生于1930年，父亲是犹太人，母亲是一位新教徒。1942年，泽尔腾的父亲去世；1944年，泽尔腾被迫中断学业。在苏联军队到来之前，他与他的母亲和兄弟姐妹逃到了奥地利。

生命早期的经历对泽尔腾意义重大。由于从小就作为“少数派”的一员而备受鄙视，迫使他很早就学会了密切关注政治事务。尤其重要的是，他发现自己无法同意绝大多数人表达出来的政治观点，因此必须学会相信自己的判断，而从不相信官方宣传或所谓的公共舆论。这对泽尔腾的智识发展影响深远，而且对政治和公共事务的兴趣，也使他在高中时就开始对经济学产生了兴趣。

与约翰・纳什一样，泽尔腾也首先是数学家。他于1951年进入法兰克福大学数学系，1957年和1961年分别获得数学硕士和博士学位。在此期间，泽尔腾修读过包括心理学在内的很多课程，还辅修了数理经济学，这些对他的学术生涯起到了非常重要的作用。

泽尔腾的硕士论文和博士论文的目的都是对合作博弈的值进行公理化，但是后来他对博弈论做出的最主要的贡献却是在非合作博弈领域。这很难得。因为当时合作博弈才是潮流。另外一个难得之处是，那个时代通行的博弈表达形式是策略型博弈，而泽尔腾在研究时所利用的却是当时几乎没有其他人考虑的扩展型博弈。由于对扩展型博弈非常熟悉，泽尔腾比其他学者更早关注到了博弈的精炼问题，最终导致他提出了“子博弈精炼”“颤抖手均衡”等对博弈论至关重要的概念。

获得硕士学位后，泽尔腾担任了最早在德国倡导凯恩斯主义的经济学家海因茨・萨尔曼教授的助手。泽尔腾本来的任务是研究决策理论在厂商理论中的应用，但是他却迷上了经济学实验，决心利用实验的方法来研究寡头垄断行为。对经济学发展趋势有很好的直觉的萨尔曼支持他这个想法。在当时，作为一门学科的实验经济学还没有出现。1959年，泽尔腾与萨尔曼合作发表了《一个寡头实验》一文。

也正是从这段时间开始，泽尔腾受赫伯特・西蒙提出的有限理性概念的启发，提出了“渴望水平假说”，他的目标是构造一个有限理性的多目标决策理论。对有限理性理论的研究占了泽尔腾很多时间，他相信这将引发经济学的一场革命。经济学家普遍把人视为完全理性的，但这显然不符合事实。泽尔腾坚信，经济学必须认真研究人的真实经济行为，而且由于经济行为的复杂性，必须通过很多“痛苦的实验”才能了解经济行为的真正结构。

1972年，泽尔腾来到比勒菲尔德大学，直到1984年才转入波恩大学。在这12年里，泽尔腾在博弈论和实验经济学这两个领域都取得了丰硕成果，例如1975年发表的论文《扩展式博弈精炼均衡概念的重新考察》，它提出了著名的“颤抖手均衡”概念。比勒菲尔德大学鼓励跨学科交叉研究，这令泽尔腾非常欣喜。他与生物学家讨论演化稳定均衡概念，与政治学家研究国际冲突的博弈论模型，等等。加盟波恩大学后，他还曾经于1987年10月至1988年9月回到比勒菲尔德大学主持了“行为科学中的博弈论”学术年活动，与来自经济学、生物学、数学、政治学、心理学和哲学等领域的专家一起讨论，并于1991年出版了四卷本的《博弈均衡模型》。

当然，令泽尔腾念念不忘的始终是有限理性理论。他组建了波恩大学实验经济学实验室（简称“Bonn EconLab”），这是欧洲最早的实验经济学实验室，也是全球实验经济学研究的重镇。泽尔腾的目的是，在实验的基础上，建立一个充分考虑人们行为有限理性的决策理论和博弈理论。

实验经济学界素有“史密斯派”和“波恩派”一说。前者的旗帜是2002年诺贝尔经济学奖得主弗农・史密斯，后者的领袖当然是泽尔腾了。史密斯曾说，泽尔腾因对实验经济学的贡献，而应再获得一次诺贝尔经济学奖。2012年诺贝尔经济学奖得主阿尔文・罗斯也说，泽尔腾不但是博弈论和实验经济学的先驱，而且一直是这两个领域的领军人物。

是的，非合作博弈论和实验经济学说是20世纪下半叶以来经济学最显著的发展，现在都已经蔚为主流。但泽尔腾在当初介入这两个领域时，在一定意义上却是一种反潮流的举动。近年来，随着行为经济学的壮大，反潮流的有限理性理论也有渐成主流之势。泽尔腾，这个从小饱受磨难但一直坚持独立思考的学者，无疑是学术弄潮者的最佳典范。

博弈论的概念范文第13篇

1960年，托马斯·谢林在《冲突的战略》一书中开创性地运用博弈框架分析经济学以外的社会科学问题[1]，而后拓展研究纷至沓来，涉及政治、军事、国际关系与外交等多个学科。随着博弈论研究在社会科学多个领域的不断深入与成功应用，大学教育对博弈论知识的需求日益高涨[2]。

然而以往的博弈论教学相对孤立地处在经济学科，没有广泛展开。经济学以外的社会科学教科书通常只是简单提及“囚徒困境”或“零和博弈”，缺少系统的分析和融入课程内容的具体应用。事实上，怎样把博弈论融入社会科学各个学科的教学中已经成为大学教育必须面对和解决的问题。要回答这一问题，可以按照两步展开：首先，博弈论给大学社会科学教学带来什么？能实现什么教学目标？其次，博弈论课堂教学宜采用哪种教学方法？怎样实施？

“两力并举”——增进感知批判力，提升抽象思维力

博弈论是研究个体间相互决策与行为结果的理论，它从经济学的角度提炼个体最优决策问题，利用数学模型进行描述、研究和分析，是当代经济学与数学最重要的学科交叉分支。

博弈论对人类行为的研究以抽象分析和决策应用见长，弥补了传统社会科学研究的不足。麦斯奇塔在新近专著中提出一个强调抽象分析和决策应用的博弈模型，声称在数千项实际预测中，该模型以高达90%的精确率预言了涵盖从地缘政治到个人事务等多个领域的各种社会科学问题[3]。具有如此特质的博弈模型既能帮助大学生理解广泛而具体的社会事件，又能佐以理论知识进行一般化的抽象分析。从建构主义观点看，现实社会的人类行为在博弈论中以简化抽象的形式得以反映，这特别适合与社会科学各学科的教学相结合，在增进学生对现实事件的感知与批判的同时训练其抽象思维能力。

促使学生掌握并运用抽象概念是教学中最困难的环节。博弈框架抛弃直接引入概念的一般形式，采用借助实际问题引入、加以抽象分析，并鼓励学生运用所学概念和分析技术考察其他问题。从现实问题的分析中概括和总结出具有一般意义的经验并以抽象命题的形式予以升华，进而应用于其他问题，能够训练学生“看问题”的抽象思维。另一方面，经验感知带来高效的学习过程。即便是擅长高度抽象思维的数学家也承认，尽管他们使用抽象的一般性的定理描述研究结果，但在发现定理之初他们通过解决具体问题获得灵感和思路[4]。因此，当学生能够深刻地看待现实问题时，便获得从具体问题中触发灵感的能力。

社会科学具有三个关键理念：一是现实事件受许多参与者的互动影响，而不由一个参与者决定；二是每个参与者都面临由相互影响和不确定性造成的激励或威胁；三是沟通与监督对现实事件产生重要影响。博弈论通识教育能使学生认知这三个关键问题，理解和应用不同理论范式。因此，采用博弈框架、嵌入各种社会科学现实问题的通识教育既对训练学生感知现实的抽象思维能力裨益良多，又有助于大学社会科学教育实现“培养兼具现代科学素质与人文素养的社会科学人才”的较高目标。

“两法相较”取其优——案例教学法

案例教学是一种以教师讲授和分析案例为主的教学方法。在案例分析时，教师引导学生进行讨论，逐渐理清案例中的知识要点，从而激发学生的思考达到教学目的。案例教学重视分析、思辨和推理过程，突出基本知识在案例中的具体应用，所以尽管教学的主体是学生，但案例教学的主导者和实施者往往是教师。另外，虽然案例教学需要重现现实生活中的一些事件，但重现方式既可以是具体的、生动的又可以是虚拟的、想象的，所以案例教学不仅适用于经济学、法学、管理学等社会科学的课堂教学[5-6]；也适用于计算机科学、物理学等理工科的课堂教学[7-8]。

案例教学不排斥基于知识应用或任务实施的实际操作环节，而且重视蕴含基本知识的分析、推理和思辨过程。博弈论作为一种研究人或其他生命体的相互决策与行为结果的理论，尽管在政治、经济、管理、军事、外交、生物、心理等学科领域中应用广泛，但仍以较为抽象的形式予以展现，借助数学范式作为主要分析工具[9-10]。所以，虽然模拟教学能够加深学生对某些现实情境的隐性感受，但为了训练感知现实的抽象思维能力，博弈论通识教育的课堂教学应以案例教学法为主。

“双管齐下”——慎选案例，全面分析

博弈论富有典型案例，讲解有趣的囚徒困境不难，难的是让学生明白囚徒困境寓意深刻，其博弈逻辑具有简化凝练的指导意义，适用于许多现实问题。囚徒困境要与军事大国的核武竞赛联系起来，帮助学生认识到1914年奥匈帝国对塞尔维亚的宣战直接引发欧洲各国的军事对抗并导致第一次世界大战的爆发；还要使学生明白国际贸易中的保护主义倾向和WTO的重要作用；更要洞察地方保护主义、“形象工程”和重复建设问题的症结所在。

运用案例教学法训练学生感知现实的抽象思维能力，从而帮助学生认知前文提及的社会科学三个关键理念，博弈论通识教育的课堂教学：应当突出案例选择的典型性——准确契合教学内容、联系现实事件，有效服务教学目的、凝练抽象概念；体现案例分析的完整性——包含提炼问题、分析问题、解决问题和拓展应用等环节，蕴含从具体到抽象和从抽象到具体的双向思维过程。

此外，还应当“四步行”：先从现实事件中提炼典型博弈案例进行讲解和分析，再把基本概念和分析技巧反复应用于不同社会科学领域的多种现实问题，然后区分各个典型案例强调的基本概念和分析技巧的异同，最后训练学生依照恰当的博弈逻辑分析具体问题并逐步体悟各个典型案例蕴含的抽象意境、现实含义和应用技巧。

1.囚徒困境：充满变数的共赢

阐释囚徒困境重在揭示积极合作能够实现共赢，但有变数。一旦学生循着案例认真思考，就能发现是否可以信任对方是问题的关键。当对方可以信赖时，自己就选择合作，获得互惠互利的成果。否则，自己就“被迫”自卫式地选择欺骗策略。这样，变数存在于双方对对方行动的预期中。

这种想法在类似军备竞赛的困境中体现得淋漓尽致。表面上，军事扩张能增强自身实力保证国防安全，然而就像欺骗策略一样，肆意军事扩张将导致自己处于更糟糕而不是更好的境地中——因为国防安全与否取决于各国的军备互动而不是自身的绝对实力。一国军事扩张会令他国自认为面临被欺骗的危险而折断合作的橄榄枝。各国纷纷增加军费进行自卫式的军事扩张，最后却换来更不安全的国防环境。学生可以从两次世界大战、美苏太空争霸、核武竞赛、东北亚局势等重大事件中捕捉到这种想法并据此训练抽象思维能力。

另一方面，经济学巨擘亚当·斯密认为个体追求个人利益能增进集体福利。囚徒困境从个体使用欺骗策略追求个人利益会损害集体福利的角度说明，经济和社会发展有可能面临亚当·斯密没有预见的困境[11]。一些地方政府热衷“形象工程”、重复建设，却漠视环境污染、食品安全等问题。鼓励学生从理性的角度辨析现实问题背后的逻辑困境，远比仅从感性的角度进行道德批判要真实可靠得多。

囚徒困境与前述三个关键理念密切相关：首先，参与者的行为相互影响，博弈结果取决于参与者的“信任”；其次，如果参与者希望合作，那么他就面临被欺骗的危险和假意合作却通过欺骗获得更多回报的不当激励；最后，参与者之间的信任程度，以及沟通和监督条件，对能否实现合作共赢至关重要。这样，不仅国际原子能机构、日内瓦裁军谈判会议、联合国和平利用外层空间委员会、世界贸易组织和欧佩克等常见的国际机构和组织跃然纸上，而且建立健全地方政府信息公开制度和加强公众对环境保护的监督权利等解决现实问题的有效手段也脱颖而出。

2.共赢：协调博弈与合作博弈的结晶

共赢是社会发展、文明进步的本质体现，是博弈理论关注的重要问题。在抽象提炼现实事件中不同共赢方式的特质后，博弈理论强调协调（coordination）和合作（cooperation）两个概念。两者既不同一也不排斥，学习它们有助于训练学生感知现实的抽象思维能力。

协调博弈强调参与各方采用的策略既符合自身利益又存在某种一致性，各方没有改变自己策略的激励，也不希望对方改变，从而处在一种稳定、共赢的状态。合作博弈则意味着参与者组成团队，在博弈过程中通过合作获取某种合作剩余，使团队的整体收益增加。合作博弈面临的重要问题是如何在增进整体利益的同时分配合作剩余，使每个成员都能比不合作获得更多回报。与协调博弈不同，合作博弈的参与者可能改变自己的策略（或欺骗团队）获得额外收益，所以合作博弈需要一定的执行条件才能保持稳定，实现共赢。

许多重要的国际组织都体现了合作博弈，能够有效增进学生的现实感知。欧盟是世界上最有力的国际组织，在贸易、农业、金融等方面趋近于一个统一的联邦国家，而在内政、国防、外交等方面则类似一个由许多独立国家组成的同盟。所以欧盟成员国在获得贸易、农业、金融等方面的合作剩余的同时，也以独立国家的身份各自争取更多的回报。

大多数时候国际组织还执行着合作博弈必须的强制条件。欧佩克作为占全球石油产量40%和出口量一半的石油输出国组织，通过协调和统一各成员国的石油政策，配给原油生产额，确保国际石油市场的价格稳定，保证各成员国获得稳定较高的石油收入，同时也为石油消费国提供短期、中期乃至长期稳定的石油供给。为了约束成员国私自增加原油产量的行为，欧佩克需要定期召开成员国大会，相互监督，制定具有强制执行力的协议。另外，由于欧佩克能够稳定国际石油市场，使石油生产国和消费国的利益得到兼顾，因而得到较高的国际认可，这也强化了欧佩克协议的执行力度。

交通博弈是协调博弈的经典案例。假定没有交通规则，那么相向而行的两辆机动车都有靠左行驶和靠右行驶两个选择。他们有3个纳什均衡：（靠左，靠左）、（靠右，靠右）以及一个靠左和靠右各占50%概率的混合策略均衡。只要给定对方的选择，两车就没有偏离均衡的激励；如果不给定对方的选择，两车也能通过协调来实现某一均衡。交通博弈与囚徒困境刚好相反，一方车辆选择策略A或B，仅仅需要确信对方也会相应地选择A或B，就能实现共赢。协调博弈不像合作博弈那样需要一个有约束力的契约，而是更需要在彼此之间确立一种相互信任的信心。协调博弈的核心是，只要坚持自己的信心，就一定能得到对方的“正回馈”：对方会协调到共赢状态上来。

协调与合作背后都蕴含着公平性观点：当别人对你友善时你也对别人友善（投桃报李），当别人对你不善时你也对别人不善（以牙还牙）。心理学实验表明人的行为普遍符合“互惠互损”准则，即当面临的潜在收益或损失不太大时，公平性规则在社会行为中发挥着重要作用。借助典型博弈案例将直观的心理学准则和抽象的博弈概念结合起来，对帮助学生感知现实、推理思辨具有重要作用。

博弈论包含的典型案例和知识内容远远超出了囚徒困境和协调合作。即便上文只对它们进行了简单介绍，也已表明在社会科学教学中开展具有通识意义的博弈论教学对训练学生感知现实的抽象思维能力效果明显，而且可以帮助学生深入领会相关课程的基本概念、树立社会科学范畴的关键理念。

参考文献：

[1] 托马斯·谢林（著），郑志刚，王勇，赵华（译）. 冲突的战略[M]. 北京：华夏出版社，2011.

[2] Bruce Bueno de Mesquita， David Lalman. War and Reason： Domestic and International Imperatives [M]. New Haven， CT： Yale University Press， 1992.

[3] Bruce Bueno de Mesquita. The Predictioneer's Game： Using the Logic of Brazen Self-Interest to See and Shape the Future [M]. New York， NY： Random House Digital， Inc.， 2010.

[4] Gregory C. Chow. Dynamic Economics： Optimization by the Lagrange Method [M]. New York Oxford： Oxford University Press， 1997.

[5] 刘刚. 管理学科案例教学的准备与组织工作[J]. 中国高教研究，2010，05.

[6] 谈建俊. 论法学教育中的案例教学[J]. 江苏大学学报（高教研究版），2002，04.

[7] 詹自胜. 案例教学法在面向对象程序设计教学中的探索与实践[D]. 浙江师范大学，2006.

[8] 马慧. 案例教学在大学物理教学中的研究与实践[D]. 湖南大学，2009.

[9]李太龙. 博弈论公选课的教学内容与方法探析[J]. 教育探索，2012，01.

[10] James Morrow. Game Theory for Political Scientists[M]. Princeton， NJ： Princeton University Press， 1994.

博弈论的概念范文第14篇

关键词：房屋拆迁；演化博弈论；拆迁补偿

中图分类号：F746文献标识码： A

Abstract: In the research of housing demolition, we can see that a certain relationship between the demolished and the demolisher has been formed like the situation among the roles of the game theory.so this paper is going to introduce a evolution game theory which set up a binary asymmetrical model reflecting in hawk and dove evolutionary game. through the anasysis of its existence and how it evolutes,we use dynamic equations to do some quantitatives analysis. And then a new method of housing demolition compensation process can be fully copied to reflected the real benefit of both parties and the overall situation.

Keywords：the housing removal；evolution game model；removal compensation

1研究背景

1.1房屋拆迁的背景

城市房屋拆迁是随着城市的建设和发展而出现的，在本质上是对私有权利的一种消灭方式，前提条件是拆迁人对私有权利人应当给予相应补偿。在我国的国情中，现在拆迁问题越来越突出，拆迁带来的对房地产价格的影响，对被拆迁居民的补偿问题，是研究拆迁问题的研究人员关注的问题。

在补偿问题中，如果被拆迁的居民得不到合理的补偿，会将拆迁补偿的问题放大化，导致拆迁工作无法正常的运行，国家如果不对现有的补偿方式研究和改进，那么拆迁补偿会越来越棘手，所以研究拆迁补偿的新模式是非常有必要的。

1.2演化博弈论的研究背景

目前引入我国的研究方法很多，像博弈论、神经网络这样的利用生物进化学和神经学的研究方法，是较为突出的两种方法，本文利用博弈轮中的演化博弈的分支来进行科学研究。

在生物进化研究中，演化博弈论是最早提出来的，1973年生物学家梅纳德・史密斯运用数学知识，严格刻画了演化稳定策略（Evolutionarily Stable strategy，ESS）这一基础性的概念。1982年梅纳德・史密斯出版的《演化与博弈论》中，首次将生物进化论和博弈论综合的形成一种系统的分析过程的一门新学科。使得博弈论更加的具有实际的理论研究基础，不再停留在完全理想的情况下作分析，从而会加入不同角度的研究。

自20世纪90年代以来，博弈论研究的重点已转向了以有限理性为基础的演化博弈论。演化稳定策略把均衡看作是调整过程的产物而不是某种突然出现的结果，所以，它在一定程度上能使博弈过程动态化，但关注的焦点仍是均衡选择。

直到21世纪，我国才慢慢引进了演化博弈论的研究，针对于各个领域的范围，得到了广泛的应用。

2房屋拆迁的理论基础

2.1房屋拆迁

2.1.1房屋拆迁的概念、特点

城市房屋拆迁是指因国家建设、城市改造、整顿市容和环境保护等需要，经政府有关主管部门批准，由建设单位或个人，对现有建设用地上的房屋及其附着物进行拆迁，对房屋的所有人和承租人进行动迁、补偿等系列活动的总称。其特点如下：

（1）城市房屋拆迁应当依法拆除。其表明，整个的房屋拆迁活动都应该具有一定的法律依据，应当符合《城市拆迁管理条例》中的要求。

（2）城市房屋拆迁的立足点在于对房屋的权利人需要给予补偿，不得损害房屋权利人的合法权益。

2.1.2房屋拆迁补偿的概念、特点

（1）拆迁补偿的概念

按照《城市房屋拆迁管理条例》的规定，城市房屋拆迁是指导拆迁人依照有关法律和政策的规定，对城市规划区内的国有土地上的房屋进行拆迁，并对被拆迁人进行补偿、安置的活动。

（2）拆迁补偿的特点

1）拆迁补偿是一种民事法律关系。

2）拆迁补偿产生的原因是合法行为给他人财产造成损害。

3）拆迁补偿的对象只能是被拆迁房屋及其附属物的所有权人，补偿是对受到损失的当事人给予的财产抵偿，因此只有受到损失的当事人才能得到补偿。

2.2房屋拆迁补偿的对象和方法

2.2.1房屋拆迁补偿的对象

拆迁补偿的对象针对的是人和物两种理解，在人的基础上，拆迁补偿的对象，应该是拆迁房屋的使用权人。从物的角度上讲，拆迁补偿的对象应该是合法的，具有法律认证的房屋，其他的非法建筑物，拆迁时不予补偿。

2.2.2房屋拆迁补偿的方法

建立完整的拆迁补偿制度是我国的针对拆迁问题中的首要任务，怎么才能更好地体现出房屋在我国的使用权的价值，是我们研究拆迁补偿制度的核心。当前政府采取的是以货币化补贴和房屋使用权的交换补偿为主，再加入其他补偿方式的主要办法。

所谓“货币补偿"，是指被拆迁人根据房地产评估确定的房屋拆迁补偿价格，要求拆迁人支付货币，自行到房地产市场购买居住房屋。这就是建立了拆迁人与被拆迁人的一种货币化关系。另一种补偿的方法则是“房屋产权调换”，就是，由拆迁入向被拆迁人提供住房，被拆迁人根据自己的实际需要和现住房情况进行选择，最后结算新旧房屋的差价。

3拆迁补偿演化博弈模型

3.1引入演化博弈论的理论

3.3.1基本概念

演化博弈论具有博弈论的三要素，即博弈方、策略和得益。

（1）博弈方（Players）：在博弈运算当中，独立思考，独立承担结果的个人或组织。一般用表示博弈方的集合。

（2）策略（Strategies）：供博弈方在进行博弈运算或者决策时，选择的方法。一般用有限纯策略集合。

（3）得益（Payoffs）：在博弈方选择的方案当中，都会得到相对应的结果，其结果表示一个方案的得失。一般博弈方的得益用表示，各博弈方策略的多元函数。

3.3.2演化稳定策略下的复制动态方程

假设博弈方总体中的所有个体的原有策略为，变异者采用的变异策略为，将选择策略的个体占总体比例表示为，变异者占总体的比例表示为，其中。当选择策略时，会得出：

（3-1）

则策略是方案的演化策略。如果不是最优策略，那么会有一个策略能够得到更高的收益，根据的连续性可得到：

（3-2）

根据式3-2的连续性可知，当决策者开始博弈时并没有选择方案，而是随着时间的推移，转而去选择另一种策略类型博弈方，最终达到了最后的收益，此时可以看出，这两种决策的类型可以写成含有时间参数的函数式，即、。

博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关键是动态变化的速度，方向可由速度的正负号反映。博弈方的学习模仿速度，关键在于模仿对象的数量大小和模仿对象的成功程度。

才用以决策类型为的博弈方为例，可以用动态微分方程表示其变化速度，则动态方程如下：

（3-2）

―才用策略的博弈方占总体的比例；―才用策略的期望得益；―平均得益；

―选择策略的博弈方占总体比例随时间的变化率。

令，根据微分方程的“稳定性定理”求解博弈进化稳定策略。

本文以拆迁人和被拆迁人互相的经济关系的变化，通过博弈演化的方式，对变化的趋势进行初步预测。

3.2拆迁补偿演化博弈模型

3.2.1非对称二元鹰鸽演化博弈模型建立

针对某市房屋拆迁补偿做以下定义，以方便建模时使用。定义：J―被拆迁房屋市场价格；F―搬迁奖励费；H―被拆迁人得到的补偿金额；Z―拆迁人获得的土地市场价值；K1、K2―被拆迁人所花费的斗争成本（K1＞K2）；C1、C2―拆迁人所花费的斗争成本（C1＞C2）。本模型的基本要素如下：

（1）博弈方：拆迁过程中的对象，即：博弈方1为被拆迁人，博弈方2为拆迁人。

（2）策略集合：博弈两方的策略集合为。

（3）得意情况：根据被拆迁人和拆迁人的策略集合的4种结果，推导出来的各种博弈方的得益情况，见表3.1。

表3.1 被拆迁人与拆迁人二元鹰鸽博弈收益矩阵

根据此矩阵的结果，可以列出博弈方的不等式如下：

u1（斗争，妥协）u1（妥协，妥协）u1（妥协，斗争）u1（斗争，斗争）（3-3）

u2（妥协，斗争）u2（妥协，妥协）u2（斗争，妥协）u2（斗争，斗争）（3-4）

代入定义推倒得到：

H-G2F0-K1（3-5）

0FH+C2C1（3-6）

如果被拆迁人采取斗争策略的概率为P1，采取妥协策略的概率为（1-P1）；拆迁人采取斗争的概率P2，采取妥协策略的概率为（1-P2）。得益较差的一方会随着时间的推移，发现改变现在的博弈策略是对自己有利的，所以上述概率函数会随时间的变化发生变化，所以可以引入时间参数t，上述概率可以写为和，下面为了方便论述，仍写成P和1-P。

根据概率中的推导出被拆迁人采取的纯斗争策略的平均收益U1e，被拆迁人采取纯妥协策略平均收益U1d，拆迁人采取的纯斗争策略的平均收益U2e，拆迁人采取纯妥协策略平均收益U2d。下面列出博弈双方的总平均收入公式：

（3-3）

（3-4）

―被拆迁人总平均收益；―拆迁人总平均收益；

两个博弈方的动态变化速度可以用下列动态微分方程表示：

3-5式所示被拆迁人采取“斗争”策略类型；3-6所示拆迁人采取“斗争”策略类型。

（3-5）

（3-6）

式3-5、3-6表示为系统称为被拆迁人和拆迁人的动态复制系统。在此系统中，讨论博弈演化策略时，令、，解出本系统五个平衡点，分别为。

3.2.1演化稳定策略分析

（1）建立雅可比矩阵

动态复制系统的平衡点对应的策略组合为演化博弈的一个均衡，及演化均衡。根据微分方程稳定定理，我们可建立雅可比矩阵，进行局部稳定分析得出结果。

令矩阵J为动态复制系统的雅可比矩阵，那么如下所示：

解得：

矩阵J的行列式为：

（3-7）

矩阵J的迹为：

（3-8）

（2）局部稳定结果分析

经过计算矩阵J得出结果，如表3.2所示：

表3.2局部稳定分析结果

由表3.2可知，当矩阵的行列式符号为正，迹为负时，即存在两个稳定平衡点E2（1,0）、E3（0,1）两个，其分别对应的是{斗争、妥协}、{妥协、斗争}。另外，E1、E4为不稳定的平衡点，E5为鞍点。

3.2.2分析结果

如图3.1所示，点E1、E4和E5连成的折线为收敛于两种状态的临界线，分别收敛于两点E2、E3。其收敛于E2稳定平衡点的现实意义为：被拆迁人采取斗争的策略，迫使拆迁人采取妥协的策略，表明拆迁人为了加快资金周转，尽快投入建设在谈判中做出让步；其收敛于E3稳定平衡点的现实意义为：由于现阶段拆迁人和被拆迁人的地位不平等，当拆迁人采取斗争策略的时候，被拆迁人随着时间的变化，意识到选择斗争的策略的收益小于选择妥协的策略，便选择妥协策略，获得更多的收益，趋于平衡。在现实的生活中，这种方法被更多的被拆迁人所采用，即在整个演化博弈中，等更多的趋向于E3点，选择斗争的策略的被拆迁人随着时间的变化，选取的策略会被淘汰。

图3.1博弈方的动态变化过程

4案例分析

4.1背景资料

某市某拆迁户45平方米的住宅房屋为例，住宅坐落于二类土地上，区位基准价格1400元/平方米，综合环境修正系数为13.80%，房屋为砖混二级丙等，其重置价格为300元/平方米，根据标准计算:

房屋区位价格=1400×（l+13.80%）=1593.2元/平方米

房屋评估价格=1593.2×45+300×0.85×45=8.32万元

在El（0,0）情况下，拆迁人采取“妥协”策略，在房屋评估价格基础上，给被拆迁人多支付0.5万元的搬迁奖励费，得益为Z-8.82万元;被拆迁人亦采取“妥协”策略，接受补偿金额早日搬迁，同时获得收益为8.82万元。双方博弈结果为（8.82，Z-8.82）。

在E2（1,0）情况下，被拆迁人认为补偿太低，采取“斗争”策略，迫使拆迁人提高补偿标准，最终与拆迁人达成协议每平方米增加800元；

最终获得的补偿金额=（1593.2+800+300×0.85）×45=11.92万元，斗争成本为补偿金额的3%，即0.36万元；拆迁人付出补偿价格的同时还付出了应付被拆迁人“斗争”的行政成本，占补偿金额的2%，则拆迁人得到的收益为Z-（1+2%）×11.92=Z-12.16万元。双方博弈结果为（11.56，Z-12.16）。

在E3（0,l）情况下，被拆迁人采取“妥协”策略，仅获得拆迁房屋的评估价格8.32万元；拆迁人采取“斗争”策略，仅对被拆迁房屋补偿，不提供搬迁奖励费，拆迁人得益为Z-8.32万元。双方博弈结果为(8.32，Z-8.32)。

在E4（1,1）情况下，博弈双方采取{斗争，斗争}策略，博弈结果是被拆迁人获得拆迁房屋的评估价格8.32万元，所花费的斗争成本为获得补偿金额的6%，即0.49万元;拆迁人付出的斗争成本和信誉损失占补偿金额的50%，则获得的收益为Z-12.48万元。双方最终得益为（7.82，Z-12.48）。

表4.1得益矩阵表

J=8.32，K1=0.49，K2=0.36，C1=4.16，C2=0.96，H=2.88，F=0.5

将以上数据代入方程4.14、4.15计算：

E1（0,0）

J的行列式：（H-K2-F）F=（2.88-0.36-0.5）×0.5=1.01（+）

J的迹:H-K2=2.88-0.36=2.52（+）

经计算，雅可比矩阵行列式和迹的符号同为正，故点El（0,0）为不稳定均衡点。

②E2（l,0）

J的行列式：

（-H+K2+F）（-C1+H+C2）=（-2.88+0.36+0.5）（-4.16+2.88+0.96）=0.65（+）

J的迹：K2+F-C1+C2=0.36+0.5-4.16+0.96=-2.34（-）

经计算，雅可比矩阵行列式和迹的符号相反，故点E2（1,0）为演化均衡策略。

③E3（0,l）

J的行列式：K1F=0.49×0.5=0.25（+）

J的迹：-Kl-F=-0.49-0.5=-0.99 （-）

经计算，雅可比矩阵行列式和迹的符号相反，故点E3(0，l)为演化均衡策略。

④E4（l,l）

J的行列式：Kl（Cl-H-C2）=0.49×（4.16-2.88-0.96）=0.16（+）

J的迹：Kl+C1-H-C2=0.49+4.16-2.88-0.96=0.81（+）

经计算，雅可比矩阵行列式和迹的符号同为正，故点E4（1,l）为不稳定均衡点。

⑤E5（0.85,0.84）

J的行列式： =0.08（+）

J的迹：0

经计算，雅可比矩阵行列式符号为正和迹的符号为0，点ESS（0.85，0.84）为鞍点。

表4.2稳定平衡分析

4.2演化博弈论的动态变化分析

由表4.2可以看出，本案例的动态变化结果表明，其收敛于E2、E3稳定平衡点，即：采取拆迁人斗争策略，被拆迁人采取妥协策略；或者采取拆迁人妥协策略，被拆迁人采取斗争策略。由表4.1可以看出，开始被拆迁人采取妥协后，得到了8.32万元的补偿金额，即E3点。随着时间的推移，个别的被拆迁人采取斗争策略后，迫使拆迁人妥协，最后得到了12.16万元的补偿金额，即E2点。

最终演化博收敛于E2平衡点，被拆迁人得到了更高的收益。

5小结

本文基于演化博弈论的理论方法，研究了在我国的拆迁背景下，被拆迁人与拆迁人之间的博弈关系。通过对房屋拆迁概念性研究，并建立了房屋拆迁的演化博弈模型，并通过实例分析很好的表明了其中的两种角色之间的最终博弈结果，符合实际情况。

参考文献：

[1] 谢识予.经济博弈论[M]. 上海市：复旦大学出版社,2002.

[2] 王文宾.演化博弈论研究的现状与展望[J]. 统计与决策,2009,(3):159.

[3] 刘怡.基于演化博弈论的西安市房屋拆迁补偿研究[D].西安:西安建筑科技大学,2010.

[4] 周洪军.探讨城市房屋拆迁补偿政策[J]. 中华民居,2011,(1):10.

博弈论的概念范文第15篇

他们还说，写作《妙趣横生博弈论》的目的就是为了要把读者“培养成策略艺术的更佳实践者。不过，对策略艺术的良好实践，首先要求对博弈论的基础概念和基本方法有初步的掌握”。

人生本来就是一场博弈，小到下象棋、养小孩，大到创事业、搞经营，再大到选总统、试军备，几乎无所不包博弈，决策的思想。与此同时，它不像一个伐木工人去砍树，面对的是没有想法和行动的树木，在多数对垒局势里，我们身边围绕着的是积极思考和同样工于心计的人，他们的选择与我们的选择彼此影响、相互作用，甚至互相牵制。正如作弊的考生要时刻面对来回走动、严肃监考的老师，做题跟猜谜一样的学生总要换位思考、寻思出题者的习惯，这些都是博弈。

对此，此书作者提到“当将军试图消灭敌军时，他必须料及并克服阻止其意图的反抗力量。如同将军一样，你必须意识到你的生意对手、潜在配偶，乃至你的子女都是富有谋略的。他们的目标与你的目标既可以相互冲突，也可以完全一致。你的决策必须求同存异并充分利用合作。”

所以，在这个意义上，我们多少需要懂点博弈论。要知道，它可不是什么小把戏，也不是厚黑学，

看完《妙趣横生博弈论》之后，应该对博弈论持有这样的看法：它应该是展开有效竞争与合作的理论，应该是大智慧，应该是个人理性融入社会的艺术。对于那些试图探求真实世界现象之因缘的人们来说，博弈论也是理解高度互动的人类社会的一种思想方法和分析工具。

此前，很多有关博弈论的文献都采取数学形式讨论，这使得博弈论在很长时间里都只是象牙塔里面的学科。迪克西特首先认识到，“让博弈论离开学术期刊真是太有趣太重要了”，因为博弈论的洞见在商业、政治、体育以及日常社会交往中有广泛的应用。于是他和合作者身体力行，将博弈论的重要洞见从原来数学形式的理论，转换成日常语言用直观的例子和案例分析取论化的命题。他们“想要改变大家观察世界的方式，通过引入博弈论的概念和逻辑以帮助大家策略性地思考”。

博弈论的概念范文

精品推荐

扩展阅读

推荐期刊

玻璃艺术

船舶经济贸易