进化博弈理论范文

时间：2023-08-27 15:25:59

进化博弈理论

进化博弈理论范文第1篇

武彬，男，汉族，河南民权人，硕士研究生，单位：西南财经大学金融学院，金融学专业。

摘要：博弈论是20世纪后50年新兴的研究领域，因其在商业、拍卖、军事、生物学和等方面的广泛应用，越来越被人们所关注。博弈论源于数学，不过从一开始，博弈论研究就不仅包含了数学方法，还融入了实验手段，如今，博弈论已经跨越多个学科，广泛应用与经济学、政治学、哲学、商业和国际关系学的分析之中，成为理解人类行为的有力工具。本文主要讨论博弈论中的一个重要分支-进化博弈论，进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础——理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

关键词：博弈论；应用；不足

一、本文的结构

本文首先给出进化博弈论两个重要概念即复制动态方程和进化稳定策略的说明，然后建立起一个一般两人非对称博弈模型，应用进化博弈理论推导出稳定状态，并在此基础上以中菲黄岩岛对峙事件为例做简单应用。

二、进化博弈论的两个重要概念的说明

复制动态方程：通常情况下，博弈方学习的速度取决于两个因素，一是模仿对象的数量大小（可用相应类型博弈方的比例表示），因为这关系到观察和模仿的难易程度，二是模仿对象的成功程度（可用模仿对象策略得益超过平均得益的幅度表示），因为这关系到判断差异的难易程度和对模仿激励的大小。由此以dxdt=x（u 1-u）表示x的变化快慢程度，这就是著名的复制动态方程。

进化稳定策略（ESS）：是指在博弈方动态策略调整中会达到，对少量偏离的扰动有稳健性，同时具有这两个性质的稳定状态就是“进化稳定策略”。即作为进化稳定策略的点，除了自身必须是稳定状态以外，还必须具有这样的性质，那就是如果某博弈方由于偶然的错误偏离的它们，复制动态仍然会使x回复到。

给出这两个概念之后，要找出进化稳定策略就可以通过一下两步实现：一，找出复制动态的稳定状态，二，在讨论稳定状态的邻域稳定性，也就是对于微小的偏离扰动具有稳健性的均衡状态。在数学上，这相当于当干扰使x出现低于x*时，dxdt必须大于0；当干扰使得x出现高于x*时，dxdt必须小于0.也就是说在这些稳定状态除，dxdt的导数必须小于0.

三、一般两人非对称博弈模型

下面，建立一个一般两人非对称博弈模型，并推到出复制动态和进化稳定策略。假设博弈方A、B分别来自不同的两个群体M，N，来自群体M的个体有两个可选策略，其中选择策略1的比例为x，选择策略2的比例为1-x，来自群体N的个体也有两个可选策略，其中选择策略3的比例是y，选择策略4的比例为1-y。我们以群体中选择相应策略的个体的比例来近似表示来自此群体中的个体选择相应策略的概率。博弈方A（策略1和策略2），博弈方B（策略3和策略4），对应的收益（a，b）、（c，d）、（e，f）、（h，i）u 3=bx+f（1-x）u 4=dx+i（1-x）u B=u 3y+u 4（1-y）。

两个博弈方A和B，分别有策略1、2和策略3、4，不同策略组合对应不同的收益组合。博弈方A选择策略1的概率是x，选择策略2的概率是1-x ，相对应，博弈方B选择策略3的概率是y，选择策略4的概率是1-y。

对于博弈方A和B，选择不同策略的收益和平均收益分别是：

u 1=ay+c（1-y）

u 2=ey+h（1-y）

u A=u 1x+u 2（1-x）

由此：博弈方A，B的复制动态分别为：

dxdtx（u 1-u A） dydt=y（u 3-u B）

找出博弈方A，B的所有的稳定状态：

对博弈方A：x=0；x=1；y=h-ca-e+h-c（1）

对博弈方B：y=0；y=1；x=i-fb-d+i-f（2）

当知道具体参数时，就可以判断哪些稳定状态时进化稳定策略。

四、中国和菲律宾的黄岩岛对峙事件的应用

下面，我们以中国和菲律宾的黄岩岛对峙事件为例，来具体说明这个非对称进化博弈论模型。在现代社会维系国家经济发展和社会生活的工业化产品和原料的大宗交易，海洋资源开发等都要通过海洋来完成。闭关锁国式的那种国内有限产品交流已经无法满足国民经济快速发展的需要，各国都想利用海洋发展，可南海只有1个。这就是以黄岩岛为代表的南海争端的根源。事件发生于4月10日，菲律宾海军企图在南海黄岩岛附近抓扣中国渔民被中国海监船制止，双方随后发生对峙，目前对峙超过一个多月。

黄岩岛自古就是中国固有领土，中国最早发现、命名黄岩岛，并将其列入中国版图，实施管辖。在此例中我们假设双方都有两个策略：强硬和妥协。如果菲方选择强硬，中国也选择强硬，则对双方都不利，对中国来说，这不符合和平发展战略的要求，虽然能够保住黄岩岛，但必然会导致中国的再次盛行，并且会助力美国重返亚洲，恶化了中国周边环境，这时中方得益为-5，对菲律宾这样一个海军没有导弹，空军没有战斗机的军事侏儒，虽然有美菲安保条约的保护使本土不受攻击，但与中国对抗必然遭受经济制裁，给本已疲软的经济雪上加霜，得益为-15；如果中方强硬，菲方妥协，则对中国来说是不战而屈人之兵的上上策，及维护了领土完整又再次证明了中国人民珍爱和平，得益为10，同时对菲方来说，理性的选择妥协可以避免无谓的牺牲，当然也失去了非法侵占中国领土的好处，得益为0；如果菲方强硬，中方妥协，则是对中国最不利的下下策，不仅丧失黄岩岛，而且不利于维护南海，得益为-15，菲方则获取了非法侵占黄岩岛的好处，得益10；如果双方妥协，各得益为5.将上述参数值分别代入（1）和（2）的x=0.25，y=-1，

对中国来说：当0=

对菲方来说：x=0.25时dydt=0始终成立，即对于所有的y都是稳定状态；当x0.25时，y=0是稳定状态。

只有x=1，y=0时，即中方采用强硬策略，菲方采用妥协策略才是进化稳定策略。这符合人们对黄岩岛事件的预期，一方面，在中方有理有据、坚定不移地维护自身合法权益面前，菲方企图通过复杂化黄岩岛事件来非法侵占中国南海的险恶用心不会得逞，最终菲方不得不选择妥协；另一方面，中国长期奉行“搁置争议，共同开发”的南海政策，主张把南海建成和平之海、友谊之海，这使得南海各声索国得出错误的理解，以为中方为了维护难得的和平崛起的战略机遇期，会一味妥协（即x=0），菲律宾等国不顾中国拥有南海的无可争辩的和历史事实，抢占南海岛屿，这种将中方和平诚意当成软弱可欺的危险行为，终将得不偿失。

本文的不足：博弈论博大精深，本人接触博弈论时间较短，对其中的许多内容还没有特别深入的理解，而且文中中菲黄岩岛对峙的例子的赋值可能过于主观，由于不同的赋值会得出不同的结论，因此本文的结论可能带有偏见。

参考文献

[1] 谢识予《经济博弈论》第三版，复旦大学出版社

[2] 麦凯恩《博弈论-战略分析入门》，机械工业出版社

进化博弈理论范文第2篇

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

进化博弈理论范文第3篇

[关键词]进化博弈文献综述

一、进化博弈的基本理论

进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。

二、进化博弈理论的应用研究

1.社会行为领域

Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Sandholm对个体行为偏好的进化进行了动态分析。Juang从进化的视角研究了规则的进化与均衡的选择问题。Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。

2.制度的演化

青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。他们认为:任何一种经济体制的产生都具有一定的惯性,并随着经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化。吴炯、彭飞以进化博弈的复制动态方法为工具解释了公司治理结构演进过程中的“两极化”现象。邱中华等通过演化博弈模型考察委托人和人在委托过程中行为策略的自发演化过程,发现这一博弈过程的所有均衡都是鞍点,从而得出委托人和人之间的监察博弈没有进化稳定策略。Kandori和Rafael运用进化博弈理论研究了两种具有网络外部性的技术之间竞争的博弈过程,提出了解决“花车效应”问题的对策,论证了后发技术取代主导技术的可能性。

3.经济行为的演化

Routledge基于Grossman和Stiglitz提出的经济模型,探讨了金融市场上个体行为人是如何通过适应性和进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Cowen和Kroszner利用进化博弈理论研究了在自由竞争易货贸易经济中,在存在交易成本的情况下,交易媒介的选择问题。罗发友等对集群内企业技术创新行为构建了鹰鸽博弈、鹰鸽反击者博弈和鹰鸽应变者博弈三个模型,并得出集群内企业创新行为不存在纯策略进化稳定均衡,但存在混合策略进化稳定均衡和行为策略进化稳定均衡,反映了集群内企业创新行为的协同竞争性以及这种协同竞争创新行为的进化稳定特性。

三、借鉴意义

1.进化博弈论从有限理性人出发,强调系统达到均衡的过程而非均衡本身。进化博弈理论是完全摒弃传统理论中非现实的“理性人”假设,直接从有限理性参与人群体出发而提出的一种全新的动态分析方法,该方法认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程。

2.进化博弈论纳入了系统到达均衡的时间因素,有利于决策者控制系统向目标的进化。进化博弈理论的动态分析方法中一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程。这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

3.进化博弈理论引入突变因素较好的解决了多重均衡的选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态。进化博弈理论的基本均衡概念――进化稳定均衡,描述了当经济系统一旦进入到某一均衡的吸引域内,系统就会对其他的突变策略具有一定程度的抵抗力。

参考文献:

[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)

[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998

[3] 青木昌彦奥野正宽:经济体制的比较制度分析.中国发展出版社,1999

[4]邱中华金翔:基于进化博弈论研究的一类监察博弈. 南京邮电大学学报(自然科学版),2006,26

进化博弈理论范文第4篇

一、博弈论的形成和发展

1、博弈理论的早期研究。一般认为，对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫（Waldegrave）在1713年提出了两人博弈的极小化极大混合策略解。古诺（Cournot）和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型，两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型，确定了在竞争之下各自的最优反映函数。这些都是关于博弈问题的早期的零星研究。

2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯・诺伊曼和奥・摩根斯坦（Morgenstern）在1944年的《博弈论与经济行为》这部著作，他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立，则是以纳什（John Nash）1950年的博士论文《非合作博弈》为标志，该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代)，美国海萨尼（Harsanyi）和德国塞尔顿（Selten）的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时，博弈论逐渐成为经济学的基石。

1944年，冯・诺伊曼（Von Neumann）和奥・摩根斯坦（Morgenstern）合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上，提出了博弈论的概念术语、一般框架和表述方法，提出了较系统的博弈理论。而且，在该书以前，博弈论主要是数学家们研究的课题，主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此，博弈论开始被经济学家们所接受，对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成，但是这个时候的博弈论还是比较幼稚的，研究的范围也较小，总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。

20世纪的40年代末到50年代初，是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年，纳什（John Nash）在他的博士论文《非合作博弈》中，将博弈论扩展到了非零和博弈，最终形成了非合作博弈理论的思想源泉，纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明，发展了以纳什均衡概念为核心的非合作博弈理论。纳什均衡是对古诺模型和伯特兰德模型中均衡概念的一般化，纳什均衡的概念是有关均衡概念的最基本的概念，后来的子博弈精炼纳什均衡，贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念的提出都是以纳什均衡为研究出发点的。

20世纪50年代中后期一直到70年代也是博弈论发展历史上较为重要的一个时期。“微分均衡”、“强均衡”、“重复博弈”以及在此基础上的完全信息动态博弈等概念就是在这一时期提出来的，而且在60年代初开始了博弈论在进化生物学中的应用的研究。这个时期产生的里程碑式的成果是海萨尼（Harsanyi）关于不完全信息博弈理论，他在1967-1968年的三篇关于不完全信息博弈理论的论文中，提出了关于不完全信息静态博弈的“贝叶斯纳什均衡”的概念，此外还在1973年提出了关于“混合策略”的不完全信息解释，以及关于不完全信息动态博弈的严格“纳什均衡”概念。同时这个时期也是进化博弈论发展的重要阶段，提出了“进化稳定策略”等概念。当然，这个时期产生的博弈论成果还有很多，博弈论更多地应用到经济学理论的研究当中，为80-90年代博弈论的成熟以及经济学理论的博弈论革命起了很大的推动作用。

20世纪80-90年代到现在是博弈论走向成熟的时期，期间产生了大量的研究成果和文献,表明博弈论已经作为一种一般的分析方法逐渐走进了政治学、军事学、生物学、统计学等多门学科中。尤其是在经济学中，博弈论占据了核心地位。这个时期，是对非合作博弈理论的进一步深化，产生了博弈论基础上的经济学分支，如信息经济学，以及一些关于特殊问题的理论，如拍卖理论、激励理论。早在1983年，因一般均衡理论而得到诺贝尔经济学奖的德布鲁(J・Debreu)表明，如果没有博弈论中纳什均衡的重要概念，也就没有他对一般均衡的存在性的证明。到了90年代，克莱普斯(D・Kreps)、克鲁格曼(P・Krugman)和格罗斯曼(S・Grossman)都是因为在博弈论上的贡献而获得了美国的克拉克奖(Clark Prize)，这是美国对40岁以下经济学家的最高奖。之后，博弈论两度夺得诺贝尔经济学奖，1994年颁给纳什(Nash)、海萨尼(John Harsanyi)和塞尔顿(Reinhard Selten)三位博弈论专家；2005年颁给罗伯特・奥曼(Robert J・Aumann)和托马斯・谢林(Thomas C・Schelling )。

二、博弈的类型及其均衡概念

博弈理论有合作博弈和非合作博弈之分。合作博弈强调团体理性，强调效率、公平和公正，非合作博弈更强调个体理性、个体的最优决策。按照参与人行动的先后顺序，博弈可以分为静态博弈和动态博弈。完全信息博弈是指每个参与者对所有其他参与者的特征、策略空间和支付函数有准确的知识；否则，就是不完全信息博弈。下图是基于上述分类方法的博弈类型以及各自的均衡概念。

三、博弈论的研究趋势及未来

1、合作博弈和非合作博弈之分。博弈论有合作博弈和非合作博弈之分，现在的研究更多地是基于非合作博弈的研究，事实上合作博弈也是博弈理论的重要内容。当前合作博弈理论研究的落后，正说明这个领域有很大的发展潜力，基于这方面的研究可能会带来博弈理论以及经济学理论的重大革命。

进化博弈理论范文第5篇

【关键词】博弈论策略思维思考

从历史方面来看，第二次世界大战之后，海萨尼、泽尔腾以及纳什等人在相关研究中对博弈论的解概念予以不断精炼，并将其在理性经纪人的行为分析中予以应用，表明经济均衡与博弈论之间的内在联系，形成了不完全信息动态博弈、不完全信息静态博弈、完全信息动态博弈以及完全信息静态博弈等多种传统博弈论的分析框架，使博弈论在经济学领域中产生的巨大影响。

一、智猪博弈分析

假设猪圈中有小猪、大猪各一只，于猪圈一端对按钮予以设置，每按一次按钮，猪圈另一端的食槽就会有10单位猪食进槽，但是每按一次按钮就导致相当于2单位猪食的成本被消耗。若是大猪按钮取食，小猪呆在旁边观望，那么大猪可以进食9单位食物，而小猪只能进食1单位食物；若是大猪与小猪同时按钮取食，那么小猪可以进食3单位食物，大猪可以进食7单位食物；若是小猪按钮取食，大猪呆在旁边观望，那么小猪可以进食4单位食物，大猪可以进食6单位食物，详见表1。这个博弈并无“剔除劣策略均衡”，主要在于大猪并无劣策略，而小猪的劣策略主要为“按”，因为大猪不管怎样选择，小猪选取“等待”均要优于选取“按”的一种策略。因此，小猪会将“按”剔除，选取“等待”，而大猪了解小猪一定会选取“按”，所以最佳选择为“按”。

实际生活中，这样类似的“智猪博弈”案例较多，其主要体现的是参与人低位不对等的博弈结构，此不对等可以是参与人选取的策略与行动，也可以是其拥有的支付函数与信息。例如：大户在股票市场上为大猪，其主要对信息予以收集，进行技术性分析，对股价走势进行预测，而散户在股票市场上则为小猪，其在技术分析方面基本不用花费资金，主要在于其跟随大户在投资方面的策略进行股票买卖，这一现象就是“散户跟大户”。大股东在股份公司中为大猪，其主要对相关信息予以收集并负责监督经理，在经理任免方面拥有决定性的投票权，而小股东在股份公司中则为小猪，其不需要对经理予以监督，在投票权方面并无实际权利，主要跟随着大股东获取收益。大企业在技术创新市场上为大猪，其在技术创新上需要投入大量的资金成本，对新产品进行研发，而中小企业在技术创新上则为小猪，其不会开展大规模技术创新，而是跟随着大企业的技术研发，当大企业研发的新型产品进入市场之后，对大企业研发的新型产品予以仿制来进行产品销售。

二、演化博弈论分析

演化博弈论，实质上就是生物学与经济学的结合产物，其不仅汲取了哈耶克的思想观念，还对传统博弈论中理性经纪人的超理性假设进行了修正，主要强调热情、冲动、遗忘、规则、习俗、习惯、非理性预期以及犯错误率等一系列传统博弈论中未被重视的内容，对传统博弈论的理论基础产生的一定的影响。演化博弈论的合理性主要体现在其提出经济人并不是超理性的，而是以惯例、习俗以及个人习惯等一系列生活常规为基础的一种“异质低度理性”，大部分时候其在了解、掌握的信息基础上作出理性、正确的决策与行动。这一观念主要表明，适应性过程的展开有充足的时间时，在社会制度变迁中有着关键性决定作用的并不是个人理性，而是演化力量，强调均衡形成过程中制度变迁具备的重要作用。

所以，在均衡概念理解方面，传统博弈论与演化博弈论在本质上存在着差异性。例如：若是传统博弈论强调的是尘埃落定之后世界看上去会是一个什么样子，那么演化博弈论则更加关注尘埃是怎样落定的，并且将这一过程当作随机力量形成的持续冲挤，因此在博弈论中引入随机过程后，可能会引起多种结论出现变化。若是将传统博弈论看作是演化博弈论的一种特例，那么对于“进化稳定策略”形成机制的演化博弈论进行探讨，能够进行研究的内容就更为宽泛，演化博弈论在正统博弈论基本假设方面的突破，在很大程度上对博弈论的解释能力、解释范围予以了丰富与扩展，并且使其成为了一个潜在诺贝尔奖研究领域。

同时，在对“制度”进行分析的时候，演化博弈论在这一方面主要将制度作为一种合理的高维博弈中的均衡，若是在规范方面出现了偏离状况，则需要接受惩罚。比如，在一个行驶需要靠左的国家中，在行驶过程中靠右的结果就是车毁人亡，但是这并不代表规范、制度处于一尘不变的状态，有些时候均衡在独癖性冲击下会出现相应的变化，例如：法国大革命之后，民众强烈要求拿破仑制定并实行向右行驶的新规定，并且逐渐向拿破仑占领的国家中传播，在此后多年中，由于道路资源使用频率逐渐增大，局部性规范逐渐转变为地区性规范，奥地利、西班牙以及葡萄牙等多个国家改变了行车规则，因此靠右形势无疑是行驶的最佳策略。

三、结语

博弈论主要来源于实际生活，其完美且不平凡，其完美主要体现在博弈论具有透彻且凝练深邃的策略思维，同时与人类智慧的最佳发挥相伴。实际上，在现实生活中通常可以找寻到博弈论理论模型的原型，而且现实生活中的习惯、习俗以及经验法则均能够在博弈论中寻找到相关元素，博弈论在实际生活中的体现实质上就是人类智慧的结晶，且学术研究前沿主要在现实生活中获取验证，而随着演化博弈论的出现及发展，博弈论理论研究必然会更加深入的推进。

参考文献：

[1]李凌，王翔.论博弈论中的策略思维[J].上海经济研究，2010.

[2]张国鹏，丁恩杰，涂相华.基于博弈论的协作中继策略[J].中国矿业大学学报，2012.

[3]郭贵春，刘伟伟.博弈论语义学的方法论特征及其意义[J].中国社会科学，2012.

进化博弈理论范文第6篇

【关键词】博弈论，发展，前景

一、导论

博弈论理论的发展为很多问题的研究提供了非常有效的研究思路。但是博弈论的发展历程是怎样的、它是如何受到大家重视的、它的未来发展前景又是如何？本文通过对相关文献的搜集和整理，对上述问题进行梳理，有助于对博弈论有个更为清晰的认识。对博弈论发展的历史、现状和趋势有所了解，对我们更好的掌握这门学科有很大的好处。

二、博弈论的早期研究

很多学者想追溯博弈论的起源，但是针对这个问题并没有一个公认的答案。如果按照把博弈问题应用到决策问题和对决策问题的研究标准，那么可以说博弈论的历史非常悠久。因为在人们的日常生活和生产中常常都会进行博弈分析。有文献记载的最早具有博弈思想的事例可追溯到两千多年前我国的“齐威王田忌赛马”、一千五百年前巴比伦犹太教法典中的“婚姻合同问题”等。如果按照现代经济学和博弈论中经常引述的最早包含博弈思想的文献标准，古诺1838年关于寡头之间通过产量决策进行竞争的模型可以看做博弈论早期研究的起点。1883年伯特兰德的通过价格进行博弈的寡头竞争模型也是包含博弈思想的经典文献。对博弈论问题比较系统密集的研究开始于二十世纪初期。齐默罗和波雷尔对象棋博弈等的系统研究可以代表系统研究博弈理论的开端。诺依曼和摩根斯坦一九二八年给出了扩展形博弈定义。但是，这些研究都没有完成博弈论的理论体系。尽管如此，这些早期的研究还是对博弈论理论的产生起到了非常重要的作用。

三、博弈论的形成

对于一个理论的真正发展来说，仅有一些零星的研究还是不足以发展出博弈论的理论体系的，更重要的不是谁曾经有过零星的研究，而是谁的工作或者文章发表以后，它的思想或方法就引起了人们的兴趣和重视，并开始有越来越多的追随者。就像哥伦布并不是到达美洲的第一人，但却因为他的发现新大陆没有“失落”过，所以哥伦布享有发现新大陆发现者的荣誉。同样的道理，冯・诺依曼和摩根斯坦1944年出版的《博弈论和经济行为》，应该被看做博弈论历史的真正起点。在《博弈论和经济行为》中引入了博弈论的扩展表示和正规形表示，并定义了极小化极大解，指出这种解在所有两人零和博弈中都存在。该书在总结以往研究成果的基础上，给出了博弈论研究的一般框架，概念术语和表述方法，提出了相对系统的博弈理论。尽管现在看来该书某些地方还不全面，但是，其对博弈理论发展所起的巨大作用是不可否认的。

四、博弈论的成长和发展

博弈论第一个研究高潮出现在20世纪40年代末和50年代初。在第二次世界大战期间，博弈论的思想和研究方法在军事领域的应用推动作用下，这时博弈论的研究队伍已经有了很大的发展。纳什加入到博弈论的队伍是这个时期最重要的事件之一。纳什在1950年将博弈论扩展到非零和博弈，并提出纳什均衡概念和证明了纳什均衡存在性的纳什定理，发展了非合作博弈的理论基础。除了纳什的研究成果以外，这个时期还出现了很多博弈理论家和博弈论研究成果。例如，囚徒困境博弈的实验。五十年代中后期一直到七十年代也是博弈论发展历史中产生重要理论成果的阶段。例如：“微分博弈”的概念、“强均衡”的概念、关于重复博弈的“民间定理”。这个期间最重要的成果有赛尔腾1965年提出的在博弈方选择“相机计划”的博弈中不是所有的纳什均衡都是合理的，因为可能存在空头威胁的问题。1975年又提出了“颤抖手均衡”的概念。70年代博弈论发展中最重要的事件还包括“进化博弈论”的发展。此外“共同知识”在博弈论中的重要性也受到重视。

五、博弈论的成熟与主流经济学的融合

80、90年代是博弈论走向成熟的时期，在这个时期博弈论在经济学中的应用领域越来越广泛，在经济学中的地位达到了最高峰。这个时期的重要理论进展包括“顺退归纳法”、“序列均衡”的概念、《进化和博弈论》的出版、“完美贝叶斯均衡”的概念。正是这个时期，博弈论受到经济学家真正的广泛的重视，并被看做经济学核心的分析方法。也正是这个阶段开始，博弈论的思想、词汇开始在经济学杂志上大量出现。博弈论之所以会在经济学中的地位上升的这么快答案首先是现代经济活动的规模越来越大，对抗性竞争性越来越强，因此，经济活动的博弈性越来越强。其次，信息技术和社会经济信息化的发展使得人们认识信息的作用和规律的要求不断提高。从而促进了信息经济学的发展要求。因此信息经济学的发展也对博弈论的发展起到了促进作用。

六、博弈论的发展前景

由于博弈论本身优美深刻的本质魅力，新的博弈分析工具和应用领域的不断发现，一定会吸引大量学者加入。而且随着博弈理论的发展和博弈研究的不断深入，人们认识到这种理论还存在不少问题，特别是它的理论基础方面还存在一些没有很好解决的根本问题，这充分保证了博弈论在未来相当长的时间内的发展潜力。在金融、贸易、法律、政治等领域不断提出新的博弈论应用课题这也是今后博弈论进一步发展的巨大动力。而且，在合作博弈和非合作博弈两大博弈中，非合作博弈是博弈的主流，但是，合作博弈也具有相当重要的作用，而且要比非合作博弈理论更加复杂。正是由于这些原因，博弈论在未来一段时间内必然会有更进一步的发展，也会对经济学和其他学科的发展做出更大贡献。

参考文献：

进化博弈理论范文第7篇

1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合着的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。该巨着汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨着的出版视为数理经济学确立的里程碑。

接下来的一段时期对合作博弈的研究有了长足进步。按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。如意愿表示不可强制执行,则为非合作博弈。非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。事实上,合作博弈可视为非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。为了解决合作博弈中所遇到的问题,这一期间提出了联盟博弈、稳定集、解概念、可转移效用、核心等重要概念与思想。1950年代是博弈论的成长期,纳什为非合作博弈的一般理论奠定了基础,提出了博弈论中最为重要的概念——纳什均衡,开辟了一个全新的研究领域。非合作理论发展起来,如阿尔·塔克的囚徒困境、重复博弈概念等。合作博弈理论在这个阶段得到进一步发展,如沙普利值概念、核概念等。博弈论的研究队伍开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为博弈论的研究中心。此经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论的成熟期。不完全信息与非转移效用联盟博弈那样的扩充使理论变得更具广泛应用性。常识性的基本概念得到了系统阐述与澄清。博弈论成了完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重要解概念之间的对应关系。豪尔绍尼与泽尔滕正是在这一时期开始他们的工作,豪尔绍尼提出了不完全信息理论,泽尔滕开始其均衡选择问题的研究。1970年代至今是博弈论的丰富壮大期。博弈论在所有研究领域都得到重大突破。博弈论开始对其它学科的研究产生强有力的影响,计算机技术的飞速发展使得研究复杂与涉及大规模计算的博弈模型发展起来。在理论上,博弈论从基本概念到理论推演均形成了一个完整与内容丰富的体系。在应用上,政治与经济模型有了深入研究,非合作博弈理论应用到大批特殊的经济模型。同时博弈论应用到生物学、计算机科学、道德哲学等领域,如随机策略这样的概念得到了重新解释。渐渐地,博弈论变得大众化起来。不再是仅为少数研究者所知。要对每年所发表的有关博弈论数以千计的文献进行了解已不是件容易的事。至今,博弈论仍在不断发展与深化,预测其可能出现的创新与成就是很困难的。

在博弈论的发展过程中,纳什奠定了非合作博弈的理论框架与概念基础,他的名字与博弈论的中心概念——纳什均衡联在一起;豪尔绍尼与泽尔滕则致力于博弈论的进一步发展与应用。

在非合作博弈论和经济分析里所应用的博弈论思想中,纳什均衡都处于核心地位。克雷普斯(D.Kreps)教授认为,如今在每一个经济学领域及与其相关的金融、会计、市场学甚至政治学等领域,在消化其近期研究成果过程中,对纳什均衡概念的理解均起着重要作用。虽然作为先驱者的古诺(Cournot)已在其研究中开创这一思想的先河,但其目前的形式则是纳什独立完成得出的卓越成就。美国普林斯顿大学的数学家和统计学家纳什。从1950年至1954年,他发表了多篇论述博弈论的文章,为非合作的一般理论和合作博弈的谈判理论奠定了基础。他规定了非合作博弈的形式,并定义了着名的“纳什均衡点”。纳什最先对合作与非合作进行了区别。纳什认为以前的理论包含着某种被称为合作类型的n人博弈思想,它以一种对能由局中人形成的不同合作之间相互关系的分析为基础;与此相反,纳什认为他自己的理论则“以缺乏合作为基础,在其中假定每个参与者都各行其是,与其他人之间没有合作与沟通”。该思想拓展了博弈论的研究范围,并增强了其应用性。在阐明了合作与非合作之间区别的基础上,纳什定义了着名的“纳什均衡点”,并对它的存在进行了证明。纳什均衡的定义一般是通过简单确定一个正常形式的有限局中人和行动的博弈来给出的。在纯策略中,它是指这样一种策略分布:假使其他局中人不变换其策略,则任何一个局中人都不能以单方面变换自己的策略来增加其效用。纳什还证明,在一个有限局中人和行动的博弈中,至少总存在一个纳什均衡,虽然当我们考察混合策略时才能完全保证其存在,因为有例子表明,存在着没有纯策略均衡的对策。这一定义实际上包含着一个前提假定,即局中人对游戏结构有充分的了解,也就是说拥有完全信息,以便能够导出他们自己的预测。纳什均衡的意义直到现在仍是探讨与争论的题目。一般认为,它是随不同情况而变化的一种过程。例如,假设在某种博弈中,局中人通过某些非强制手段就局中人的策略选择达成协议,这项协议具体确定了每个局中人选择的策略。由于协议无强制力量,局中人如果能通过违背协议而获得利益,则该协议无效。所以,为了保证协议有效,必须有一种局中人不可能因单方面违背协议而获益的机制,即形成一种纳什均衡。即,纳什均衡使得协议能够自我约束,无外力作用下也能保证协议的生效。这里纳什均衡的意义在于保证协议的自我强制执行。但这并不是说每个纳什均衡都具有自我强制性,就多个局中人背信问题而言可能得出不同的结论。此外,这里并未讨论协议如何实施及无协议时的情况。纳什均衡在上述情况中的含义是有差别的。纳什均衡刻画了人们理性选择的结果:利益冲突达到一种稳态以至无人会单方面加以改变。纳什均衡并未对这一结果做出福利上即总体上优与劣的判断。这就允许存在一种情形:由于人们的不合作使得每个人都达不到可能的最大收益。在囚徒困境中表现得十分明显,其中唯一的纳什均衡是双方均交待,因为在其它策略组合下均有一方能因改变策略而获益。但是这一局势中的帕累托最优是双方均不交待。这表明,帕累托最优并不一定能在纳什均衡点上实现。也即,在存在利益冲突的情况下,利己主义个人理性选择的结果在总体上可能并不是最有效的。进而,西方经济学中在经济人假设下,市场经济会达到或者趋向帕累托最优这一结论在引入利益冲突后有可能无法成立。在囚徒困境中,双方虽可在均不交待的情况下达到帕累托最优,却难以实现这一结果。这是由于缺乏对对方的信任。因对方可把策略改为交待而使自己获释得利,故无法信任对方会信守承诺。每个人追求自身利益最大化这个理性人假设更使这种信任失去基础。这说明,个人利己的理性选择并不能保证人们的处境都得到改善,结果可能对大家都不利。就此而言,纳什均衡揭示了利己理性的弱点。在人人求得自利的同时,如何防止对一切人均不利的结果出现,这已成为今天博弈论和经济学中研究的热点问题。

进化博弈理论范文第8篇

关键词：车载DVD；进化博弈；鹰鸽博弈

中图分类号：F42 文献标识码：A

原标题：基于进化博弈理论对我国车载DVD行业的市场分析

收录日期：2011年12月26日

一、我国车载DVD行业发展历程概述

车载电子产品是一类新兴的汽车电子产品，主要作用包括提高汽车的娱乐性、为驾驶员和乘客提供各类信息，以及提高汽车通信能力等。就目前来看，汽车上主要应用的车载电子产品有：GPS、车载电视、车载DVD、车载MP3、车载音响、TPMS、车载通信系统、车载网络系统、CarPC等。就车载DVD产品来看：在行业发展初期，产品价位高市场认知度低，普及率较低；随着时间的延续和经济的发展，汽车相关产业快速发展。同时，生产厂商的增加，产品数量的增大使车载DVD的价位逐渐下降，市场普及率逐渐提高。

二、我国车载DVD行业发展的经济学理论模型

（一）基本理论――有限理性和进化博弈。在博弈理论中，将理性分为完全理性和有限理性。其中，完全理性是指那种具有完美的理性意识、行为准确的理性经济人，而与之相对的有限理性则是指理性程度高但偶尔犯错误的正常人。进化博弈就是有限理性博弈方的博弈，这种博弈对均衡稳定性存在一定程度的偏差，但经过一段时间的调整就可以获得均衡的博弈。

（二）基本理论――最优反映动态博弈与复制动态博弈。进化博弈中的最优反应动态博弈是指那些能迅速调整策略的有限理性博弈方的动态策略调整，他们通常会采用针对上次博弈对方策略的最优对策。复制动态博弈是对优势策略仅具有简单模仿能力的有限理性博弈方所使用的动态策略调整机制，这一机制的核心是在群体中采用较为成功的策略（比平均水平较好的策略）的个体逐渐增加。

（三）进化博弈典型模型――鹰鸽博弈（表1）

在鹰鸽博弈模型中，鹰代表战争，是市场中较为强势的厂商经常使用的策略。这类厂商在市场中或者占据较大市场份额，或者拥有较为雄厚的资本和自主品牌，多为某行业的龙头老大或领军企业；鸽代表和平，是较为平和的市场策略。一些进入某一行业较晚的厂商或者产品处于成熟阶段的厂商往往倾向于采取这一策略。模型中，V代表收益，是厂商执行某一市场策略成功所获取的利益；C代表成本，是策略失败所付出的代价或成本，而博弈各方胜败概率假设均为1/2。

三、基于进化博弈理论对车载DVD行业的分析

车载DVD行业形成初期，市场上存在的厂商数量较少，产品品种有限，参加博弈的博弈方数量较少；而当车载DVD产品逐渐为消费者所熟知，有越来越多的生产厂商进入到这一市场来，瓜分市场份额，此时的博弈方也大幅增加，众多厂商便可以分为两个大的博弈群体：早期进入市场的拥有相对较大市场份额的厂商和待市场较为成熟才进入市场企图瓜分市场份额的厂商，我们可以称之为守擂者和攻擂者。基于以上原因，车载DVD行业发展历程正好与上述鹰鸽博弈分析方法的适用背景相符合，因此可以运用进化博弈中的鹰鸽博弈分析方法对我国车载DVD行业进行分析：

（一）市场形成初期博弈分析

1、模型背景。车载DVD市场形成初期，竞争厂商数量较少，新产品上市价格较高，同时新产品前期成本主要为研发成本和生产成本。假设博弈方只有两家厂商分别是厂商一和厂商二，收益V为8，成本C为4，博弈双方胜败的概率均为1/2。

2、建立模型

（1）鹰鸽博弈基本模型（表2）

（2）期望得益与平均期望得益。设X：采用“鹰”策略博弈方的比例；1-X：采用“鸽”策略博弈方的比例。所以，期望得益：

ux=x・2+（1－x）・8，u1-x=x・0+（1-x）・4

平均期望得益：

■=x・ux+（1-x）u1-x

=x［2x+8（1-x）］+（1-x）［4（1-x）］=4-2x2

随着时间的推移，越来越多的厂商模仿鹰策略，想要赚取更多收益，所以有：

dx/dt=x・（ux-■）

=2x3-6x2+4x=2x（x－1）（x-2）

随着复制动态过程的持续，采用两种策略的博弈方比例不再发生变化，博弈达到稳定状态，此时dx/dt，即x=0，1，2。

根据微分方程的“稳定性”定理可以求出进化稳定策略下达到稳定状态时“鹰”策略博弈方的比例。

设dx/dt＝F（x），随着时间t增加，x的变动逐渐减小，达到稳定状态的x*使得F'（x*）＜0。由此，dx/dt＝F（x）=2x3-6x2+4x，得F'（x*）=6x2-12x+4，而稳定状态下dx/dt=0的得益x*=0，1，2，带入F'（x*）。得F'（0）＝4＞0，F'（1）＝－2＜0，F'（2）＝4＞0。

（3）结论。在进化稳定策略下，达到稳定状态时的x*=1，说明鹰策略的博弈方数量稳定在1的水平。

（二）产品市场成熟期博弈分析

1、模型背景。车载DVD市场逐渐成熟，竞争厂商数量迅速增多，产品价格逐渐降低，同时产品的生产成本降低，但是维护成本大幅度提高。来自外界巨大的竞争压力使得厂商收益缩水幅度很大，而成本上升的却很快。假设博弈方为两个竞争集团，分别代表前期进入市场和后期进入市场的两个博弈方，称之为“守擂者”和“攻擂者”。收益V为2，成本C为12，博弈双方胜败的概率仍均为1/2。

2、建立模型

（1）鹰鸽博弈基本模型（表3）

（2）期望得益与平均期望得益。期望得益与平均期望得益的计算方法同上。随着时间的推移，越来越多的新厂商进入市场，企图瓜分市场份额。市场上的产品品种、品牌数量逐渐增加。

经计算，有：

dx/dt=6x3-7x2+x=x（1-x）（1-6x）

随着复制动态过程的持续，采用两种策略的博弈方比例不再发生变化，博弈达到稳定状态，此时dx/dt＝0，即x=0，1，1/6。

设dx/dt＝F（x），随着时间t增加，x的变动逐渐减小，达到稳定状态的x*使得F'（x*）＜0。由此，dx/dt＝F（x）=6x3-7x2+x，得F'（x*）=18x2-14x+1，而稳定状态下dx/dt=0的得益x*=0，1，1/6，带入F'（x*）。得F'（0）＞0，F'（1）＞0，F'（1/6）＜0。

（3）结论。在进化稳定策略下，达到稳定状态时的x*=1/6，说明鹰策略的博弈方数量稳定在1/6的水平。

四、结束语

经过上述分析可知，车载DVD产品已进入生命周期的成熟阶段：产品品牌众多，产量巨大。通过利用进化博弈理论对其分析可对其发展脉络有所了解，车载DVD行业内厂商竞争激烈，新进入厂商应在产品创新与改善售后方面加大投入力度，以求从激烈的竞争中脱颖而出。

主要参考文献：

[1]杨锡怀，王江等.企业战略管理[M].高等教育出版社，2004.4.

进化博弈理论范文第9篇

关键词：行为博弈；演化博弈；强互惠；生物理性；跟风策略；博弈论

中图分类号：F224.32 文献标识码：A 文章编号：1007-2101（2013）05-0037-06

一、引言

博弈论的开创者为数学家冯·诺依曼（John von Neumann）和经济学家奥斯卡·摩根斯坦（Oskar Morgenstern），二人应用博弈论研究人类在战略和经济上的决策行为，发现了理的数学原则，并归纳出理的典型特征。[1]随后，约翰·纳什（John Nash）拓展了二人的理论，区分了合作博弈和非合作博弈，创造了简明且影响深远的“纳什均衡”概念。[2]在20世纪五六十年代，博弈论的研究以合作博弈为主。而在20世纪七八十年代，约翰·海萨尼（John Harsanyi）提出了不完全信息博弈和海萨尼转换；莱茵哈德·泽尔腾（Reinhard Selten）定义了子博弈精炼的概念。[3]由此，博弈论研究的重点转向了非合作博弈。在20世纪90年代，行为博弈和演化博弈突破了经典博弈的完全理性人假设：行为博弈应用心理学规律弱化了理性假设，通过实验模拟来修正理论与实际的偏差，它关心的是参与者在实际中如何行动，而不是理论逻辑上的推理；[4]演化博弈假设博弈方是从大的总体中随机抽取的，他们是按照生物或社会的方式反复进行博弈。[5]或者说，行为博弈运用实验的方法来研究行为动机、认知能力和推理过程之间的结构关系；演化博弈则分析演化的动态过程和经济行为的学习特征，并重构了博弈均衡（ESS，演化稳定策略）。如果说经典博弈论的力量在于它的普适性和数理精确性，那么行为博弈与演化博弈的优势就是它解释问题的现实性，所以实验与模拟是构建有限理性博弈的基础，但目的并非“证伪”博弈论，而是通过建立规则来改进它。

强互惠（Reciprocity）最深刻的含义在于：它是一种具有“利他”倾向的第三方惩罚行为或惩罚机制，虽然和我无关，甚至需要我付出巨大代价，但我仍然要对“恶”人宣战，以此来“惩恶扬善”[6]。强互惠行为的证据大多来自可控行为博弈实验：在“最后通牒”博弈中，多数实验参与人拒绝了不公平的分配方案，以此来惩罚对方的非友善行为；[7]在“公共物品”博弈中，惩罚可以减少搭便车行为从而提高捐赠水平，但需要个人承担一定的成本；[8]在劳动市场博弈中，当雇主获得惩罚和鼓励雇员权力时，雇员的努力水平会显著提高。此外，许多学者对不同经济领域中的强互惠行为进行了解读：强互惠视角下的工资刚性；[9]商业活动中平等规范的盛行；[10]产业组织理论中的强互惠[11]。在众多的强互惠研究中，以美国桑塔费研究员金迪斯等人所做的跨文化最后通牒博弈最为引人关注。金迪斯等人在12个国家中的15个有着极为不同的经济和文化环境的小规模社会中招募研究对象并进行实验，结果与经济学规范模型自利假设发生系统性偏离：除了物质利益之外，很多实验对象更关注公正和互惠，愿意为修正物质利益的分配而承担个人损失。

从现有的研究文献来看，强互惠理论产生于行为博弈实验，并在此基础上进行了拓展性研究。但现代经济学研究往往只局限于行为博弈的视角，提出强互惠行为是一种非理性的情感行为。那么，强互惠行为到底是不是非理？其中的情感因素从本质上来看是什么？以及为什么会有这样的情感因素出现？显然，通过深入分析行为博弈和演化博弈之间的逻辑联系，探索强互惠行为背后的内在生物学机制，对正确理解人类行为是非常必要和重要的。

二、行为博弈的分析范式与强互惠行为的发现

行为博弈是将行为及实验经济学与标准博弈论相融合的结果，意在对个人或团体在各种策略条件下行动做出与实际更为一致的解释和预测。与传统博弈论注重逻辑推理相比，行为博弈以数据和心理学材料为分析工具，实验及其结果是其理论构建的基础。所以，从某种程度上来看，行为博弈的分析范式是一种实验的范式。

（一）行为博弈实验的设计

1. 实验对象的选择。人类群体中个体种类很多，究竟应该选择那类群体作为行为博弈实验的研究对象便成为实验设计首先要关注的问题。在现有的行为博弈实验中，大多数实验者选择了在校大学生作为自己的研究对象，一方面是因为大学生群体相对比较简单，与社会联系较少，考虑的外生变量较少；另一方面是因为大学生群体受到一定的文化教育，能够很好地理解实验过程，并按照实验者的要求做出相关经济行为。选择大学生群体作为实验对象是行为博弈实验设计的一个显著特征。其实，在大学生群体中，不同专业之间的学生表现出了不同程度的互惠行为：经济学专业的学生出价要比其他专业的学生低7%而索取的要高7%。[12]

2. 实验操作指导。实验操作指导在实验开始前告诉参与人需要知道的各种信息，主要包括博弈顺序和博弈支付两个方面，即有关信息的完全性和完美性的说明。清晰而明确的操作说明是保证实验成功的关键，且一般情况下大声朗读实验说明是确立“公共知识”的主要方式。从本质上来看，实验操作说明是一种控制信息的手段：一方面，确保实验对象可以利用足够的信息去计算均衡；另一方面，通过对信息的控制来发现参与者的能动性，比如，在学习模型中，实验者有意控制关于支付的信息，目的在于探索人的学习能力。[13]

3. 匿名与否。匿名是行为博弈实验的基本要求。实验对象的博弈行为受到对方的身份、年龄、相貌、语气等个人特征的影响。只有在匿名博弈的前提下，实验发现的才是个人的真实偏好，一旦知晓对方的个人信息，将会影响实验对象行为的策略选择。霍夫曼等人进行了两个“相互蒙蔽”的独裁者博弈。[14]实验结果显示：一半以上的实验对象未分出任何金额的美元，并且平均剩余钱数只有总额的10%，明显小于无“相互蒙蔽”条件下的结果。对这种现象可解释为“相互蒙蔽”增加了实验对象之间的“社会距离”。[15]此外，一些个人特征也会对实验参与者的行为产生影响，比如拥有较好面貌的实验者能够得到对方更多的分配比例或更不易被对方拒绝；[16]能够促使实验者提出更公平的分配方案或更不易拒绝对方；[17]女性比男性能提出更公平的分配方案，也能接受更低的分配比例[18]。所以，要想在行为博弈实验中发现参与人行为之间的真实差异，必须排除人口统计因素的影响，而匿名处理成为必然选择。

4. 激励方式。现金激励和非现金激励对人的行为产生不同的影响，仅仅得到分数支付的实验对象倾向于无规则的达到竞争均衡，而且比能得到现金的实验者更快地厌烦实验，即假设的奖励更易变、更不可信和更容易满足。相反，现金支付会减少理性预测反应的偏差。所以，对实验对象支付现金迅速成为实验经济学中的标准方式。那么，奖金的多少对行为博弈实验的结果产生怎样的影响呢？许多研究已经进行了增加奖金的实验。大多数理论推断当奖金上升时，回应者会拒绝的出价将上升而他们会拒绝的比例份额会下降。然而，有的研究却显示，随着奖金的增加拒绝比率并未出现显著的变化。[19]根据当地的购买力，卡梅龙（Cameron）在印度尼西亚、斯络尼姆和罗思（Slonim and Roth）在斯洛伐克、里斯特和凯瑞（List and Cherry）在佛罗里达州均进行了创见性的实验。研究结果表明奖金的较大变化对拒绝行为只有有限的影响，对提议者的出价比例也几乎没有影响。

总之，行为博弈实验的设计涉及很多因素：实验方法论因素（重复与否、奖金形式和匿名与否等）、人口统计因素（性别、种族、专业、年龄和相貌等）、文化因素（语言问题等）、描述性因素（说明方式、语境等）。博弈论专家通过对这些因素的控制和度量进行了拓展性的研究，结果表明：公平是人们对参与者行为或其结果的一个判断，并且这个判断会影响其对行为和分配的偏好。

（二）强互惠行为的发现

强互惠行为是人们对善意或非善意互动的反应，体现出人们对公平的显著性偏好（Falk，2001）。那么，人们如何区分善意和非善意的举动呢？关键在于两个因素：一是行为导致的后果；二是潜在的企图。相关实验研究表明第二个因素起主导作用，若提议者的分配方案是随机产生的，那么回应者对相同方案的拒绝率要低于非随机情况，即表现出一种友好行为。[20]所以，强互惠行为违反了传统经济学中人的“自虑”假设，是一种典型的“他虑”行为，而规范经济学中将其定性为非理性的情感行为。

为揭示强互惠行为的本质，必须从发现这种行为的大量行为博弈实验开始。由于影响实验设计的因素很多，所以现存的实验证据也比较复杂。无论是在经济学和心理学实验领域，还是在社会学和人类学实验领域，均发现了强互惠行为的存在，这说明了该人类行为的普遍性。然而，最具说服力的证据大都来源于可控的实验室实验：在最后通牒博弈中，许多人拒绝了较低的出价以惩罚提议者的非友善企图；在投资博弈和礼品互换博弈中，友善行为得到了回报。[21]在众多行为博弈实验中以桑塔费研究院所作的跨文化最后通牒博弈研究最为突出，影响也最为广泛。来自经济学、人类学、社会学、心理学和博弈论等诸多领域的专家历时近10年完成了这项实验：研究对象来自12个国家中的15个小规模社会；在大多数实地实验中，受试者是匿名参加的；多数博弈实验选取的标的是钱，少数选取了烟草等替代品；在所有的实验中，均根据应征者对实验的理解程度来选择实验参与者。研究结果表明：传统的“自虑”假设未在任何一个小规模社会中得到证实；市场化程度越高，提议者出价越高，行为博弈实验中的合作水平越高；个体层次上的变量不能解释群体之间的行为差异；实验中的行为与小规模社会中的经济模式相一致。[22]

总之，强互惠行为的发现违反了规范模型中理性人追求自身利益最大化的假设。在各种形式（对不同的因素进行控制和度量）的行为博弈实验中，最后通牒博弈支付均严格为正，而且在大多数实验中，实验参与人一般都拒绝出价较低的提案。更为重要的是，经济选择中的这种强互惠偏好并非像传统经济理论中所假设的那样是外生的。相反，它是在日常的经济、社会互动中逐渐形成的，即强互惠偏好是内生的。这为探索强互惠行为的根源指明了方向，即从演化的视角来分析这一人类偏好，指出它的生物理性本质。

三、演化博弈的分析范式与占优的跟风策略

演化博弈理论是研究群体进化的一种动态方法，其研究对象是频率制约选择下的进化动态。其中，个体的适应度并非常数，而是依赖于不同表现型在群体中所占的比例。演化博弈理论源于博弈论与生物学之间的互动：首先，生物学家尝试运用博弈论建构各种生物竞争演化模型，比如生存竞争、性别比例等；[23]然后，生物学家将种群思想引入博弈论之中，比如适应度概念、进化稳定策略、复制方程等；[24]最后，经济学家借鉴生物学家提出的理论，继续发展了演化博弈，从演化稳定均衡扩展到随机稳定均衡。不论演化博弈理论如何发展，独特的分析范式是其核心特征。

（一）演化博弈的分析范式

2. 演化稳定策略。演化稳定策略（ESS，Evolutionarily Stable Strategy）是演化博弈中一个非常关键的概念。[25]其核心思想是，如果一个现存策略是演化稳定策略，那么，必须存在一个正的进入障碍，使得当变异策略的频率低于这个障碍时，现存的策略能够比变异策略获得更高的收益[26]。假设现存策略为x，变异策略为y，而变异者进入后占总体的比例为？着（0

3. 复制动态方程。演化过程是两个基本要素的组合：一个是产生多样性的变异机制；一个是倾向一些种类的选择机制。演化稳定性强调变异的作用，即个体策略的随机变动，而复制动态强调的则是选择的作用。（二）占优的跟风策略

一种人类行为如果经历了漫长的演化过程，即经过变异的入侵检验和选择的动态复制，能够生存下来。那么，就可以说这种人类行为是演化稳定的。通过前面的分析可知，要想揭示强互惠行为的内生性和生物理性本质，必须从演化的视角进行解读。那么，在演化博弈中应该如何来解释强互惠行为呢？对这一问题的回答可以从演化博弈中的关键性概念“跟风策略”开始。

跟风策略（TFF，Tit for Tat）又称“一报还一报”策略，即开始时选择合作，然后不断重复对方上一步的选择。[29]它是由多伦多大学博弈论专家阿纳托尔·拉帕波特（Anatol Rapoport）在罗伯特·阿克塞尔罗德（Robert Axelrod）重复囚徒困境计算机竞赛中提出的一个博弈策略。阿克塞尔罗德在20世纪末进行了三次计算机模拟实验，目的在于探讨人类合作能否从有着自己利益最大化推理逻辑的行动者的行为互动中自发产生。在第一次实验中，共有15种策略参赛、225场比赛，模拟结果显示，跟风策略平均得分504.5，即基准分600的84%，排名第一；在第二次实验中，阿克塞尔罗德将参赛策略增加到63个，并将第一次实验的结果告知参赛者，模拟结果显示，跟风策略平均得分为基准分的96%，在此排名第一；在第三次实验中，阿克塞尔罗德并未增加新的策略，而是从演化博弈的角度出发，试图发现史密斯的“演化稳定策略”（ESS），模拟结果表明，跟风策略在演化迭代中依旧表现出色，而“诡诈型”策略在200代以后完全消失。通过三次重复囚徒困境博弈实验，阿克塞尔罗德发现：跟风策略稳定成功的原因在于它综合了善良性、报复性和宽容性。[30]善良性，即从不首先背叛；报复性，也称可激怒性，即对方若背叛，则自己将在下轮对其惩罚；宽容性，即一旦“改过”，自己以合作对待。正是这三种特性保证了跟风策略在与各种策略的博弈过程中能够获得较高的平均支付，具有较强的适应性，即跟风策略具有演化稳定性。正如生物学家道金斯所说，即使有自私的基因掌权控制，好人仍能得好报。[31]

四、行为博弈与演化博弈的比较

（一）差异性

经典博弈论最根本的失误在于，缺乏一套关于参与人何时以及如何共享心理建构的理论。经典博弈论失灵的地方，演化博弈论却大获成功。策略互动的模拟演化分析有助于理解行为的涌现、转化和稳定性。在演化博弈论中，成功的策略在参与人群体中扩散，而不是由脱离实际的理性主体来归纳学习。而且，理性的个体甚至从不尝试学习针对复杂博弈的最优策略，而是复制他们所遇到的成功的主体的行为。所以，演化博弈计算机模拟得出了占优策略——跟风策略，而采取这种策略的个体将有更高的几率生存下去。相反，行为博弈才运用行为实验的方法，对个体的真实经济行为进行数据统计分析，然后基于这种数据资料的实证性和描述性发现了一种特殊的人类行为——强互惠行为。所以，演化博弈与行为博弈的差异性主要体现在方法论层次上。演化博弈分析是基于有限理性人假设的逻辑推理，而行为博弈分析是基于行为实验的实证研究。演化博弈注重演绎，而行为博弈注重实验结果。在主流博弈理论中，逻辑推理的分析范式一直处于主导地位，而对实验方法重视不够，这就导致了理论与现实之间的差距，即博弈理论并不能解释真实的经济行为。如果缺少一套广泛的事实体系来加以理论化，就必然存在着某种花过多时间建立精巧模型然而和实际行为却毫无联系的危险。[32]目前，实证知识是严重不足的，数据对于博弈论来说尤为重要，因为均衡一般有多个，而均衡的实现过程并不清晰，只运用数学的逻辑推理并不能解决这一问题。

（二）互补性

实验数据表明传统的非合作博弈理论、合作博弈理论和进化博弈理论的理论框架并不能单独对人的实际经济行为做出可靠的解释，但若结合行为博弈中的实证知识，多数行为均可被很好的理解。所以，演化博弈与行为博弈之间的关系可以被理解为理论与数据之间的关系，演化博弈理论指明了研究方向，而行为博弈则细化并修正了这一方向。正如波普尔所说，开展科学研究应该遵循证伪主义的原则，即在理性批判的思想指导下，采取试错法进行研究。[33]演化博弈理论表现为一种全称判断，而行为博弈实验是一种个别现象，个别事例无论重复多少次，都不能证实一个全程判断。所以，行为博弈是对演化博弈理论的一种修正、一种支持，而演化博弈的研究也应该建立在行为博弈实验的基础之上，两者之间是一种互补关系。

五、结论与展望

（一）一个新概念：生物理性

行为博弈从实验经济学的途径出发通过广泛的行为经济学实验来分析个体行为的真实状态，发现了强互惠是人们在社会互动中经常采用的行为方式，而这种行为方式却违反了传统经济学中的“经济人”假设，从这个角度来看，“强互惠”行为是非理性的。相反，演化博弈运用计算机模拟实验对个人之间的策略博弈进行了分析，并得出结论：跟风策略是最优策略。这种分析视角可以认为是一种演化的视角，是行为人过程理性的体现。通过比较强互惠行为和跟风策略可以发现，强互惠行为是行为人的一种本能表现，而这种本能表现是以生物演化过程中的占优策略——跟风策略为基础的。也就是说，强互惠行为的生物基础和演化基础是占优策略，即从演化角度来看，强互惠则体现了个人的过程理性，并不能简单地把它归结为非理。

在行为人的非理中，存在一些过程理，虽然从短期来看，这些行为是非理，但是从长期来看却是过程理性的体现，这是演化理在生物体中的内化表现，可以看成是一种潜意识反应，甚至可以看成是基因的外在行为体现，这类行为体现了人的生物理性，即这些行为的产生及扩散是以提高生命体的适存度为目的的。

生物理性或演化理性，是自然给人类设定的一个“理性”。这个“理性”可以完全形成于自然环境之中，也就是说，完全由相互作用的无情数学规律，通过自然选择的多次筛选形成。人们肯为自己的亲人做出自我牺牲的行为或者说强互惠行为的产生，有着生物学上的根源。此类行为只是所谓“自私的基因”的一个表现，其结果是使载有与自身相似基因的个体获益。

如果有人认为，这种彼此合作的强互惠形势并不是博弈论的数学结论导致的，而是由人类的情感因素决定的。但是，在自然界中，跟风策略的广泛存在有力地反驳了这一观点。[34]生物学中的证据表明，吸血蝙蝠、棘鱼、猿猴，甚至病毒，都会遵循“跟风”规律行事。认为病毒也信奉利他主义，那是肯定说不通的，它们的行为，完全是进化选择的结果。这就是说，遗传因子中存在造成类似于“跟风”行为的生命体，会在进化过程中获得优势，因此自然选择会朝着有利于它们的方向进行，从而使这样的遗传类型得到更好的传递。这意味着，人类也是天生含有合作基因的。爱德华·O·威尔逊认为，随着人类文明的发展，这样的行为模式，会从本能冲动转变为社会习惯，进而又演化为法律约束，并最终成形为道德准则。

（二）展望

1. 强互惠行为是一种生物理性，而且在不同的环境中，强互惠程度存在种种差异：市场化程度越高的社会表现出越高的强互惠程度。这种现象又体现出强互惠的另一种特征，即强互惠者的增加是一种集体效应，需要相互作用的累计：单个强互惠者不能侵入背叛者群体，只有满足一定条件的强互惠群体才能侵入。从这方面对强互惠行为展开延伸性研究是非常必要的，它有助于我们更好和更全面地认识强互惠行为。

2. 从配对博弈到n人博弈。现有的演化博弈研究有严格的前提假设，比如在阿克塞尔罗德的计算机模拟实验中，研究的范式是两人重复囚徒困境博弈，即相互作用的策略始终是以配对形式出现的，是一种典型的配对博弈。这种分析范式简化了博弈局面，存在很大的局限性，应该逐步扩展到n人之间的博弈，即考虑三个以上策略之间的互动。跟风策略在配对博弈中是占优的，那么它在n人博弈中能否继续占有呢？这是一个有待回答的问题。

3. 从互惠到空间互惠。空间效应能极大地改变频率制约选择的结果。如果考虑空间效应，那么原本在同质环境中相互排斥的策略是有可能共存的。传统的强互惠行为只是在一一配对的行为博弈实验中发现的，一旦扩展到空间博弈，将会发现一种新的合作进化机制，即空间互惠（Spatial Reciprocity）。[35]

通过比较行为博弈与演化博弈的分析范式以及强互惠行为与跟风策略，本文认为，行为博弈和演化博弈在方法论的选择上存在较大的差异：前者重视数据资料，后者重视逻辑推理；同时，行为博弈和演化博弈之间体现出很强的互补性：前者以后者为导向，后者以前者为基础，是一种猜想与反驳的关系。此外，强互惠行为与跟风策略的殊途同归，证明了强互惠行为的生物理性本质，从侧面说明了行为博弈与演化博弈的逻辑联系。所以，行为博弈与演化博弈一个较好的研究路径是：演化博弈以行为博弈为基础，利用行为博弈实验的数据不断修正自身理论推理的缺陷，以更好地解释真实的经济行为；行为博弈以演化博弈为指导，利用演化博弈理论成果来理清行为实验的方向，以提高经济学实验的针对性。只有二者的良性互动，才能促进这两种博弈理论的理性发展。

参考文献：

[1]Martin A. Nowak. Evolutionary Dynamics：Exploring the Equation of Life[M]. WilsonBinding：Belknap Press，2006.

[2]J. F. Nash. Non-cooperative Games[M]. Princeton：Princeton University Press，1950.

[3]David Kreps. Game Theory and Economic Modeling[M]. London：Oxford University Press，1990.

[4]Colin F. Camerer，Gorge Loewenstein. Psychological Perspectives on Justice：Theory and Applications[M]. Cambridge：Cambridge University Press，1993.

[5]J. W. Weibull. Evolutionary Game Theory[M]. Massachusetts：MIT Press，1995.

[6]金迪斯，鲍尔斯.走向统一的社会科学：来自桑塔费学派的看法[M].浙江大学跨学科社会科学研究中心，译.上海：上海世纪出版集团，2005.

[7]W. Güth，R. Schmittberger，B. Schwarze. An Experimental Analysis of Ultimatium Bargaining[J].Journal of Economic Behavior and Organization，1982，（3）：367-388.

[8]Ernst Fehr，M. Klaus. Schmidt，a Theory of Fairness，Competition，and Cooperation[J]. Quarterly Journal of Economics，1999，（114）：817-868.

[9]T. Bewley. A Depressed Labor Market as Explained by Participants[J]. American Economic Review，1995，（85）：250-254.

[10]D. Kahneman，J. Knetsch，R. Thaler. Fairness as a Coonstraint on Profit-Seeking：Entitlements in the Market [J]. American Economic Review，1986，（4）：728-741.

[11]R. M. Steers，L. W. Porter. Motivation and Work Behavior [M].Fifth Edition，New York：McGraw-Hill，1991.

[12]John R. Carter，Michael D. Irons. Are Economists Different and If So，Why？[J].Journal of Economics Perspectives，1991，（5）：171-177.

[13]Van Huyck，B. John，Raymond C. Battalio ，Frederick W. Rankin. Selection Dynamics and Adaptive Behavior without much Information[M].Texas：A&M University Manuscript，2001.

[14]Elizabeth Hoffman，Kevin McCabe，Keith Shachat，Vernon L. Smith. Preferences，Property Rights and Anonymity in Bargaining Games[J]. Games and Economic Behavior，1994，（7）：346-380.

[15]Bruno Frey，Iris Bohnet. Institutions Affect Fairness：Experimental Investigations[J].Journal of Institutional and Theoretical Economics，1995，（2）：286-303.

[16]Donja Darai. Facing a Dilemma：Cooperation Behavior and Beauty[R]. No Econwp082，ECN-Working Papers from Department of Economics-University of Zurich，2012.

[17]Bradley Ruffle，Richard H. Sosis. Does It Pay To Pray？ Evaluating the Economic Return to Religious Ritual [R]. Experimental from EconWPA，2003.

[18]Stephanie Seguino，Thomas Stevens，Mark Lutz. Gender and Cooperation Behavior：Economic Man Rides Alone [J]. Feminist Economics，1996，2（1）：1-21.

[19]Alvin E. Roth，Vesna Prasnikar，Masahiro Okuno-Fujiwara，Shmuel Zamir. Bargaining and Market Behavior in Jerusalem，Ljubljana，Pittsburgh and Tokyo：An Experimental Study[J]. American Economic Review，1991，（81）：1068-1095.

[20]Armin Falk，E. Fehr，Urs Fischbacher. Testing Theories of Fairness-Intensions Matter[R]. Working Paper No. 63. Institute for Empirical Research in Economics，University of Zurich，2000.

[21]E. Fehr，G. Kirchsteiger，and A. Riedl. Does Fairness Prevent Market Clearing？ An Experimental Investigation [J].Quarterly Journal of Economics，1993，（108）：437-460.

[22]Joseph Henrich，Robert Boyd，Samuel Bowles，Colin Camerer，Ernst Fehr，Hebert Gintis，Richard McElreath. In search of Homo Economicus：Behavioral Experiments in 15 Small-Scale Societies[J].American Economic Review，2001，（91）：73-78.

[23]R. C. Lewontin. Evolution and the Theory of Games[J]. Journal of Theoretical Biology，1961，（1）：382-403.

[24]J. Maynard Smith，G. R. Price. The Logic of Animal Conflict[J]. Nature，1973，（246）：15-18.

[25]J. Maynard Smith. The Theory of Games and the Evolution of Animal Conflicts[J]. Journal of Theoretical Biology，1974，（47）：209-221.

[26]黄凯南.演化博弈与演化经济学[J].经济研究，2009，（2）：132-145.

[27]J. W. Weibull. Evolutionary Game Theory[M].MIT Press，1995.

[28]谢识予.经济博弈论[M].上海：复旦大学出版社，2010.

[29]Anatol Rapoport，Albert M. Chammah. Prisoner’s Dilemma [M]. Ann Arbor：University of Michigan Press，1965.

[30]阿克塞尔罗德.合作的进化[M].吴坚忠，译.上海：上海人民出版社，2007.

[31]R. Dawkins. The Selfish Gene[M]. Oxford：Oxford University Press，1989.

[32]Eric Van Damme. Game Theory：The Next Stage[M]. U. K.：Oxford University Press，1999.

[33]赵敦华.赵敦华讲波普尔[M].北京：北京大学出版社，2006.

进化博弈理论范文第10篇

关键词：博弈论；案例教学；实验教学；教学改革

中图分类号：G642.0 文献标志码：A 文章编号：1674-9324（2016）03-0074-02

一、引言

博弈论英文全称为Game Theory，意为游戏理论。博弈论最初应用在竞争与对抗性的活动中，强调策略思维改变人们的行为进而达到个人效用或者集体效用最大化。最早的应用为解决对弈问题，如各种、赌注等胜负决策。在博弈论中，博弈的三要素为：局中人、博弈规则、收益。一个博弈活动的开始，必须有一定数量的参与者，可以是一个也可以是多个。有了参与主体，就要按照一定的博弈规则进行“游戏”。在博弈游戏中，每个局中人都要本着一定的原则做出策略进而行动，任何行动都导致一定的后果即收益。不同的策略会影响人们的行动，而不同的行动对应的最终收益不同。因此，为了达到各自的目标利益，局中人要充分考虑对手的各种可能的策略，而做出合适自己的应对策略。在博弈中，行动方的收益可能为正也可能为负，完全取决于局中所选择的策略。从某种方面来看，博弈论是一门具有抽象性和推理性的科学，在实践应用中可以指导人们的言行，有一定的预测性和解释性。博弈论发展成为一门正式的科学始于1944年诺依曼的经典著作《博弈论与经济行为》一书，标志着博弈理论的诞生。该书第一次把博弈的经验行为和认知上升到理论知识的高度，建立了完整的博弈理论体系定理定义。继诺依曼之后，又先后出现了诸如纳什、泽尔藤、海萨尼、塔克、克雷普斯和威尔逊等一大批优秀的经济学家和数学家，创立了合作博弈、非合作博弈、完全信息静态博弈、完美信息动态等一系列经典博弈理论。博弈论应用的范围很广，几乎应用到经济学所涵盖的所有领域，如国际贸易、宏观经济政策、微观经济行为、组织经济学等。博弈理论可以指导人们的言行，使人们可以在有限的策略中寻找最佳的优选策略从而达到个人或者集体效用的最大化。从经验利益和应用效能的角度来说，掌握博弈论是非常必要的。随着我国经济的发展，博弈论在经济类课程的重要性凸显。其作为一门学科进入我国高校课程教学可以追溯到上世纪80年代中后期，教学对象以经济类研究生为主。博弈论进入我国本科教学较晚，而对于管理类本科生的博弈论教学尚处于发展阶段。管理类本科学生的知识面较窄，数学功底较为薄弱，因此管理类本科的博弈论教学有一定难度。另一方面，随着我国高校管理类教学和科研水平的提高，博弈理论必然会在本科经济管理类教学中普及，并得到快速发展。而管理类本科教学的特点是经济理论研究能与管理实践有效结合，学生能轻松掌握并在管理实践中合理运用。博弈理论的应用前景十分广阔，大到政治、军事、经济、谈判；小到日常的工作、学习、社交。可以说，博弈思维与每个人的生活息息相关。博弈论广阔的应用前景使得高校大学生有必要掌握这种理论方法，并逐渐形成良好的策略思维。

二、管理类博弈论课案例教学

博弈论的学习要求学生具备一定的数学功底如基础运筹学、决策科学等。一般来说，博弈论的教学重点在经济类的研究生层面。讲授博弈理论的目的是为了这些学生在将来可以利用博弈理论更好地从事科学研究。可以说，博弈论是一种经济工具与方法，能解决现实的经济问题及现象。但是对于管理类本科生而言，由于其经济专业知识及数学专业知识较为薄弱，处于基础的了解层次。因此，用传统的研究生的授课方法讲解博弈理论，对于管理类本科学生是不合适的。为了增加博弈论教学的生动性、趣味性提高教学效果，有必要针对管理类学生特点进行博弈论课程的教学内容与方法进行研究。

1.了解博弈论定理定义的数学证明。博弈论的本科教学应以学生为主体，强调开发学生的智力，调动学生的积极性。因此，在教学模式上要摒弃形式化的教学方法。博弈理论的证明是非常烦琐的，需要很多数学专业知识，涉及到概率论、优化方法等，这些内容对于管理专业的本科学生来说有一定的难度。因此，在管理类本科博弈论教学中，以了解定理定义为主，淡化数学证明，重点在于理论的阐述和逻辑思维的培养。学生在课堂上知道经典的博弈定理，掌握的层度在了解层面，而不需要对定理定义加以数学证明。如果过度地强调数学公式体系，反而会抵消学生学习博弈论的积极性，给学生造成一种畏惧感而不利于本科博弈论的教学。淡化数学证明的教学理念，需要教师对博弈论有着较熟的掌握，对教师的数学素质要求较高。然而，淡化并不等于完全不讲解。因此，在备课环节教学需要自己对定理定义有着很好的归纳和总结，经过自己的信息加工构造出简单易懂的证明框架。在教学环节，给学生展示简明的数学理论框架及逻辑思维图示。这里最常用的是逻辑分析图和流程图。通过图形示例分解数学问题，达到由难变易的目的。这样使冗繁的数学证明变得清晰明了，易于掌握。

2.增加实用案例应用突出案例教学。在管理本科博弈论的教学中，以教材的经典案例为主，同时也要注意增加一些实际案例。在教学安排上，除了理论授课外还要注重讨论环节，目的在于使学生能活学活用所学到的博弈理论知识。通过讨论，引导学生能从现实问题抽象出博弈问题，进行案例创新。在自创案例的过程中，学生能从实践的角度深入理解博弈理论，深刻地领会博弈思维、博弈三要素在行为决策的重要性。如大多数教科书上都会出现“智猪模型”，以猪圈里的大猪和小猪为研究对象，研究它们如何智斗对方采取策略吃到更多饲料的问题。该模型是博弈论中经典的合作博弈模型，几乎出现在每一本博弈论的教材上。在课堂讲授“智猪模型”，引入博弈故事，并分析合作策略，给出最优均衡解。此外，在模型讲解之外要积极鼓励学生说出身边遇到的类似“智猪模型”的例子。在以往的教学中，发现有的学生就能联想到垄断竞争市场上大企业与小企业的合作博弈的关系问题。大企业类似于模型中的“大猪”，而小企业类似“小猪”。大企业制定方针政策，打广告扩大产品的宣传力度，目的在于增加产品销售量，提升企业利润。而小企业由于自身实力有限，不可能像大企业那样投入大量的人力物力搞研发及销售策略，因此对于小企业来说“搭顺风车”是其最优的策略。而大企业不可能完全杜绝小企业的“搭车”行为，但是也不能放任不管。对于大企业的均衡策略为适当降低产品价格，从价格优势入手占有一定客观的市场份额。

3.开创实验课程撰写实验报告。开创博弈论实验课可以提高管理类本科学生学习的主动性和积极性。为了增强课堂互动效果，针对非合作博弈模型设计竞价模拟实验。充分考虑到我国管理类本科学生的特点为文科学生感性思维、发散思维较显著。利用学生这一感性特点，积极鼓励学生发现身边的事物，并经过自己的逻辑思维的加工通过模拟实验的形式展示在课堂上。例如在讲解非合作博弈中的拍卖竞价模型，如果单纯讲理论模型难懂的数学证明与符号使得教学内容枯燥无味。对于学生来说，拍卖既熟悉又陌生。拍卖场景出现在各大影视作品中，甚至在身边的网络B2B的电子商务环境。但是真正参与到现实拍卖的学生少之又少。由于学生对拍卖有了一定的感性认识，是熟悉的事物，因此引入拍卖实验到博弈论的实验课堂就很合理。通过拍卖实验的设计，可以使学生快速地熟悉拍卖的机理，拍卖集中的设立及运行。这样学生就可以从传统的讲授式的课堂走出来，变得主动而有参与性。具体操作为第一步：将学生分组，每组成员分工制定相应的拍卖物品、拍卖规则、物品底价、标价涨幅价等。第二步：角色划分。根据拍卖需要，学生在实验中扮演不同角色如拍卖师、竞价者、组织者、记录员等。角色划分可以使学生充分理解竞价各个环节的博弈决策和行为。第三步：竞价环节。拍卖模拟正式开始，在此环节中学生针对拍卖物品进行模拟竞价。对于实验中产生的行为偏离及误差，教师要及时做记录，观察学生的策略结果和均衡状态。实验的最后，总结实验数据、实验过程和实验结果。讨论分析竞价的均衡结果，撰写分析报告。

三、结语

博弈论是一门应用数学逻辑方法解决现实经济问题的学科。随着我国政治、经济的发展迫切需要高校本科博弈论课程在教学内容和方法上的创新。本文针对我国管理类本科学生的特点，分析了我国博弈论本科教学的特点，提出教学改革的一些建议：管理类的本科学生学习博弈论应以掌握其思维方式、博弈模型为重点，突出案例教学及实验教学。案例教学能提高学生学习兴趣，新增案例的讨论也能使学生更好地掌握博弈理论。实验教学有利于学生活学活用博弈理论，通过参与模拟实验使学生对博弈论有了更深刻的理解与领悟。案例教学与实验教学相结合的目的在于降低博弈理论的学习门槛，让更多非数学专业、非经济专业的学生可以更好的入门学习博弈理论，有利于博弈理论与思想的传播。

参考文献：

[1]曹国正.博弈圣经[M].新加坡希望出版社，2008.

[2]Avinash K.Dixit，Barry J.Nalebuff，Thinking Strategically[M].中国人民大学出版社，2002.

[3]张维迎.博弈论与信息经济学[M].上海三联出版社，1999.

[4]谢识予.经济博弈论[M].上海：复旦大学出版社，1999.

[5]王则柯.博弈论教程[M].中国人民大学出版社，2010.

进化博弈理论范文第11篇

关键词：新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80 年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90 年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004 年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008 年10 月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

进化博弈理论范文第12篇

关键词：新闻传播学　博弈论　方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究。不能缺少博弈论的思想。

上个世纪90年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008年10月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归人人际传播理论。说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

博弈论在新闻传播学研究中的可能性

德国著名数学家哥德尔1931年提出不完备性定理：第一不完备性定理――任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理――任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方。找到双方的契合点，从新的角度描述新闻传播现象与活动的规律。调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何。有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与

活动过程中，有没有相类似的情况?其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定?其二，均衡概念在新闻传播过程中能否实现?其三，新闻传播活动的行为主体是不是理性的?情况允许的话，自己的利益最大化是否是追求的目标?其四，竞争与合作的契约关系，在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态。即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用。但归根结底的因素是生产力与生产关系的矛盾对立统一。博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此。博弈论在新闻传播研究领域的运用也具有一定的广泛性。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播应用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯・麦奎尔、瑞典人斯文・温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说。研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响。人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论。并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”。进行专门的新闻传播学新领域探索。

进化博弈理论范文第13篇

关键词：博弈论现代企业构建和谐

近几年来，博弈论的观点频频出现在各类经济学著作中。博弈究竟是什么？博弈论对构建和谐企业有何启发或指导意义呢？通俗地讲，博弈论也叫对策论，是研究利益冲突各方如何决策及决策结果的，是一种“游戏理论”。其准确的定义是：一些个人、团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略进行选择并加以实施，并从中各自取得相应结果或收益的过程。一个完整的博弈应当包括博弈的参加者、博弈信息、行为或策略、博弈的次序和博弈方的收益五项内容。

一、博弈论中几个重点理念

1.合作与非合作。博弈论可以划分为合作博弈与非合作博弈。二者的主要区别在于人们的行为相互作用时,当事人是否达成一个具有约束力的协议。如果有,就是合作博弈；反之,则是非合作博弈。合作博弈理论强调的是团体理性。非合作博弈论的重点是个体理性、个人最优决策。引起了人们对“机制”问题的研究。

2.经济核心理论。参与者组成某类群体（被称作联盟）以及它们之间以互益的方式进行的交易。该联盟可以使交易后所有行为人都受益，这就产生经济核心的概念。后拓展到垄断和寡头及公共经济学中的税收等理论。

3.非数理博弈理论。非数理博弈理论分析的是混和动机冲突状态下的社会和经济行为:行为者本身对其他人的反应作为其他人的期望而影响其行为，即两个或多个团体面临相冲突的合作和竞争动机时的情景。包括以下三种形态。

(1)焦点效应:每个参与博弈的行为人以合作性的结果为目标进行协作而反对不协作的选择。任何因素都有可能使参与者的注意力集中到一个焦点上，继而选择这一点，这就产生焦点效应。焦点效应能协调社会行为人博弈行为的预期，包括协调共同利益和一部分不一致的利益。

(2)相互依存的选择和行为理论:常用于分析在社会决策过程中，因某些强制力决定的决策而形成共识。这些强制力包括文化的、习惯的因素。还用于分析不同群体相互作用的问题和“多人囚徒困境”。

(3)自我控制理论:即自我博弈，以自己为对手的博弈。通过这一理论来回答什么是理性、人是如何控制自己行为的。在日常生活中,人们喜欢自我欺骗，使自己做应该做的事情,或者避免去做一些不该做的事情。这种现象,被称为预期的自我控制。这种理论为企业安排奖励与惩罚机制；通过承诺或契约,或者建立一个轮换机制奠定了基础。

4.冲突经济理论。即不合作或冲突世界中的“纳什均衡”。人们为了追求自我利益最大化,只要有机会,在信息不对称的条件下,总会利用“策略性行为”通过损人而达到利己的目的。广泛存在于军事、犯罪、种族问题、能源、环境、外援和人类生命的价值等领域的冲突问题。

二、博弈论对构建和谐现代企业文化的启示和应用

1.博弈论对现代企业管理的意义。(1)博弈论的研究成果可直接运用于现代企业的经营决策之中。在市场经济条件下，企业之间的竞争日益加剧，行业内的竞争逐渐表现为几个大型集团之间的直接对抗，企业在这种情况下的经营总体战略和一般战略决策必须在充分掌握竞争对手信息和策略的情况下进行。因此，企业运用博弈论中的决策模型进行这些问题的决策将使决策过程更加合理化。

(2)博弈论对现代企业管理观念和方式的改变有着重要的指导意义。举个例子来说，从“囚徒困境”这个典型博弈问题，我们可以深刻体会到企业实施“供应链管理”的必要性。在现实生产生活中，企业之间，尤其是企业与其供应商之间，很多情况下正如上面两个囚徒所遇情形一样，没能真正实现自身的最佳利益，甚至是损人不利己。因此，实施供应链管理，强化企业之间的合作，将是企业获得双赢局面的一条捷径。

2.博弈论对构建和谐企业的启示。博弈论的研究成果，提高了人们对竞争和冲突这一社会现象的认识，对于我们在社会主义现代化建设中如何运用合作的理念，创建和谐企业具有重要的启示作用。企业作为社会的组成单元，是构建社会主义和谐社会承担着义不容辞的责任。对于企业来说,“和谐”的基本特征应当表现为依法治企、科学发展、协调有序、安全环保、公平诚信、服务社会，并建立一个长效的协调机制，其核心在于通过促进企业内外环境的“和谐”，达到企业的经济效益与社会效益相统一，最终实现企业健康、协调、可持续发展。需要处理好四方面的问题：(1)处理好个人、集体和政府的利益差别。在市场经济模式中，个人、企业和政府都会追求自己的利益，在各自的运转环境中，实际上都处于博弈状态，各自都是在现实生活环境中的博弈一方，冲突和矛盾是免不了的。随着国有企业改革的不断深化，在股份制改造和现代化企业制度建设过程中，轮岗、下岗、合并、重组等问题所引发分工、收入、保障的差距越来越成为矛盾的焦点。掩盖这种利益差别、否认博弈的现实并不能解决问题。所以，需要客观地看待社会生活中这三者之间的差别。另外，由于长期的计划经济条件下，我们习惯于集中管理模式，因此，客观地看待这种博弈现实在思想上有一个再认识的过程。

(2)处理好博弈与规则透明、诚实守信的关系。规则透明和诚实守信是博弈各方达成协议的基础。规则透明是互信的条件。管理者要取得人们的信任，政策必须公开、公正。对于企业，企业管理者要取得职工的信任拥护，企业要在市场上立得住、站得稳，必须得讲诚信、讲公平、讲公正。那种以权宜之计、无意实施的政策得到的结果是暂时的。如果所要的结果不是通过透明、可信的规则取得的，必然不会与职工群众达成共识，企业氛围也不会是和谐的、稳定的。

(3)处理好博弈过程中的利益共赢的关系。和谐企业建立基础是企业各方的共赢。博弈各方达成的协议虽然未必是利益均等，但是应该是各方都能够接受的。建立和谐的企业，需要从根本上、制度上解决问题，而制度的建立、措施的完善应建立在科学的基础上，建立在各方都能接受的共赢得基础上，而不是企业方想怎样做就怎样做。如果不能保证各方共赢的措施和制度，必然得不到其他方面的支持，那它必然是不稳定的、不和谐的，甚至会导致更多、更严重的问题。

(4)处理好经济利益之外的博弈关系。和谐不完全建立在经济利益上，其他很多如生活的、文化的因素等都可能起作用。经济利益虽然是人们生活中的重要方面，但是除此之外仍然有很多人文因素影响着社会的和谐。因此，企业的管理者的充分沟通、理解职工的非经济期望和需求，给予人文关怀，对于促进和谐社会的形成有着不可忽视的作用。

进化博弈理论范文第14篇

关键词：博弈论；供应链管理；均衡

Abstract: Game theory focus on the status analyze of conflict and cooperation. With the development of competition and cooperation among modern enterprises， game theory is widely used in supply chain management（SCM）. This paper classified the applications of game theory in SCM into two groups: applications in traditional problems of SCM， and applications in SCM network equilibrium. The paper made a depth literature review of these two categories and gave out the future research trends.

Key words: game theory; supply chain management; network equilibrium

0引言

博弈论所研究的是多种决策情况（博弈）中，每位决策者的最优决策和这些最优决策所构成的可能结果，以及这些结果的相关特性[1]。博弈论关注于包含冲突与合作的状态分析[2]，目前的应用领域非常广泛。供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理，以改善顾客服务和增加经济价值的流程[3]。近年来，随着供应链中企业间的竞争与合作不断增强，博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用，主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。

1博弈论在供应链管理中的应用现状

供应链由不同的企业组成，企业间相互竞争的同时也相互合作，随着供应链由“链”向“网”的转变，企业间关系越来越复杂，不仅存在着上下游企业的竞争与合作，还包括不同供应链的核心企业间的竞争与合作问题。纵观供应链管理弈论的应用研究，本文将博弈论在供应链管理中的应用分为两大类：博弈论在传统供应链问题中的应用；博弈论在供应链网络均衡中的应用。

（1）博弈论在传统供应链问题中的应用

Cachon和Netessine根据供应链管理的应用，将博弈论分为四种类型：非合作静态博弈、动态博弈、合作博弈和贝叶斯博弈[2]；Leng通过对130多篇供应链管理中运用博弈论的文献进行总结，认为博弈论在供应链中的应用主要有五种类型：固定单位采购成本与库存博弈、数量折扣下的库存博弈、产量和价格竞争博弈、其他属性的博弈（能力决策、服务质量、产品质量等）及联合决策博弈（能力、服务/产品质量、产量/定价、广告/新产品开发等决策内容的组合博弈）[2]。

在供应链的传统问题中，博弈论主要用于解决单阶段或两阶段供应链的上下游企业间存在的决策博弈，Parlar分析了单阶段，两个零售商出售同质可替代产品进行订货决策以使各自利润最大化的问题[4]；Cachon研究了两阶段情况下，一个供应商与一个零售商的库存决策问题[5]；Monahan针对数量折扣现象，研究了供货商和购买者在顺序决策情况下，供货商的最优折扣决策[6]，而Kohli和Park就供应链两阶段成员间基于数量折扣的合作问题进行了探讨[7]；随着市场竞争的加剧，企业需要在控制成本的前提下提供令顾客满意的服务和产品，Gans研究了M个供应商之间的服务质量竞争问题[8]，而Cohen和Whang研究了售后服务质量决策问题[9]；最近10年来，随着供应链问题研究的深入，多决策博弈问题也受到了重视，例如Bernstein和Federgruen研究了两阶段下，单个供应商和N个零售商在库存和产量/定价联合决策下的零售商利润最大化问题[12]。

转贴于

（2）博弈论在供应链网络均衡中的应用

随着供应链成员的增加，供应链中“流”的复杂化，供应链由链状结构逐步发展成网络结构，而供应链网络的均衡问题也受到了越来越多学者的重视。

Nagurney对由制造商、零售商以及市场组成的三层供应链建立了单一产品下需求确定的网络均衡模型，指出供应链网络均衡是其中的产品流、资金流等满足所有决策者的优化条件，即控制供应链网络的有限维变分不等式的解[11]；Dong在Nagurney的研究基础上对单一产品的随机需求情况进行了研究，以三方各自追求利益最大化（非合作）为目标，建立了相应的供应链网络均衡模型[12]；张铁柱对需求确定情况下的多产品供应链网络进行了均衡建模研究[13]；藤春贤对多产品随机需求的供应链网络进行了均衡建模研究[14]。以上这些研究都是基于静态博弈进行的供应链上下游企业间的博弈问题研究，由于企业间的博弈随着时间的变化而不停变化，如何解决供应链企业间存在的动态博弈成为研究的下一个方向；此外，在供应链网络中，不仅仅存在上下游企业间的竞争与合作，不同供应链之间的核心企业之间也普遍存在竞争与合作。李春发假设需求受时间影响，针对单产品供应链网络进行了上下游企业间的动态博弈研究[15]；黎继子针对不同供应链的核心企业间博弈进行了相应研究，但仅局限于同质产品的情况[16]。

2总结与趋势

博弈论在供应链管理中的广泛应用证明了博弈论在帮助解决供应链中存在的多种问题的有效性，包括库存决策、产品定价与产品数量、库存/定价/质量/广告等多决策问题，以及供应链成员间的竞争合作问题等，而且随着供应链网络的复杂化，也需要利用博弈论来解决相关网络均衡问题。

在当前研究中，Nash均衡和Stackeberg均衡常常作为解决非合作博弈的方法被广泛使用，而旁支付方法较多地运用于解决供应链成员间的合作问题，核、Shaply值及核仁的运用相对较少；而且多数研究是针对供应链的静态博弈进行分析，而在现实的供应链网络运作中，企业更多是随着时间的推移和根据其他供应链成员的决策进行动态决策，因此如何将动态博弈理论应用于供应链管理研究也将是下一个研究热点。

参考文献：

[1] 杨荣基，彼得罗相，李颂志. 动态合作——尖端博弈论[M]. 北京：中国市场出版社，2007.

[2] Leng， M. and M. Parlar. Game Theoretical Applications in Supply Chain Management: a Review[J]. INFOR，2005，43(3):187

-221.

[3] B.J LaLonde. Supply Chain Management: Myth or Reality?[J]. Supply Chain Management Review，1997(1):6-7.

[4]M. Parlar. Game Theoretic Analysis of the Substitutable Product Inventory Problem with Ramdom Demands[J]. Naval Research Logistics， 1988(35):397-409.

[5] G.P. Cachon， et al. Competitive and cooperative inventory policies in a two-stage supply Chain[J]. Management Science，1999，45(7):936.

[6] J.P. Monahan. A Quantity Discount Pricing Model to Increase Vendor Profits[J]. Management Science，1984(30):720-726.

[7] B. Kohil and H. Park. A Cooperative Game Theory Model of Quantity Discount[J]. Management Science，1989，35(6):693-707. [8] N. Gans. Customer Loyalty and Supplier Quality Competition[J]. Management Science， 2002，48(2):207-221.

[9] M.A. Cohen and S. Whang. Competing in Product and Service: A Product Life-cycle Model[J]. Management Science， 1997，43(4):535-545.

[10]D.J. Reyniers and C.S. Tapiero. The Delivery and Control of Quality in Supplier-Producer Contracts[J]. Management Science， 1995，41(10):1581-1589.

[11]Nagurney A， Dong J， Zhang D. A Supply Chain Network Equilibrium Model[J]. Transportation Research: Part E， 2002(38):281-304.

[12]Dong， J.， D. Zhang， et al.. Multitiered Supply Chain Networks: Multicriteria Decision—Making Under Uncertainty[J]. Annals of Operations Research，2005，135(1):155.

[13] 张铁柱，刘志勇，滕春贤. 多商品流供应链网络均衡模型的研究[J]. 系统工程理论与实践，2005，25(7):61-68.

[14] 滕春贤，潘晓东. 供应链网络均衡中的利润协调问题[J]. 哈尔滨工程大学学报，2007，28(7):818-821.

进化博弈理论范文第15篇

关键词：博弈论；供应链管理；均衡

abstract: game theory focus on the status analyze of conflict and cooperation. with the development of competition and cooperation among modern enterprises, game theory is widely used in supply chain management（scm）. this paper classified the applications of game theory in scm into two groups: applications in traditional problems of scm, and applications in scm network equilibrium. the paper made a depth literature review of these two categories and gave out the future research trends.

key words: game theory; supply chain management; network equilibrium

0引言

博弈论所研究的是多种决策情况（博弈）中，每位决策者的最优决策和这些最优决策所构成的可能结果，以及这些结果的相关特性[1]。wWW.133229.cOM博弈论关注于包含冲突与合作的状态分析[2]，目前的应用领域非常广泛。供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理，以改善顾客服务和增加经济价值的流程[3]。近年来，随着供应链中企业间的竞争与合作不断增强，博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用，主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。

1博弈论在供应链管理中的应用现状

（1）博弈论在传统供应链问题中的应用

cachon和netessine根据供应链管理的应用，将博弈论分为四种类型：非合作静态博弈、动态博弈、合作博弈和贝叶斯博弈[2]；leng通过对130多篇供应链管理中运用博弈论的文献进行总结，认为博弈论在供应链中的应用主要有五种类型：固定单位采购成本与库存博弈、数量折扣下的库存博弈、产量和价格竞争博弈、其他属性的博弈（能力决策、服务质量、产品质量等）及联合决策博弈（能力、服务/产品质量、产量/定价、广告/新产品开发等决策内容的组合博弈）[2]。

在供应链的传统问题中，博弈论主要用于解决单阶段或两阶段供应链的上下游企业间存在的决策博弈，parlar分析了单阶段，两个零售商出售同质可替代产品进行订货决策以使各自利润最大化的问题[4]；cachon研究了两阶段情况下，一个供应商与一个零售商的库存决策问题[5]；monahan针对数量折扣现象，研究了供货商和购买者在顺序决策情况下，供货商的最优折扣决策[6]，而kohli和park就供应链两阶段成员间基于数量折扣的合作问题进行了探讨[7]；随着市场竞争的加剧，企业需要在控制成本的前提下提供令顾客满意的服务和产品，gans研究了m个供应商之间的服务质量竞争问题[8]，而cohen和whang研究了售后服务质量决策问题[9]；最近10年来，随着供应链问题研究的深入，多决策博弈问题也受到了重视，例如bernstein和federgruen研究了两阶段下，单个供应商和n个零售商在库存和产量/定价联合决策下的零售商利润最大化问题[12]。

（2）博弈论在供应链网络均衡中的应用

随着供应链成员的增加，供应链中“流”的复杂化，供应链由链状结构逐步发展成网络结构，而供应链网络的均衡问题也受到了越来越多学者的重视。

nagurney对由制造商、零售商以及市场组成的三层供应链建立了单一产品下需求确定的网络均衡模型，指出供应链网络均衡是其中的产品流、资金流等满足所有决策者的优化条件，即控制供应链网络的有限维变分不等式的解[11]；dong在nagurney的研究基础上对单一产品的随机需求情况进行了研究，以三方各自追求利益最大化（非合作）为目标，建立了相应的供应链网络均衡模型[12]；张铁柱对需求确定情况下的多产品供应链网络进行了均衡建模研究[13]；藤春贤对多产品随机需求的供应链网络进行了均衡建模研究[14]。以上这些研究都是基于静态博弈进行的供应链上下游企业间的博弈问题研究，由于企业间的博弈随着时间的变化而不停变化，如何解决供应链企业间存在的动态博弈成为研究的下一个方向；此外，在供应链网络中，不仅仅存在上下游企业间的竞争与合作，不同供应链之间的核心企业之间也普遍存在竞争与合作。李春发假设需求受时间影响，针对单产品供应链网络进行了上下游企业间的动态博弈研究[15]；黎继子针对不同供应链的核心企业间博弈进行了相应研究，但仅局限于同质产品的情况[16]。

2总结与趋势

在当前研究中，nash均衡和stackeberg均衡常常作为解决非合作博弈的方法被广泛使用，而旁支付方法较多地运用于解决供应链成员间的合作问题，核、shaply值及核仁的运用相对较少；而且多数研究是针对供应链的静态博弈进行分析，而在现实的供应链网络运作中，企业更多是随着时间的推移和根据其他供应链成员的决策进行动态决策，因此如何将动态博弈理论应用于供应链管理研究也将是下一个研究热点。

参考文献：

[1] 杨荣基，彼得罗相，李颂志. 动态合作——尖端博弈论[m]. 北京：中国市场出版社，2007.

[2] leng, m. and m. parlar. game theoretical applications in supply chain management: a review[j]. infor，2005,43(3):187

-221.

[3] b.j lalonde. supply chain management: myth or reality?[j]. supply chain management review，1997(1):6-7.

[4]m. parlar. game theoretic analysis of the substitutable product inventory problem with ramdom demands[j]. naval research logistics, 1988(35):397-409.

[5] g.p. cachon, et al. competitive and cooperative inventory policies in a two-stage supply chain[j]. management science，1999,45(7):936.

[6] j.p. monahan. a quantity discount pricing model to increase vendor profits[j]. management science，1984(30):720-726.

[7] b. kohil and h. park. a cooperative game theory model of quantity discount[j]. management science，1989,35(6):693-707. [8] n. gans. customer loyalty and supplier quality competition[j]. management science, 2002,48(2):207-221.

[9] m.a. cohen and s. whang. competing in product and service: a product life-cycle model[j]. management science, 1997,43(4):535-545.

[10]d.j. reyniers and c.s. tapiero. the delivery and control of quality in supplier-producer contracts[j]. management science, 1995,41(10):1581-1589.

[11]nagurney a, dong j, zhang d. a supply chain network equilibrium model[j]. transportation research: part e, 2002(38):281-304.

[12]dong, j., d. zhang, et al.. multitiered supply chain networks: multicriteria decision—making under uncertainty[j]. annals of operations research，2005,135(1):155.

[13] 张铁柱，刘志勇，滕春贤. 多商品流供应链网络均衡模型的研究[j]. 系统工程理论与实践，2005,25(7):61-68.

[14] 滕春贤，潘晓东. 供应链网络均衡中的利润协调问题[j]. 哈尔滨工程大学学报，2007,28(7):818-821.

精品推荐

1进化博弈理论

进化博弈理论范文

精品推荐

扩展阅读

推荐期刊

生物进化

化工进展

天津化工

金色年华