美章网 精品范文 博弈论的方法范文

博弈论的方法范文

博弈论的方法

博弈论的方法范文第1篇

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路, 在上个世纪80 年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间, 涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90 年代之后, 有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物, 这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视, 是在2004 年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008 年10 月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度, 来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象, 对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行, 通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发, 来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题, 传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象, 也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。[ Www.]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素, 但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面, 来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想, 扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律, 调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况? 其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素, 正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具, 人们十分重视其方法论意义。

从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点, 自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究, 实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中, 许多传播模型十分典型地体现出这种情况。该书第一版介绍了35 个传播模式, 第二版介绍了66个传播模式。除了个别早期线性模式外, 在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说,研究当代传播模式离开了博弈的思维, 其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代, 在需要破除自然与社会科学鸿沟的时代, 谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响,人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论,并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视, 将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”, 进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年,但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意,原因是新闻传播理论界对博弈论尚不太熟悉,对博弈论的理解也参差不齐,甚至还存在部分抵触心理,致使研究成果的质与量不甚理想。新闻传播研究需要理论创新,对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论,对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上,在新闻传播研究领域都有用武之地,关键在于我们的观念。

参考文献

1.肯尼斯·赫文[美]、托德·多纳著:《社会科学研究的思维要素》,重庆大学出版社,2008年版。

2.施锡铨著:《博弈论》,上海财经大学出版社,2000 年版。

博弈论的方法范文第2篇

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路,在上个世纪80年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间,涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究。不能缺少博弈论的思想。

上个世纪90年代之后,有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物,这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视,是在2004年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008年10月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度,来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象,对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行,通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发,来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归人人际传播理论。说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题,传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象,也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素,但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面,来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性

德国著名数学家哥德尔1931年提出不完备性定理:第一不完备性定理――任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理――任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想,扩展研究视域,在新闻传播领域内最合适的地方。找到双方的契合点,从新的角度描述新闻传播现象与活动的规律。调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何。有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与

活动过程中,有没有相类似的情况?其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态。即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素,正如恩格斯所说的“平行四边形”合力作用。但归根结底的因素是生产力与生产关系的矛盾对立统一。博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此。博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具,人们十分重视其方法论意义。从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点,自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究,实际上相当于博弈模型。在我国较为流行的英国人丹尼斯・麦奎尔、瑞典人斯文・温德尔合著的《大众传播模式论》中,许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式,第二版介绍了66个传播模式。除了个别早期线性模式外,在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说。研究当代传播模式离开了博弈的思维,其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代,在需要破除自然与社会科学鸿沟的时代,谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响。人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论。并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视,将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”。进行专门的新闻传播学新领域探索。

博弈论的方法范文第3篇

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路, 在上个世纪80 年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间, 涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90 年代之后, 有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物, 这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视, 是在2004 年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008 年10 月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度, 来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象, 对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行, 通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发, 来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题, 传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象, 也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。[论文网 Www.LunWenData.Com]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素, 但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面, 来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想, 扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律, 调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况? 其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素, 正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具, 人们十分重视其方法论意义。

从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点, 自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究, 实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中, 许多传播模型十分典型地体现出这种情况。该书第一版介绍了35 个传播模式, 第二版介绍了66个传播模式。除了个别早期线性模式外, 在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说,研究当代传播模式离开了博弈的思维, 其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代, 在需要破除自然与社会科学鸿沟的时代, 谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响,人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论,并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视, 将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”, 进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年,但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意,原因是新闻传播理论界对博弈论尚不太熟悉,对博弈论的理解也参差不齐,甚至还存在部分抵触心理,致使研究成果的质与量不甚理想。新闻传播研究需要理论创新,对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论,对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上,在新闻传播研究领域都有用武之地,关键在于我们的观念。

参考文献:

1.肯尼斯·赫文[美]、托德·多纳著:《社会科学研究的思维要素》,重庆大学出版社,2008年版。

2.施锡铨著:《博弈论》,上海财经大学出版社,2000 年版。

博弈论的方法范文第4篇

所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

1.完全信息静态博弈:纳什均衡

完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's Dilemma)和“性别战”(Battle of theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈:子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈:精炼贝叶斯纳什均衡

在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International

Regimes(London:Cambridge University Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理 论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)

早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。

克拉斯纳用“性别战”博弈模型来描述基于权力的国际机制理论,既现实主义的国际机制理论。所谓“性别战”是指热恋中的一对男女安排业余活动的博弈:或者去看足球,或者去看芭蕾舞。

这里有两个纳什均衡,男女二人期望在一起,但到哪儿却是需要选择的。这里有一种先动优势(first-move advantage),即谁先采取行动。该博弈模型用以解释国际合作问题具有重要的启示意义。在该模式中,追求一致的努力使欺骗不再存在,实际上偏离协议的行为被视为非理性的。克拉斯纳指出,智力在解决合作问题上的作用下降了。而在机制形成与变迁中权力的决定性地位突出了。(注:Stephen Krasner,"GlobalCommunicationsand National Power:Life on the Pareto

Frontier",World Politics,1991,Vol.43,pp.336.)在这里,合作不是相互协调,而是一方对另一方的协调。在这方面,国际机制并未展示多少自主和弹性,但却常常是权力分配和伴随利益的关键性中介。克拉斯纳强调说,机制本身也可以成为权力的源泉。(注:Stephen Krasner,StructuralConflict:The Third World Against Global Liberalism(Berkelay:University of California Press,1985),pp.7-9.)因此,即使非常弱小的国家也会对某一问题领域的集体政策施加相应的影响。例如,在国际电讯联盟中,由于实行基于平等原则的一国一票制,小国可以参与集体决策并拥有相当的影响。如果国际机制没有重要的作用,行为体也就不必为确定国际机制的内容而激烈地讨价还价,在国际机制建立之后也不会继续进行“战斗”。(注:Stephen Krasner,"Global Communications and National Power:Life on the Pareto

Frontier",World Politics,1991,Vol.43,pp.351-353.)

而基欧汉则使用囚徒困境来分析基于利益的国际机制理论,即自由制度主义的国际机制理论。所谓“囚徒困境”,指的是两个犯罪嫌疑人作案被抓住,分别关在不同的房间里审讯。警察告诉他们,如果两个人都坦白(合作),则各判刑3年;如果都抵赖(合作),则各判1年;如果一人坦白而另一个抵赖(不合作),则坦白者释放,而抵赖者判4年。

在孤立的囚徒困境中,合作是几乎不可能的,因为行为者发现不合作是理性的。在国际合作的单一博弈中,每一方都有不合作的主导战略即背弃。如果双方放弃了自我理性的战略则结果更好,但这只能在一方期望未来合作可能性的情况下发生。机制的部分作用正是产生和促进这种期望。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge University Press,1997),

【编 者 按】.46.)

基欧汉明确指出,国际机制的功能理论建立在独特的环境前提下:活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益。该前提不可忽视,而正统的现实主义在批评基欧汉时往往忽略了这一点。国家之间确实存在共同利益,而国际政治并不完全是零和游戏,例如在国际政治经济学领域和七大工业国之间就存在这种情况。当然,国家之间拥有共同利益并不一定合作,共同利益的存在是合作的必要而非充分条件。合作意味着既有利益冲突又有互补利益。当行为体调整他们的行为以适应对方的实际或期望的倾向时,就会出现合作。(注:Keohane,"International Institutions:Two Approaches",International StudiesQuarterly,

1988,Vol.32,p.380.)合作是互相协调作为政治协调过程的结果出现的。(注:Robert Keohane,After Hegemony:Cooperation and Discord in the world Political

Economy(Princeton:PrincetonUniversity Press,1984),pp.52.)基欧汉认为,国家为追求共同利益而创立了国际机制。国家发现自己困在囚徒困境中,但由于机制为协议的达成提供了谈判的规则、原则、规范和决策程序的框架,即使自我中心主义者之间也可以相互合作。基欧汉用囚徒困境理论解释机制的作用,其出发点是不确定性(uncertainty)。一国对他国的选择是不确定的,因而错过了许多达成共同获益的机会或从已经达成的协议中抽身。而机制则向国家提供信息或降低信息成本,从而促进合作。(注:RobertKeohane,After Hegemony:Cooperation and Discord in theworldPoliticalEconomy(Princeton:Princeton University Press,1984),pp.245.)在囚徒困境中,监督安排的机制降低了双方的恐惧,使得合作更为顺利。机制多是在大的国际原则和规范框架中形成的,从而在问题之间建立“联系”,违背某种协定会有影响其他目标的可能。而且,机制促使政治关系的存续时间更长。所以,机制增加了环境的“反复出现”,从而使未来的期望挫败了背弃行为的发生。在囚徒困境中进行多重博弈,则合作增加。(注:Robert Keohane,After Hegemony:Cooperationand Discord in the world Political Economy(Princeton:PrincetonUniversity Press,1984),pp.76.)

基欧汉利用博弈论分析机制试图克服的集体行为问题,认为囚徒困境抓住了国际政治中许多问题的核心方面。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge University Press,1997),

【编 者 按】.44.)但是,许多学者如斯泰恩(Arthur Stein)、奥伊(Kenneth Oye)等则强调,博弈论的囚徒困境模式只代表了集体行动问题的一种,而机制与所有合作问题有关,博弈论 的应用是有限度的。

博弈论对我们认识国际机制具有重要的启示意义,但也确实存在某些问题。例如,博弈论把国家作为统一的理体,而忽略了国家内部的因素。而国内政治是在某些特定问题领域如贸易、环境、国际安全等影响国际机制的重要因素。(注:Andrew Kydd andDuncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.113.)实际上,应用到具体机制分析的博弈模型太少、太理想化。博弈论有四种基本的理论模型,对博弈过程的认识也是逐步深入的,但用于国际机制分析的主要是完全信息静态博弈,它关于单一行为体、完整信息、没有错误或错觉的论述被批评家认为是错误分析了国际政治的核心方面。例如,关于完美信息的论述忽视了传播和信息,而这正是自由制度主义机制理论的核心方面。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-TheoriticalAnalysis of International Regimes",in RegimeTheory and International

Relations,ed.Volker Rittberger(Oxford:ClarendonPress,1993),pp.134-135.)

从国际机制理论的角度而言,对完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈的应用还没有挖掘出来。博弈论也有自身理论的突破,双重博弈论重视不确定性,这与国际机制理论不谋而合。国际机制理论强调机制如何通过改变对他者的信念和期望来影响国家行为,认为信息和信念是国际机制的根本。博弈论也对信息与信念的影响越来越关注。机制促进共享的信念指出适合的协调点,从而便利纳什均衡的选择。而且,机制通过培养国家之间变化的信念而创造新的均衡。反之,如果不能发展和维持适当的信念,将导致机制的败落和博弈的失败。(注:Andrew Kydd and Duncan Snidal,"Progressin Game-Theoritical Analysis of International Regimes",in Regime Theoryand International

博弈论的方法范文第5篇

所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von  Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The  Theory  of  Games  and  Economic  Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperative  game)和非合作博弈(non-cooperative  game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static  game)和动态博弈(dynamic  game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

1.完全信息静态博弈:纳什均衡

完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's  Dilemma)和“性别战”(Battle  of  theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈:子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈:精炼贝叶斯纳什均衡

在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theories  of  International  

Regimes(London:Cambridge  UniversityPress,1997),pp.1-2.)

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theoriesof  International  

Regimes(London:Cambridge  University  Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert  Crawford,Regime  Theory  inthe  Post-Cold  War  World:Rethingking  Neoliberal  Approaches  toInternational  Relations(Dartmouth:Darmouth  Publishing  Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public  Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent  variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew  Kydd  and  Duncan  Snidal,"Progress  in  Game-Theoritical  Analysis  of  International  Regimes",in  Regime  Theory  and  International  

Relations,ed.Volker  Rittberger(Oxford:Clarendon  Press,1993),pp.112.)

早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。

克拉斯纳用“性别战”博弈模型来描述基于权力的国际机制理论,既现实主义的国际机制理论。所谓“性别战”是指热恋中的一对男女安排业余活动的博弈:或者去看足球,或者去看芭蕾舞。

这里有两个纳什均衡,男女二人期望在一起,但到哪儿却是需要选择的。这里有一种先动优势(first-move  advantage),即谁先采取行动。该博弈模型用以解释国际合作问题具有重要的启示意义。在该模式中,追求一致的努力使欺骗不再存在,实际上偏离协议的行为被视为非理性的。克拉斯纳指出,智力在解决合作问题上的作用下降了。而在机制形成与变迁中权力的决定性地位突出了。(注:Stephen  Krasner,"GlobalCommunicationsand  National  Power:Life  on  the  Pareto  

Frontier",World  Politics,1991,Vol.43,pp.336.)在这里,合作不是相互协调,而是一方对另一方的协调。在这方面,国际机制并未展示多少自主和弹性,但却常常是权力分配和伴随利益的关键性中介。克拉斯纳强调说,机制本身也可以成为权力的源泉。(注:Stephen  Krasner,StructuralConflict:The  Third  World  Against  Global  Liberalism(Berkelay:University  of  California  Press,1985),pp.7-9.)因此,即使非常弱小的国家也会对某一问题领域的集体政策施加相应的影响。例如,在国际电讯联盟中,由于实行基于主权平等原则的一国一票制,小国可以参与集体决策并拥有相当的影响。如果国际机制没有重要的作用,行为体也就不必为确定国际机制的内容而激烈地讨价还价,在国际机制建立之后也不会继续进行“战斗”。(注:Stephen  Krasner,"Global  Communications  and  National  Power:Life  on  the  Pareto  

Frontier",World  Politics,1991,Vol.43,pp.351-353.)

而基欧汉则使用囚徒困境来分析基于利益的国际机制理论,即自由制度主义的国际机制理论。所谓“囚徒困境”,指的是两个犯罪嫌疑人作案被抓住,分别关在不同的房间里审讯。警察告诉他们,如果两个人都坦白(合作),则各判刑3年;如果都抵赖(合作),则各判1年;如果一人坦白而另一个抵赖(不合作),则坦白者释放,而抵赖者判4年。

在孤立的囚徒困境中,合作是几乎不可能的,因为行为者发现不合作是理性的。在国际合作的单一博弈中,每一方都有不合作的主导战略即背弃。如果双方放弃了自我理性的战略则结果更好,但这只能在一方期望未来合作可能性的情况下发生。机制的部分作用正是产生和促进这种期望。(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theories  of  International  

Regimes(London:Cambridge  University  Press,1997),

【编  者  按】.46.)

基欧汉明确指出,国际机制的功能理论建立在独特的环境前提下:活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益。该前提不可忽视,而正统的现实主义在批评基欧汉时往往忽略了这一点。国家之间确实存在共同利益,而国际政治并不完全是零和游戏,例如在国际政治经济学领域和七大工业国之间就存在这种情况。当然,国家之间拥有共同利益并不一定合作,共同利益的存在是合作的必要而非充分条件。合作意味着既有利益冲突又有互补利益。当行为体调整他们的行为以适应对方的实际或期望的倾向时,就会出现合作。(注:Keohane,"International  Institutions:Two  Approaches",International  StudiesQuarterly,

1988,Vol.32,p.380.)合作是互相协调作为政治协调过程的结果出现的。(注:Robert  Keohane,After  Hegemony:Cooperation  and  Discord  in  the  world  Political  

Economy(PrinCETon:PrinCETonUniversity  Press,1984),pp.52.)基欧汉认为,国家为追求共同利益而创立了国际机制。国家发现自己困在囚徒困境中,但由于机制为协议的达成提供了谈判的规则、原则、规范和决策程序的框架,即使自我中心主义者之间也可以相互合作。基欧汉用囚徒困境理论解释机制的作用,其出发点是不确定性(uncertainty)。一国对他国的选择是不确定的,因而错过了许多达成共同获益的机会或从已经达成的协议中抽身。而机制则向国家提供信息或降低信息成本,从而促进合作。(注:RobertKeohane,After  Hegemony:Cooperation  and  Discord  in  theworldPoliticalEconomy(PrinCETon:PrinCETon  University  Press,1984),pp.245.)在囚徒困境中,监督安排的机制降低了双方的恐惧,使得合作更为顺利。机制多是在大的国际原则和规范框架中形成的,从而在问题之间建立“联系”,违背某种协定会有影响其他目标的可能。而且,机制促使政治关系的存续时间更长。所以,机制增加了环境的“反复出现”,从而使未来的期望挫败了背弃行为的发生。在囚徒困境中进行多重博弈,则合作增加。(注:Robert  Keohane,After  Hegemony:Cooperationand  Discord  in  the  world  Political  Economy(PrinCETon:PrinCETonUniversity  Press,1984),pp.76.)

基欧汉利用博弈论分析机制试图克服的集体行为问题,认为囚徒困境抓住了国际政治中许多问题的核心方面。(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theories  of  International  

Regimes(London:Cambridge  University  Press,1997),

博弈论的方法范文第6篇

所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

1.完全信息静态博弈:纳什均衡

完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's Dilemma)和“性别战”(Battle of theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈:子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈:精炼贝叶斯纳什均衡

在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International

Regimes(London:Cambridge University Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)

早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。

博弈论的方法范文第7篇

关键词: 混合无线网络; 网络选择; 博弈论

中图分类号: TP391.41

文献标志码: A

文章编号: 2095-2163(2016)06-0141-03

0引言

近年来,随着人们对无线网络连接需要的日益增加,适用于不同工作情况与使用环境的无线网络接入技术得到了飞速的发展。这些技术的提升进步满足了人们随时随地能够接入到无线网络中的理想诉求。人们使用的无线网络连接设备,如笔记本电脑、平板电脑、手机等,往往同时配备了多种满足不同通信需求的无线网络接入技术,如适用于近距离通信需要的Zigbee、Bluetooth,以及适用于中远距离通信需要的WiFi、WiMax、2G、LTE等。而且,同一地区被多种无线网络覆盖的情况也大大增加了,如办公室、商场或者是家中,这些区域往往普遍配设有无限局域网络与蜂窝网络,而蜂窝网络常常也是由多家移动网络服务商各自优化后、且分别提供的,如中国移动、中国联通等,如此这般的多种无线网络接入技术共存的情况被称为混合无线网络。综上可知,在此背景环境中,人们所能选择的无线网络的数量也必然增加。根据使用环境的各异以及用户需求的不同,人们在选择移动设备所要连接的无线网络时将会综合考虑多种因素,如网络的稳定性、网络能提供的带宽以及使用网络需要付出的代价等。网络选择中的基本问题就是研究在多种无线网络共存的情况下,人们(设备)如何根据自身的需要,选择出最合适的无线网络,以及在选择过程中设备更换无线网络的行为趋势。为了分析解决混合无线网络中不同无线接入技术的选择问题,目前已提出了多种方法,如文献[1-2]提出的最大化用户效用的选择方法,文献[3-5]提出的基于多种属性满足的决策制定方法等等。博弈论作为一种数学工具,常常用于研究分析在人们根据自己的情况选择出最有利的策略时,参与者的行为变化趋势以及不同参与者之间相互影响的情况。在无线网络的研究中,由于博弈论在分析无线网络设备选择不同通信策略时其所获得的收益情况与各个设备行为特点上的优势,越来越多的工作利用博弈理论来解决混合无线网络中的网络选择问题[6-7]。本文总结了目前一些利用博弈理论来解决混合无线网络中的网络选择问题的文章,给出了博弈理论在解决这类问题时的一般方法。

[JP3][BT4]1博弈论的基本概念以及网络选择问题的博弈模型[JP]

[BT5]1.1博弈论的基本元素

在博弈理论中,博弈是由博弈的参与者、参与者所能选择的策略的集合、每个参与者选择某种策略时所获得的收益而构成的优选进化过程,过程中包含着3个基本元素,现对其进行如下定义描述。

1)参与者。博弈中能够选择自身策略的单位,可以是某一个体、也可以是某一群体,其目标是通过选择某种策略以使自己收益最大化,当目标为削减成本时为最小化。

2)策略集。策略集中包含了参与者能够选择的所有策略,每轮博弈时参与者将在其中选择一个以指导自己的行为。

3)收益。参与者选择某个策略时所能获得的效用,该效用由参与者选择的策略与其他参与者选择的策略共同决定。

[BT5]1.2博弈结果描述方法

具体地,针对存在多个参与者的博弈描述中,每个参与者将根据收益的大小采取不同的策略,同时某个参与者采取的策略也将影响到其他参与者的收益。当博弈重复进行的时候,各参与者是否可以最终达到某一平衡状态,即参与者是否可以找到一种最合适的策略,使得博弈终止。博弈是否能够终止,以及何时达到终止是博弈论中的重要研究部分。下面将调引最常用的描述博弈终止的状态定义,即纳什均衡状态。

纳什均衡状态用于描述这样一种情况,即在一个博弈中,所有的参与者都选择好自己的策略后,如果任意一个参与者都不能在其他参与者保持所选策略也不变的前提下,通过改变自身采取的策略使得自己的收益增大。这时,就可说系统达到了纳什平衡状态。

如果博弈的参与者用集合N={1,2,…,n}来表示,参与者可以选择的策略用集合S来表示,参与者i所选择的策略用si来表示si∈S,那么s*={s1*,s2*,…,sn*}为纳什均衡,当且仅当对任意的i∈N,存在:

[HT5SS]ui(s*i,s*-i)≥ui(s'i,s*-i)[JY](1)

其中,s*-i表示除了参与者i以外其他参与者所选择的策略,ui()为参与者的收益计算函数。并不是所有的博弈均存在纳什均衡;同时,有的博弈可能存在多个纳什均衡。

[BT5]1.3网络选择问题的博弈模型

网络选择问题存在3种博弈情况。对于每种博弈情况,现做出分析概述如下。

1)用户与用户之间的博弈。这种情况下,博弈的参与者均为需要使用无线网络的用户,多个无线网络用户将分享若干个无线网络接入服务,每个用户所能选择的无线网络接入点就是用户所能采取的策略。用户通过选择不同的无线网络接入点来最大化自己的收益或者最小化自己使用无线网络服务所需支付的代价。

2)无线网络服务商之间的博弈。这种情况下,博弈的参与者为能够向用户提供无线网络服务的各个网络服务商。各个无线网络服务商通过采取不同的自费策略来吸引更多的用户选用自己的无线网络服务,从而达成最大化自己收益的目的。

3)无线网络服务商与用户之间的博弈。参与者分别为无线网络服务商与用户。服务商通过选择不同服务资费标准与服务对象来最大化自己的收益,而用户则通过选择不同的服务商来最大化自己可能获得的网络效用。

[BT4]2博弈论在网络选择问题上的主要研究情况

[BT5]2.1用户与用户之间的博弈

文献[8]将网络选择问题描述为各个自利用户之间的非合作博弈,并使用拥塞博弈模型来研究用户的行为情况。在该博弈中,用户可以在多个可用的无线网络的不同频段中选择其中之一进行连接,在选择某个网络后,该用户将会造成一定程度的网络拥塞,同时用户需要为其造成的拥塞支付费用,而费用的高低将由网络当前的拥塞程度决定。作者形式化地给出了网络拥塞程度的描述以及用户所需支付的费用。实现过程是将该用户的网络选择情况用一组布尔值来设定其表示,如表示用户u是否选择了a网络的布尔值bua。当用户u选择了网络a时,bua=1,如果没有选择网络a,bua=0。此后,研究利用整数规划的方法求解了该博弈的纳什均衡策略。

文献[9]利用演化博弈模型来研究用户的网络选择问题。演化博弈在传统的博弈理论中加入了种群的概念,种群用于表示一组相同类型的用户,种群中的用户可以改变自己的策略以使种群的总体收益增加,或者使种群中其他用户改变自己的行为,以达到收益均衡的目的。项研究利用了演化博弈中的复制动态来研究一群同类用户的行为变化情况。复制动态用来表示种群中选择不同策略的用户的比例的变化情况,数学上是利用常微分方程来构建表示, 其对应公式为:

[HT5SS]x・i(t)=xi[fi(t)-(t)][JY](2)

其中,xi表示种群中采用策略i的个体占种群全体的比例,xi=ni/N,ni为选择i策略的用户的数量,N表示种群中用户的总数量。fi(t)表示参与者选择策略i所获得的收益,(t)表示该种群中所有参与者获得的平均收益。

文献[10]描述了装备有多种无线网络通信技术的设备,在不同网络之间切换服务,以达到自身获得的网络吞吐量最大的目的。文章给出了2类不同的无线网络技术的带宽分配模型,全面分析在了每种无线网络技术下用户的行为变化情况,给出了用户最大化自身收益的算法,并证明了在同种无线通信技术内部切换无线网络基站的情况下,系统存在纳什均衡,即用户在经历有限的基站选择变化后,所有用户均将达到稳定状态,而无需继续改变自身的选择。

[BT5]2.2无线网络服务商之间的博弈

文献[11]提出了一个由4部分组成的用于分配管理无线传输资源系统框架,其中包括网络层分配、容量预留机制、用户接入控制以及连接层分配。作者将带宽分配问题描述为不同接入网络之间的博弈,同时在系统达到纳什均衡时,网络总效益最大。

文献[12]将2个独立的无线局域网之间的接入控制问题描述为多阶段的非合作博弈问题。该博弈中的参与者为2个无线局域网,而策略集则为用户发出的网络接入请求。博弈的结果给出了2个网络最大化自身收益时,网络接入请求在2个无线网络中的分布情况,

文献[13]描述了在多个无线网络共存的环境中,存在一个移动着的用户。为了保证负载平衡以及减少用户在各个网络的交接,作者提出了一合作博弈的方法。参与者为区域中各个可以被用户连接的无线网络,其策略集为用户使用每个网络的优先级。每个候选网络的收益为当前网络负载、预定负载界限与网络惩罚权重的函数。博弈的目标是使每个候选网络的收益值最大。

2.3无线网络服务商与用户之间的博弈

文献[14]利用将无线网络服务商与用户之间的竞争描述为双方博弈的方式,提出了一种防止拥塞的控制机制。作者提出框架包括2个博弈,其中一个为接入控制博弈,另一个为负载控制博弈。接入控制博弈利用了经典的囚徒困境模型,参与者为各种用户-服务商对。每一种服务请求代表了每个参与者具有2个策略选择的博弈。服务商可以接受或者拒绝服务请求,而用户可以选择继续接受服务或者停止接受当前服务商的服务。作者讨论了该博弈的纯策略纳什均衡的存在情况。在负载控制博弈中,用户在不停止传输的情况下选择是否离开当前服务商,而服务商也可以选择是否终止提供服务。文章表明当服务商同时运用2种策略时,得到的收益将会达至最大。

[BT4]3结束语

本文总结了当前利用博弈理论分析解决混合无线网络中网络选择问题的一些代表性工作。值得注意的是,在利用博弈论解决该问题时,不能仅停留在判断是否存在纳什均衡的层面上,还需对如何达到纳什均衡进行研究。博弈论分析了混合无线网络中的参与者在为了最大化收益时的行为情况,为提出更加有效的网络选择方案作出了有益、且实用的贡献。

参考文献:

[1]

BARI F, LEUNG V. Use of nonmonotonic utility in multi-attribute network selection[C]//Processings of Wireless Telecommunications Symposium 2007. Pomona:IEEE, 2001:1C8.

[2] NGUYEN-VUONG Q T, GHAMRIDOUDANE Y, AGOULMINE N. On utility models for access network selection in wireless heterogeneous networks[C]//Processings of Network Operations and Management Symposium 2008. Salvador: IEEE, 2001:144-151.

[3] WANG L, BINET D. TRUST: a triggerbased automatic subjective weighting method for network selection[C]//Processings of Fifth Advanced International Conference On Telecommunications 2009. Venice:IEEE, 2009: 362-368.

[4] BAKMAZ B, BOJKOVIC Z, BAKMAZ M. Network selection algorithm for heterogeneous wireless environment[C]//Processings of IEEE 18th International Symposium on Personal, Indoor and Mobile Radio Communications 2007. Athens:IEEE, 2007: 1-4.

[5] BARI F, LEUNG V. Automated network selection in a heterogeneous wireless network environment[J]. Network, IEEE, 2007, 21(1): 34-40.

[6] STEVENSNAVARRO E, WONG V W S. Comparison between vertical handoff decision algorithms for heterogeneous wireless networks[C]//Processings of Vehicular technology conference 2006. Melbourne:IEEE, 2006: 947-951.

[7] ZHANG W. Handover decision using fuzzy MADM in heterogeneous networks[C]//Processings of Wireless Communications and Networking Conference 2004. Atlanta:IEEE, 2004: 653-658.

[8] MALANCHINI I, CESANA M, GATTI N. Network selection and resource allocation games for wireless access networks[J]. IEEE Transactions on Mobile Computing, 2013, 12(12): 2427-2440.

[9] NIYATO D, HOSSAIN E. Dynamics of network selection in heterogeneous wireless networks: an evolutionary game approach[J]. IEEE Transactions on Vehicular Technology, 2009, 58(4):2008-2017.

[10]ARYAFAR E, KESHAVARZ-HADDAD A, WANG M, et al. RAT selection games in HetNets[C]//Proceedings of INFOCOM 2013. Turin:IEEE, 2013:998-1006.

[11]NIYATO D, HOSSAIN E. A noncooperative gametheoretic framework for radio resource management in 4G heterogeneous wireless access networks[J]. Mobile Computing, IEEE Transactions on, 2008, 7(3):332-345.

[12]CHARILAS D E, MARKAKI O I, VLACHEAS P T. Admission control as a noncooperative multistage game between wireless networks[C]//Processings of Systems, International Conference on Signals and Image 2009. Chalkida:IEEE, 2009: 1-5.

博弈论的方法范文第8篇

关键词:群体决策;信息集结;博弈论;信息获取;审议;透明性

一、引言

群体决策的研究涉及多个学科,不同学科对群体决策的研究所采取的方法和着重点不一样。在经济学、政治学、管理学领域对群体决策的研究侧重于偏好的集结,较少考虑影响偏好形成的潜在背景信息。其中社会选择理论与公共选择理论利用数学分析的方法和福利经济学的一些基本原理,研究如何“公平合理地”将群体成员的偏好集结为群体的偏好并据以作出群体的选择,这方面的研究源于Condorcet投票悖论的提出,从20世纪50年代开始经过Arrow、Sen、Gibbard和Satterthwaite等人的进一步发展,已形成完整的理论体系,通过对理性社会选择本质的剖析,促进了人们对选举、立法以及政治机构运作等问题的理解。

在管理科学领域,对群体决策的研究主要强调如何通过对群体成员以不同形式表达的偏好的集结,使得群体成员就最终决策达成某种程度上的一致,而一致性则意味着“正确性”,这方面最具代表性的是社会决策图式理论。

在社会心理学领域对群体决策的研究主要采用实验性方法,通过对群体成员之间交互过程的分析研究群体决策的信息集结有效性,一般假定群体成员具有共同的目标,很少考虑决策过程中的策略,心理学研究的主要成果是对群体思维和群体极化现象的分析。

近年来国外出现了不少用博弈论作为理论工具研究群体决策信息集结问题的文献,这些文献主要发表于经济学、政治学与政治经济学期刊,通过对群体决策过程中群体成员的动机和理的分析,给出了一些与人们的直觉完全相反的结论。笔者将对此领域的研究进展从决策信息的获取、审议过程中信息的披 露、透明性的影响与最优决策规则四个方面进行评述。需要说明的是,这四个方面紧密关联,特别是决策群体成员的信息披露动机直接受到决策过程对公众是否透明以及最终的投票表决规则的影响,而群体成员的信息获取动机则部分地取决于信息披露动机,但由于利用博弈论分析群体决策问题的复杂性,现有的文献主要还是相对集中于其中的一两个方面。

文[1]是注意到此领域较早的综述性文章,该文发表于1999年,讨论了当时出现不久的研究政治机构信息集结作用的文献,其中对最先考虑策略性投票表决行为的文[2-5]等进行了简要介绍。同年9月份,《美国国家科学院院刊》发文评述了研究选举的信息集结作用及因投票者私有信息的不准确而导致的策略性投票表决行为的成果[6],其中提及的部分研究工作尚处于未发表状态。文[7]对研究货币政策委员会决策过程中的动机问题的文献进行了系统讨论。文[8]总结了货币政策委员会决策机制设计应该考虑的各种因素,对与群体决策相关的经济学与社会心理学理论与实验分析文献进行了评述,其中讨论了信息集结问题。应该说文[9]是目前评述基于博弈论的群体决策信息集结研究文献较为全面和细致的文章,该文从策略性投票、信息获取、利益冲突和交流四个方面进行了详细评述,并讨论了此领域的研究成果对货币政策委员会决策机制设计的参考价值。

本研究与文[9]的差别在于:第一,文[9]的讨论基本上局限于基于博弈论的群体决策信息集结研究本身,而笔者从研究方法、研究对象与研究成果等方面将基于博弈论的群体决策信息集结研究与经济学、政治学、管理学以及社会心理学领域对群体决策的传统主流研究进行了对比,分析了博弈论作为理论工具研究群体决策信息集结问题的优缺点,并深入探讨了现有研究工作存在的不足之处,也即指出了此领域可能的研究方向,因此,笔者的深度与广度有所超越。第二,文[9]对此领域研究成果的评述思路稍显混乱,文献分类较不合理。第三,笔者特别关注了研究决策过程的透明性对群体成员信息获取与信息披露动机以及投票表决行为的影响的文献,而文[9]对此几乎没有涉及。第四,文[9]发表后此领域出现了不少具有重要参考价值的文献,笔者对这些最新的文献给予了较为详细的评述。

二、决策信息的获取

(一) Condorcet陪审团定理与搭便车问题

与决策问题相关的各类信息一般以分散的、局部的形式存在于社会系统,群体决策的意义之一,是可能更充分地利用这些信息,因而更有可能作出正确的决策。不考虑其他因素,仅从信息集结的角度看,让更多拥有信息的个体参与决策可以改善决策质量,这种观点符合人们的直觉,其形式化证明出自18世纪Condorcet给出的陪审团定理。该定理认为:群体决策可以有效集结信息,在多数决定规则下,增加群体成员数量可以增加作出正确决策的概率,并且随着成员数量趋于无穷,作出正确决策的概率趋于1。

Condorcet陪审团定理及其后来的很多拓展往往都有个潜在的假设:群体决策者所掌握的与决策问题相关的信息是事前外部给定的,或是以零成本获得的[9]。但对于许多现实决策情形,信息并不是不需要投入成本和努力就能轻易得到的,如审稿专家需要付出一定的时间和精力才能决定稿件是否符合录用标准,因此决策者必须决定是否付出以及付出多少代价以获取信息。而在群体决策中,与决策问题相关的信息是公共物品,因而存在典型的所谓社会惰化(social loafing)现象或搭便车问题(freerider problem)。

文[10]对陪审团决策中的信息获取问题进行了研究,认为陪审员的信息准确程度取决于陪审团的大小,更大的陪审团的陪审员具有更少的动机认真听取审判过程,所以更大的陪审团作出正确判决的概率可能更小,从而导致陪审团定理不再成立。文[11-17]进一步研究了群体决策中的理性无知(rational ignorance)问题,对仍能有效集结信息时信息获取成本或成本函数需要满足的条件进行了分析,这些文献针对多数决定规则,假定所有群体成员具有完全相同的决策偏好。其中文[11,13-15]证明,当全体或部分群体成员的信息获取成本函数在获取零信息处的二阶导数为零,则Condorcet陪审团定理仍然有效。

另外,文[18]通过一个仅有两个成员的群体决策模型,指出群体成员间的交流可能会恶化信息获取中的搭便车问题。在该文中,决策成员首先收集关于一项工程实施后果的信息,然后相互交流,再投票表决是否实施该项工程。文章指出,如果交流的作用仅限于信息集结,则交流可能会减少作出正确决策的概率,特别是当高质量的信息很容易获得时,交流会减少决策成员收集信息的动机,加剧信息收集中的搭便车问题,但当信息收集需要付出高昂的代价时,更多的交流通常会增加作出正确决策的概率。

(二)搭便车问题避免措施

因为信息获取活动一般是不可观测的,搭便车者可以通过提供一个虚假的信息假装已经给予了足够的投入,所以无法通过有效的惩罚措施以阻止搭便车问题,只能够从决策群体的成员组成和决策规则等方面考虑避免该问题的发生。

文[19-20]的研究结论从决策群体人员组成方面为避免信息获取中的搭便车问题提供了理论参考,指出具有极端偏好的成员相对来说更具有收集高成本信息的动机,但这两篇文献的研究内容不属于严格意义上的群体决策,因为其中的委员会成员仅负责收集与报告信息,自身并没有决策权。在文[19]中,委员会成员在信息收集之前相互间没有偏好差异,在投入不可观测的努力收集信息后形成各自不同的政策偏好,该文证明最优的委员会规模和总的社会剩余有时会随委员会成员偏好差异期望值的增大而增大,因为预期的偏好差异为成员提供了收集信息的动机。文[20]指出,如果信息收集的成本较低,委员会成员的偏好应该与决策者的偏好类似,这是因为一方面与决策者偏好类似的成员会收集决策者想要的信息,另一方面由于偏好类似所以在报告时不会产生信息的扭曲问题;如果信息收集的成本较高,则委员会应该由具有极端偏好的成员组成,只有这些成员才具有足够强烈的动机付出代价收集信息,但因为信任问题,他们往往只会收集硬信息,即客观上可验证的信息。对于在投票表决前需要对决策选项进行审议的群体决策来说,文[20]的研究结论尤其具有参考价值。

从群体决策机制设计的角度看,如果存在信息获取问题,则机制设计者必须既要考虑如何提供充分的激励促使群体成员获取信息,又要考虑如何有效集结成员所获得的信息,以最大化群体决策的期望效用。

文[21]证明,采用适当保守的决策规则可以促进群体成员收集证据,从而改善决策质量。文[22-23]对存在信息获取时的群体决策最优规则与最优群体成员数量进行了研究。文[22]指出,尽管一致性规则使每个群体成员的投票选择对最终结果都具有决定性影响力,但一致性规则并不能为获取信息提供适当的激励,而且一致性规则特别不适合于信息较不准确的情形,也即更需要群体决策的情形,在只考虑单调纯策略均衡的条件下,除非群体成员的信息足够准确,否则一致性规则或接近于一致性规则的规则不可能最优。文[23]认为,为了提供足够的信息获取激励,对于相当普遍的决策情形,事前最优的决策机制事后可能是非最优的,即不必然利用了所有群体成员获取的信息导致从统计学角度有最优的信息集结,该事前最优的决策机制是在激励成员获取信息与最大程度提取成员信息之间折中的产物。需要指出的是,文[21-23]均假定决策群体成员具有相同的偏好。

三、审议过程中信息的披露

决策群体,尤其是规模较小的群体,一般会在投票表决前对决策选项进行审议,交流各自的私有信息。信息的共享能引起成员信念的收敛。但群体成员通常代表着不同的利益集体,具有不同的利益追求或偏好,因而具有操纵或隐藏私有信息的动机,从而限制了信息共享的可能性,成员间策略性的信息操纵与反操纵甚至导致比纯粹偏好冲突更大程度上的意见不一致。

绝大多数群体决策文献对审议(deliberation)、交流(communication)、辩论(debate)、廉价磋商(cheap talk)等类似表述用语没有进行明确的区分,虽然这些用语在不同场合有一些微妙甚至较大的差异,如文[24]认为审议是辩论的子集。

研究审议对群体决策的影响的文献一般将决策过程建模为两阶段博弈:先审议后正式投票表决,通过对贝叶斯Nash均衡策略和均衡存在条件的分析,研究审议是否以及如何对群体决策发生作用。这类文献一般假定无论是以公共利益还是以私人利益作为评判标准,好的决策选择总是部分取决于世界的真实状态,而世界的真实状态对决策群体成员来说无法确切知道,他们仅不对称地掌握了有关世界真实状态的部分信息。在正式投票表决之前的审议过程可以使群体成员有机会告诉其他成员他们所掌握的私有信息,然后,根据各自已掌握的关于世界真实状态的部分信息,群体成员形成自己对世界真实状态的判断,进而根据自己的评判标准形成各自的决策选择偏好,如果他们的决策选择偏好不一致,就有可能在审议的过程中不披露自己的真实信息,或提供虚假的信息以诱导其他成员作出对自己有利的决策选择。因此,此类文献注重从信息集结角度对完全信息披露均衡和完全信息集结均衡的分析。

Coughlan在文[25]中认为,当所有群体成员的决策偏好完全相同或足够接近,在审议过程中每个成员都具有真实披露私有信息的动机。文[26]则进一步证明,只要群体成员主观上认为多数成员与他拥有共同偏好具有较大的可能性,客观上的偏好差异不会影响信息的真实共享。然而,该文同时指出,审议并不总是能有效集结信息,特别是当群体成员没有较强的先验信念认为自己的价值取向就是群体主流的价值取向时,可能出现有意的相互欺骗。需要说明的是,在文[26]给出的模型中,所有群体成员的偏好或者完全相同,或者完全相反,与此相符的现实群体决策情形很少,甚至几乎没有。文[24,27-28]证明一致性规则在很多情况下为群体成员在审议过程中策略性地隐藏信息提供了动机,多数决定规则比一致性规则能引导出更多的信息共享。文[28]还证明,在相当一般的条件下,审议使得除一致性规则以外的所有其他规则具有相同的序贯均衡集合,也即审议使得所有的无否决权规则在序贯均衡方面等价,从而说明如果群体成员在投票表决前有向所有成员公开宣布各自私有信息的机会,那么采用除一致性规则以外的其他任何决策规则,都会产生相同的决策结果。文[29]对陪审团在审议阶段信息的披露进行了实验研究,以无约束力的意向性投票形式实现信息的交流,实验结果与理论分析基本近似。

另外,文[30]给出了一个两成员的交流与决策模型,两个成员投票表决是否组成具有不确定回报的合伙关系,他们的偏好不一致且为私有信息。文章分析了均衡的特征,发现在均衡时仅有部分信息被传递,交流对于双方的福利是有益的。

对于很多现实决策问题,决策者可能拥有客观上可验证的信息,即所谓硬信息(hard information)。文[31]对硬信息在具有偏好冲突的委员会中的交流进行了研究,证明完全信息集结均衡在偏好为私有信息的情况下比在偏好为常识情况下更有可能存在,即允许更大程度上的偏好差异;另外该文证明,如果信息可验证,完全信息集结均衡的存在条件等同于完全信息披露均衡的存在条件。文[32]指出,在审议阶段群体成员共享私有信息的动机一定程度上取决于其私有信息的可验证性,如果决策成员能够为自己的信息提供验证材料,则一致性规则比其他规则提供了更强的信息共享激励,更有可能实现完全信息共享。文章给出了在一致性规则下审议阶段存在完全信息披露均衡的充分必要条件。

文[33]指出,尽管偏好与信息的差异可能使得部分成员在审议过程中具有错误表达私有信息的动机,但给予群体成员适当的外部激励能消除此类动机,促进信息与偏好的完全集结,而且随着群体规模的扩大,外部激励的强度可以很小,外部激励的具体措施包括对成员决策能力的肯定等。

四、透明性的影响

随着社会的进步,公众对涉及自身利益的重要决策过程的透明性提出了越来越高的要求。透明的决策过程意味着公众可以评价决策群体成员的偏好、能力与贡献,从而引起决策者对自身声誉的关注,而对声誉的关注既可能促进信息的获取和真实信息的披露,但也有可能导致信息传递与投票表决行为的扭曲。

在文[34]中,委员会成员在前一时期表现出的决策能力影响了他在后一时期能否获得连任,而作为委员会成员可为其带来一定的效用。该文证明公开个人投票记录可以促进委员会成员努力获取信息。文[35]认为,仅公布最终决策结果,不公开个人投票记录,会诱导委员会成员按照现有偏见作出投票选择,因此,委员会的决策倾向于保守化,向公众公开成员的投票记录则能够减少现有偏见对决策的影响。该文同时认为,群体决策机制的设计应该不仅考虑决策过程的透明性,也要考虑决策规则的适当性,如果决策规则选择合适,则不透明的决策过程可能比透明的决策过程得到更好的决策结果。在文[34-35]所给出的模型中,都没有考虑委员会成员在投票表决前可能会相互交流各自的私有信息。

在文[36]中,委员会代表公众对一项新工程的实施与否进行表决,委员会成员既关心工程的实际价值,又关心委员会在公众中的声誉,如果维持现状,不实施新工程,则暴露出委员会成员意见的不一致,从而给委员会的声誉带来负面影响,而公众仅能注意到委员会的决策结果,事后不能观测到工程的实际价值。该文证明,在审议阶段,部分成员对声誉的过分关注可能使他们不愿真实披露私有信息,而是夸大工程的价值,导致更容易采取实施新工程的决策。文[37]认为,公开委员会的具体审议记录可能会降低决策质量。由于委员会成员关心公众对其决策能力的判断,使得他们在正式会议交流过程中可能隐藏内部存在的意见分歧,公众对于决策过程透明性的要求,可能导致委员会在正式会议之前组织秘密的非正式预备会议,将真正实质性的讨论从公开的正式会议阶段转移到秘密的预备会议阶段,从而对公众消除委员会内部意见的不一致,而非正式的会议更具有不稳定性,因此,透明性要求并不一定能增加社会福利。

在文[38-40]中,外部利益关联者可以观察到公开委员会每个成员的具体投票记录和决策结果,但对于秘密委员会则只能看到最终决策结果,而委员会成员既关心决策结果又关心外部利益关联者所给予的回报。文[38]和[39]认为,不公布委员会成员的个人投票记录可以减少外部利益关联者对决策的影响,在某些情况下秘密委员会优于公开委员会。文[39]还特别指出,由于随着群体成员数量的增加,单个成员的投票对最终决策具有决定性影响的概率减小,对单个成员而言不诚实投票的代价随之减小,所以对于公开委员会来说,其成员更容易因外部利益关联者承诺给予的回报而不诚实投票,因此Condorcet陪审团定理可能不再成立。在文[40]中,对于秘密委员会,外部利益关联者可以根据投票表决规则的阈值和最终决策结果对委员会成员的投票作出推断。文章分析了秘密委员会的最优决策规则,指出决策规则中增加选择某一选项需要的投票比例可能会导致该选项更容易成为最终决策结果,传统看法认为降低决策规则的阈值可以防止委员会过于保守的看法未必正确,但对于公开委员会则不存在此问题。文[41]虽然不是直接研究透明性,但其研究结论与此处内容相关,该文通过一个博弈模型,说明在特定情况下,外部利益集团可以不用付出任何代价就能操纵委员会的决策。

另外,不少文献从理论与实证两方面研究了决策过程的透明性对货币政策委员会决策的影响。文[7,42]对这方面的文献进行了综述。文[42]区分了三种类型的透明性:决策目标透明性;知识透明性,这里的知识指决策所依据的经济数据或经济模型等;操作透明性,包括委员会会议记录与投票记录的透明性以及决策结果的透明性等。该文评述的文献有部分运用了博弈理论作为分析工具。文[7]专门讨论了货币政策委员会决策过程中的动机问题,指出货币政策委员会的最优规模与透明性等仍有待进一步研究。

类似于文[34],研究透明性对货币政策委员会决策信息集结有效性的影响的文献,一般认为委员会成员希望得到社会公众对其决策能力或决策偏好的正面评价,从而获得连任的机会,如文[43]假设委员会成员希望公众认为他是通货膨胀的强硬抵制者,而最近的文献如文[44-46]等,则假设委员会成员希望公众认为他是具有较强决策能力者。文[44]认为,公开审议过程的详细记录会使得货币政策委员会成员不愿意表达不同的意见,该文通过对美联储联邦公开市场委员会在被要求公开会议记录之前和之后的会议记录的分析说明了理论结果的有效性。文[45-46]分析了投票记录的公开对委员会成员投票表决行为的影响,认为投票记录对公众的透明带来的负面效应占主导地位,透明性不能增加社会福利。

五、最优决策规则

显而易见,不同的决策规则极大地影响了群体决策的信息集结效率,尤其是决策群体成员的偏好或能力不完全一致时,决策规则更是直接影响了群体成员的投票选择行为,进而影响了决策结果的正确性。前述文献大多不同程度地讨论了决策规则的比较和选择,除此以外,另有部分文献对各种情况下的最优决策规则进行了研究。

文[47-48]从最大化期望效用的角度对固定规模的委员会形式集体决策的最优决策规则进行了分析,文[49-50]研究了在特定约束条件下的最优决策规则。然而,这些早期的文献都有个潜在的假设:决策成员仅按照自身获得的信息作出投票选择。文[2,51]等指出,即使决策群体成员的偏好完全一致,也不能保证一定能够如Condorcet陪审团定理所预测的那样有效集结各成员的信息,因为群体成员仅根据自身信息作出非策略性的选择不符合理性要求,当且仅当所使用的决策规则为集结群体成员私有信息的最优规则时,所有群体成员仅按自身信息投票才是Nash均衡,而最优决策规则则取决于特定的决策情形。

文[52]证明,当采用文[48]所定义的最优决策规则时,所有成员仅按照自身获得的信息投票表决形成Nash均衡,但仅按自身信息投票可能不是有效的,因为部分成员联合决定策略性投票可以增加期望效用。文[53]讨论了投票者对不同决策选项具有可用基数表示的效用时的诚实投票问题,试图给出当决策机制允许多种消息类型时诚实投票的准确定义。为使投票者具有诚实投票的动机,文[54]提出了一种在随机选择的投票表决集合上运用多数决定规则得到最终决策的方法,在对所有投票者的表决结果运用多数决定规则和仅对投票表决结果的随机抽样子集运用多数决定规则之间进行随机选择,可以激励投票者诚实投票,从而得到Condorcet陪审团定理的有效性收敛结果。

文[55]基于陪审员的私有信息和策略性表决行为构建了一个陪审团决策模型,证明一致同意规则可能会导致无辜被告得到有罪判决和有罪被告得到无罪判决这两种错误的概率都增加。文[56]分析了决策群体所投票表决的决策选项不独立于投票表决规则的情形:给定决策群体的投票表决规则,提案者向决策群体提出一个要么完全接受要么完全拒绝的议案,群体投票表决是接受还是拒绝该议案。该文证明由于一致同意规则能促使提案者提出更有吸引力的议案,所以增加了决策群体的期望效用,在某些情况下,一致同意规则甚至是Pareto最优的表决规则,因为它也增加了提案者的期望效用,即使提案者与决策群体的利益追求可能完全相反。总结考虑一致性规则的文献[22,24,27,28,32,55,56],可见博弈分析得到的结论往往与人们直观上的认识截然相反,一致性规则是不是合适的决策规则完全取决于特定的决策情形。

既然投票表决规则直接影响了投票者的投票选择行为,那么,对于群体决策机制的设计者来说,他在选择投票表决规则时是否需要考虑投票者在各种表决规则下的投票行为,换言之,机制设计者关于投票者在各种规则下的博弈行为的信念是否会影响到最优决策规则的选择。文[57-58]对此问题进行了研究,其中假设群体成员的决策偏好完全一致。文[57]分析了决策成员的能力存在差异且这种差异是常识的情况下的投票表决规则,指出最优的匿名单调投票规则并不取决于成员是否按照自身信息投票或策略性投票。类似于文[57]的结论,文[58]认为,决策机制设计者对最优投票表决规则的选择与机制设计者关于投票者在不同表决规则下的投票行为的信念无关,在该文中,机制设计者为决策群体选择投票表决规则,其目的是为了最大化决策群体的期望福利,文章证明,仅从信息集结的角度看,关于投票者在各种表决规则下的投票行为的不同假设对于最优决策规则的选择来说,结论是一样的,不同的行为假设导致相同的结论。对于具有相同偏好的决策群体来说,文[57-58]的研究结论大大简化了决策规则的选择。

现实中的决策群体往往存在具有极端偏好的成员,这些成员的存在为信息的有效集结带来较大的困难。文[59]对存在极端偏好者和中立者的群体面对二分决策问题时的最优决策规则进行了研究,考虑了决策成员之间存在转移支付的情况,指出最优投票表决规则相对于转移支付可能性的大小来说是非单调的。文[60]对由两类具有完全相反的偏好的成员所组成的委员会决策进行了分析,对比了一致性规则与非一致性规则的信息集结效率。文[61]给出了一个现实中较难接受的非单调性决策规则――超多数惩罚(supermajority penalty)规则,当选择某一选项的投票过多时,将该选项作为群体决策最终结果的概率反而会下降,该文证明,当对于每个选项都存在极端偏好者时,超多数惩罚规则是最优匿名激励相容规则。

前述文献都假定群体成员的偏好相互独立,而文[62]对群体成员具有相互关联但不完全相同的偏好的情况进行了分析,其中的决策选择空间是连续的,该文分别讨论了采用平均规则与中值规则时所对应博弈的对称贝叶斯Nash均衡的存在性问题,并比较了这两种规则在不同偏好关联程度下的性能。

由于从众心理,群体成员经常会根据对其他成员行为的观察相应调整自己的行为。文[63-64]对从众心理对群体决策的影响进行了研究,其中假定群体成员一方面希望选出好的决策选项,另一方面又希望自己成为胜出的一方。文[63]分析了群体规模较大时同时投票机制与顺序投票机制的均衡特征和信息集结质量,文[64]指出这种从众心理导致同时存在多个均衡,而且对于这些均衡中的多数,信息不能被有效集结。文[64]从某种程度上说明了最优决策规则设计的困难。

六、现有研究工作的不足之处

其一,社会选择理论与公共选择理论以及管理学领域对群体决策的研究,主要考虑偏好集结的有效性,而其中的偏好则是指对决策选项的偏好,这种偏好取决于决策者对最终结果的更根本意义上的偏好和对世界真实状态的信念。在现实社会中,纯粹以偏好的有效集结为终极目标的重要群体决策问题几乎不存在,例如社会选择理论与公共选择理论最重要的应用领域――选举,既是偏好集结(这里指更根本意义上的偏好),更是信息集结。仅考虑偏好的集结问题,不考虑偏好的形成过程以及信息在偏好形成过程中的潜在作用,无法分析群体内外部交流与互动等对决策的影响,无法解释现实中的很多现象,因而对相关决策机制设计的指导作用较为有限。

其二,社会心理学从认知的角度研究群体决策,其结论出自于对实验和经验数据的统计学分析,易于为人们接受。但由于从实验或经验数据中利用统计学方法推导出群体的偏好分布参数极为困难,所以无法深入研究群体决策过程中因偏好不一致而导致的隐藏与扭曲私有信息等策略。

其三,与社会选择理论和公共选择理论一样,用博弈论研究群体决策信息集结问题的文献也是以理性选择假设作为判断与决策的微观基础。尽管所有群体成员严格按照贝叶斯规则更新自己的信念等完全理性假设对于心理学家和普通人来说都是难以接受的,但博弈论文献还是以其数学分析的简洁与严谨颠覆了很多直觉上的认识,通过对群体决策者动机的分析,有助于我们理解决策机制的哪些方面可能会引起不利于决策目标实现的策略,进而有助于决策机制的改进。随着群体成员偏好差异程度和决策问题重要程度的增加,审议方式和决策规则趋向于书面化和正规化,群体思维与群体极化现象将很少出现,决策结果也将更接近于博弈分析的预测。

目前对群体决策信息集结问题的研究尚处于起步阶段,还有很多不完善之处,在某些方面甚至存在根本性的缺陷。

第一,可能是受到信息经济学研究的误导,本领域的很多理论与实验分析文献,包括一些奠基性的文献,混淆了信息与在信息基础上形成的判断。真实信息的披露不会引起其他群体成员以及公众对自己决策能力的负面评价,更不会如判断的披露那样引起认知上的从众,如果决策者掌握了确凿可靠的信息,则其不会因为其他人基于其他信息产生的不同看法而轻易改变自己的信念。

除个别文献外,现有研究群体决策信息集结问题的文献几乎都是将审议完全等同于信息经济学领域的廉价磋商,将交流限制为每个群体成员同时向所有其他成员发送一轮公开的消息。在现实群体决策过程中,审议至少包括对各方面提供的信息的真实性的审议,以及对信息与世界真实状态之间的逻辑关联(即潜在的决策模型)的审议。因此,将审议建模为完全的廉价磋商的现实意义极为有限,对于偏好差异较大的群体更是如此。

第二,客观上难以验证的信息的可接受性,取决于接收者对于信息发送者的偏好的信念,例如,人们有充分的理由怀疑垄断企业单方面提供的企业运营成本数据的真实性。另一方面,在很多情况下,信息的软硬程度(可验证程度)与信息获取者和信息接收者的成本投入相关。因此,群体成员获取可验证信息与不可验证信息的动机,以及群体成员对信息软硬程度的投入,既取决于是否有审议阶段以及审议方式和决策规则,也取决于群体成员的偏好和群体成员关于群体偏好差异程度的先验信念。诸如此类问题现有文献几乎没有涉及。

群体决策在现代社会无处不在,如政府部门对重大战略性问题的决策、公司董事会对重要项目投资与实施问题的决策、审判委员会对犯罪嫌疑人的判决、专家对科学基金项目申请书的评审等。从组织或社会的目标出发,针对特定的决策问题,为了尽可能作出正确的决策,应该如何组成决策群体,选择何种决策规则?此类群体决策的科学化与民主化问题很久以来一直是管理、政治、法律和经济等领域讨论的中心,其研究结果对于各类政治、社会、经济组织的运行机制设计具有重要的意义。

中国学者对群体决策的理论与方法进行了大量的研究,提出了不少新的概念和方法,作出了很多重要贡献,国家自然科学基金委员会对群体决策理论与方法研究也较为重视,曾将其列为优先资助领域。但根据现有的各类文献和历年的基金项目研究摘要,总体感觉国内对决策群体成员的动机和理考虑较少,到目前为止还没有发现国内其他学者利用博弈论研究群体决策信息集结问题。

笔者试图利用不完全信息博弈论和机制设计理论,研究决策群体成员的策略性信息获取、信息传递和投票表决行为,揭示决策群体人员组成、审议方式、决策规则、透明性等决策机制的各个方面对群体决策的信息集结有效性的具体影响。并试图从信息集结角度,为一些典型公共决策情形优化决策机制。

参考文献:

[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.

[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.

[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.

[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.

[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.

[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.

[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.

[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.

[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.

[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.

[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.

[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.

[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.

[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.

[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.

[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.

[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.

[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.

[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.

[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.

[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.

[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.

[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.

[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.

[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.

[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.

[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.

[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.

[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.

[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.

[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.

[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.

[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.

[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.

[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.

[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.

[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.

[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.

[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.

[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.

[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.

[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.

[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.

[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.

[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.

博弈论的方法范文第9篇

关键词: 最优化方法 合作博弈 分配模型

在社会发展过程中,水资源已成为影响区域发展的重要资源,流域范围内水资源利用的冲突,归根就是各利益主体的水资源开发利用和水环境保护合作问题。解决流域环境问题冲突时,排污权分配是一个重要问题,一般以多目标优化模型为技术手段,以达到流域全局最优策略;但各个主体的既得利益也不能忽视,如何通过谈判达到多赢效果也是一个重要问题。因此,博弈论也被广泛应用于流域内的排放、分配问题的研究。污水处理厂作为我国常见的排污个体,由于种种原因仍处粗放式管理,同一流域的污水处理厂,可能存在地域性的不公平,未能达到整体的最优化。本研究从这个角度切入,通过建立最优化-合作博弈模型,研究了同一流域内不同污水处理厂的排污量分配及利益分配方案,实现区域整体最优化,并通过利润再分配减少了各参与主体的成本。

1 文献综述

目前我国在控制改善环境质量方面,污染物总量控制制度发挥着重要作用。基于总量控制下的河流排污权分配,我国学者利用优化模型进行研究,如陈阳[1]等研究了一种基于相互补偿的协商分配模型。刘首文[2]等、黄国如[3]等以基本遗传算法求解多个排放口的最优化处理问题。王艳[4]运用最优控制原理与博弈论,研究了流域水环境管理的区域间自愿合作协商促进机制。刘红刚[5]等采用合作博弈论方法,建立了在给定污染物总削减比例条件下各区域环境合作的博弈模型。在国外方面,Deininger[6]使用线性规划方法研究了在保证预设水质要求的条件下污染负荷的最优分布。Liebman和Lynn[7]、Shih[8]使用动态规划识别了污染负荷沿着一条河流的最优分布。Loucks等[9]建议对于同一类问题推广线性规划方法。Ecker[10]提出了一个几何规划模型,并用于在维持现状溶解氧水平的基础上优化河流污染负荷分配,以达到处理费用最小化。CardweIJ和Ellis[11]提出了一种最优化模型,用于在考虑参数不确定性和模型不确定性的清况下,进行多个点源的污染负荷分配。总体来说,国外对环境冲突问题的研究日渐深入,博弈论在国外环境科学领域的研究成果非常丰富,提出过包括流域污染微分博弈的旁支付方法、流域污染多阶段超级博弈模型等方法,几乎博弈论的每一个最新成果,在环境问题中都能找到应用实例。

2 区域污染物排放量最优化分配模型

2.1 问题提出

假设某一流域存在n个排污口,如n个污水处理厂。将每个排污口作为整个博弈系统的一个参与者,则所有的参与者形成一个集合I 。在给定集合I排放总量情况下,如何分配集合内部各参与者(排污口)之间污染物排放量,并尽可能使其节约成本。其中,不同的参与者用i(i =1, 2, ..., n)表示,其排放量用s表示,各排污口的处理率为η。

由于η为各排污口的处理率,因此可将ηi称为各个参与者(排污口)i的处理策略,将I=(n1,n2,...,nn)称为参与者的策略集。

通常,各污水处理厂的污水处理费用,也就是参与者i的成本可以用下式来表达:

区域内总排污成本为:

其中,M表示处理成本,η表示污水厂的处理率,q表示流量,a、b、c分别为参数,具体由于各地区不同工艺设备、成本控制、排污流量等因素而产生差异,需通过具体调查确定。对于同一污水处理厂,若当地管理者要求污染物削减量越大时,则要更大幅度地提高污染物的处理率,以达到更高的治理要求,则处理成本Mi越高。

一般来说,在形成合作联盟之前,各个参与者间无好的信息交流或合作协议,较为公正的排污分配方案是统一采用平均分摊法,例如,每个排污口都采取相同处理率。此时则有:

其中,上标N代表为非合作状态。式2-4即为采用平均分摊方案情况下的总成本。

平均分摊对于每个参加者来说或许是公平的,但这其实是因各参与者间缺乏信息共享、没有形成统一联盟,而形成一个整体高成本的Nash均衡的博弈结果,即所谓的“囚徒困境”。根据合作博弈理论,其结果必定符合Pareto最优,通过形成协议联盟进行合作,降低总体成本,获得额外利益,并进一步将收益公平合理分配,从而使各个参与者合作后的成本都低于合作前的成本,这种做法是完全可以实现的。

当采取合作时,则总体成本存在最优化模型:

其中,约束条件(2-6)表示进行区域合作后的排污量必须到达规定排污量削减指标。约束条件(2-7)表示处理率的范围在0-1之间。

此外,根据合作博弈的定义,该联盟合作后的成本必须小于合作前各成员单干的成本,否则该联盟的形成就没有意义。因此还有下式成立:

2.2 优化模型解析解

3 合作博弈分配模型

3.1 优化模型存在问题

经过优化模型分配后的排放量,虽然在整体经济效益上最优的,但对于参与的各个成员来说,则未必最优。最优化的结果通常为大部分参与成员成本下降,某些参与成员反而成本上涨。因此对这些成员来说,他们没有真正参与合作的动机,联盟也就不能成立。因此,要保证联盟成立,统一优化过程可行,还需进一步对联盟得到的利润进行科学合理的分配,使每个参与成员的成本在参与联盟后都比参与前有所降低,确保联盟合作的可行性。

在这个联盟中,Z(I)是所有参与者都参与的大联盟,同时,任意参与者都可能会形成一个子联盟,该子联盟是大联盟集合I的真子集。因此,若存在n个参与者,则共可以形成2n个子联盟。设某个参与者的子集合K形成的博弈联盟为Z(K)。

定义V为联盟所获得的收益,则V(I)为大联盟所获得的收益,V(K)为子联盟所获得的收益。用pi表示参与成员i从联盟最大收益值中V(I)应获得的利润,集合P=(p1,p2,…pi)称为该合作博弈的分配策略。根据合作博弈的定义,pi应同时满足以下两个条件:

(1)整体合理性:

即每个参与者所分配到的额外收益,等于整个合作联盟比合作前增加的额外收益的总和。

(2)个体合理性:

即每个参与者参与联盟后得到的收益,应当高于他未参加合作时(即单干时)所获得的收益,否则该成员没有参与联盟的动机。

3.2 博弈模型的求解

因此,要对合作联盟得到的利润进行合理分配,就是要求解满足上述条件的pi的过程。合作博弈模型的求解方法比较多,本文主要选择Shapley值法与核心法,分别进行求解。

对于一个联盟来说满足式(3-1)及式(3-2)的分配方案有很多种,在一般情况下,或在强有力的约束协议下,只要满足上述两式条件的分配方案都可以被参与成员接受。但是如果联盟协议的约束力并不强,并假设所有参与者都追逐最大利益的情况下,则还要考虑子联盟的情况。若有数个参与者发现当他们组成一个小联盟后,获得的收益比参与大联盟时要更高,这样他们就不会参与大联盟,而形成收益更高的小联盟了,而大联盟也就随之不能成立。因此,在这种情况下,大联盟的分配必须保证每个成员的的收益都高于他任何可能参与的小联盟的收益,才能保证大联盟的稳定性。

由于核心是满足以上所有条件的解集,因此理论上来说核心内的解才是最符合联盟收益最大化的。从满足整体合理性及个人合理性的角度来说,以核心作为分配策略才最为合理。但遗憾的是,由于要求过高,核心的解集往往是空集,从而大大限制了核心法的运用,因此只能寻求其他的妥协方法进行求解,从而求得到相对公平的分配策略。

Shapley值法是一个重要的求解方法之一,其可确保得到合作博弈的唯一解。其结果可能在核心集合内,也可能在核心集合外,但能保证存在唯一解。事实上,Shapley值法是对于该博弈联盟的每个参与者,考察其对所有可能存在的子联盟的贡献率及其概率大小,按照该贡献率给出参与者在联盟博弈中的一个分配方式。Shapley值由特征函数V确定,特征函数V即该联盟合作后获得的额外利润。由于当联盟中仅存在一人时,即相当于该参与者单干,因此他采取的策略仍为平均分摊法时的策略,即η。由此可知,当联盟K为单参与者i时,V(i)= 0。

综上所述,根据最优化结果得到的分配方案建立的博弈模型,是以求解分配方案P=(p1,p2,…pi)为目标。首先必须求得联盟的特征函数V,包括大联盟I的特征函数,以及所有子联盟K的特征函数。随后根据式(3-3)(3-4)(3-5),寻找该博弈模型的核心,看是否为空集。

一般情况下都采用Shapley值法进行求解博弈模型,因其是根据成员贡献来进行收益分配,且一定有解,解可能在核心集合内。Shapley值法可根据以下公式进行求解:

上式中,Pi即为Shapley值。|K|为博弈联盟K所含的元素个数,V(K)表示包含参与者i的联盟K的博弈特征函数,V(K\i)表示在联盟K中,若将参与者i除去后,剩余参与者组成的博弈联盟的特征函数。

4 研究案例

4.1 案例现状及参数选取

本研究选用粤西阳春市漠阳江流域。参考《粤西水质保护规划》,根据不同规划年限城镇生活污水处理率的要求,综合考虑水污染源预测结果、污水处理厂建设规划现状、削减量,提出的漠阳江流域城镇污水处理工程建设方案中的重点规划项目,漠阳江上游的春湾污水处理厂于2010年新建,处理规模1.0万t/d,2020年将扩建至2.5万t/d;合水污水处理厂于2010年新建,处理规模1.0万t/d,2020年将扩建至1.5万t/d;春城污水处理厂与2010年扩建至规模4万t/d,2020年将扩建至8.0万t/d。本研究将采用以上污水处理厂2020年数据。

根据上级单位分配给阳春市的“十一五”COD排放总量,规划提出近年内COD目标总量控制方案,见下表。

表4-1 漠阳江阳春市流域COD总量控制目标

本研究采用2020年COD允许排放量数据进行计算。

此外,由2.1节可知,污水处理厂的处理率参数a、b、c,具体由于各地区不同工艺设备、成本控制、排污流量等因素而产生差异。根据文献调查,式(2-5)中的污水处理参数a=200,b=1000,c=0.8,污水处理厂进水COD浓度为650mg/L。

4.2 最优化方法求解排污量分配

根据上节,至2020年时三个污水处理厂运行规模,可以算出每个污水处理厂的平均排污流量(春湾污水处理厂为1,合水污水处理厂为2,春城污水处理厂为3,下同)及COD产生量。又根据表3-2,由于2020年该流域内COD允许排放量为6686t,因此总的COD处理率应至少达到0.77。在形成合作之前,为公平起见,每个污水处理厂都采取相同的处理效率,即都采取77%的削减率,这能达到管理者的要求。在这种情况下,根据式(2-1),各厂的成本分别为:

即,1号参与者采用0.56的处理率,2号参与者采用0.52的处理率,3号参与者采用0.88的处理率时,可以使总成本达到最小。相比起采用平均分摊法的策略,总体成本共节省了45.45万元。

但是如果直接采用这种方法的话,会使1号、2号参与者的成本有较大的降低,而使3号参与者的成本有较大的提升,这样3号参与者必定不会同意这种联盟的实现。因此,为了使得合作顺利实现,必须对合作带来的收益(即经集体规划后节省下来的资金)用合作博弈模型重新进行分配,使各个参与者在参加联盟后都有所收益,才能保证联盟的顺利进行,保证最优化分配的可行性。

4.3 合作博弈模型求解分配方案

5 结语

本论文对在同一流域的不同排污口之间的排污量最优化分配模型及成本分配的合作博弈模型上进行了研究。以同一流域内的不同排污口为基础,为改变平均分摊法导致成本较高的弊端,在达到管理者要求的处理率的前提下,以总体成本最小为目标,建立了排污口处理率分配优化模型,并通过数学方法,求得了该二次规划问题的解析解。由于最优化的结果通常为大部分参与成员成本下降,而某些参与成员反而出现成本上涨,因此这些成员没有真正参与合作的动机,联盟也就不能成立。为保证联盟成立使得统一优化过程可行,通过建立合作博弈的模型,并使用核心解法及Shapley值法,进一步对联盟得到的额外收益进行科学合理的分配,使得每个参与联盟成员的成本都比参与前降低。根据粤西漠阳江流域阳春市范围内的春湾、合水、春城三家污水处理厂,以当地管理者提出的COD排放总量控制要求,用合作实例用模型进行了验证分析。在满足COD最大允许排放量的情况下,通过组成统一联盟,进行处理率最优化,以及采用合作博弈进行收益分配后,春湾、合水、春城三家污水处理厂分别采用56%、52%及88%的处理率,取代之前的平均分摊法,使得处理成本分别比合作前降低了11.79、10.69及22.97万,分别占总成本比例的4.01%、5.56%和3.86%。可见,通过合作降低成本的做法是有效的。

【参考文献】

[1] 陈阳,赵勇,肖江文.激励机制下污染物允许排放总量的分配模型[J].华中科技大学学报,2006,34(6)

[2] 刘首文,冯尚友.遗传算法及其在水污染控制系统规划中的应用,武汉水利电力大学学报,1996.29 (4):95-99.

[3] 黄国如,胡和平等基于遗传算法的水污染控制系统规划清华大学学报,2002,42(4)551―554

[4] 王艳.流域水环境管理合作促进机制博弈分析[J].系统工程,2007,25(8):54-57

[5] 刘红刚,陈新庚,彭晓春.基于合作博弈论的感潮河网区污染物排放总量削减分配模型研究[J].生态环境学报,2011,20(3):456-462

[6] Deininger,R.A.. Water quality management: the planning of economically optimal pollution control systems[D].Northwestern University, Evanston,Illinois. 1965

[7] Liebman,J.C.and Lynn,W.R. The optimal allocation of stream dissolved oxygen[J].Water Resources Research.1966.2521

[8] Shih,C.S.. System optimization for river basin management[Jl. Journal of the Water Pollution Control Federation.1970.42: 1792

[9] Loucks,D.P.,Revelle,C.S. and Lynn,W.R.. Linear programming models for waterpollution controI[J].Management Science,1967,14(B):166

博弈论的方法范文第10篇

【关键词】博弈论,发展,前景

一、导论

博弈论理论的发展为很多问题的研究提供了非常有效的研究思路。但是博弈论的发展历程是怎样的、它是如何受到大家重视的、它的未来发展前景又是如何?本文通过对相关文献的搜集和整理,对上述问题进行梳理,有助于对博弈论有个更为清晰的认识。对博弈论发展的历史、现状和趋势有所了解,对我们更好的掌握这门学科有很大的好处。

二、博弈论的早期研究

很多学者想追溯博弈论的起源,但是针对这个问题并没有一个公认的答案。如果按照把博弈问题应用到决策问题和对决策问题的研究标准,那么可以说博弈论的历史非常悠久。因为在人们的日常生活和生产中常常都会进行博弈分析。有文献记载的最早具有博弈思想的事例可追溯到两千多年前我国的“齐威王田忌赛马”、一千五百年前巴比伦犹太教法典中的“婚姻合同问题”等。如果按照现代经济学和博弈论中经常引述的最早包含博弈思想的文献标准,古诺1838年关于寡头之间通过产量决策进行竞争的模型可以看做博弈论早期研究的起点。1883年伯特兰德的通过价格进行博弈的寡头竞争模型也是包含博弈思想的经典文献。对博弈论问题比较系统密集的研究开始于二十世纪初期。齐默罗和波雷尔对象棋博弈等的系统研究可以代表系统研究博弈理论的开端。诺依曼和摩根斯坦一九二八年给出了扩展形博弈定义。但是,这些研究都没有完成博弈论的理论体系。尽管如此,这些早期的研究还是对博弈论理论的产生起到了非常重要的作用。

三、博弈论的形成

对于一个理论的真正发展来说,仅有一些零星的研究还是不足以发展出博弈论的理论体系的,更重要的不是谁曾经有过零星的研究,而是谁的工作或者文章发表以后,它的思想或方法就引起了人们的兴趣和重视,并开始有越来越多的追随者。就像哥伦布并不是到达美洲的第一人,但却因为他的发现新大陆没有“失落”过,所以哥伦布享有发现新大陆发现者的荣誉。同样的道理,冯・诺依曼和摩根斯坦1944年出版的《博弈论和经济行为》,应该被看做博弈论历史的真正起点。在《博弈论和经济行为》中引入了博弈论的扩展表示和正规形表示,并定义了极小化极大解,指出这种解在所有两人零和博弈中都存在。该书在总结以往研究成果的基础上,给出了博弈论研究的一般框架,概念术语和表述方法,提出了相对系统的博弈理论。尽管现在看来该书某些地方还不全面,但是,其对博弈理论发展所起的巨大作用是不可否认的。

四、博弈论的成长和发展

博弈论第一个研究高潮出现在20世纪40年代末和50年代初。在第二次世界大战期间,博弈论的思想和研究方法在军事领域的应用推动作用下,这时博弈论的研究队伍已经有了很大的发展。纳什加入到博弈论的队伍是这个时期最重要的事件之一。纳什在1950年将博弈论扩展到非零和博弈,并提出纳什均衡概念和证明了纳什均衡存在性的纳什定理,发展了非合作博弈的理论基础。除了纳什的研究成果以外,这个时期还出现了很多博弈理论家和博弈论研究成果。例如,囚徒困境博弈的实验。五十年代中后期一直到七十年代也是博弈论发展历史中产生重要理论成果的阶段。例如:“微分博弈”的概念、“强均衡”的概念、关于重复博弈的“民间定理”。这个期间最重要的成果有赛尔腾1965年提出的在博弈方选择“相机计划”的博弈中不是所有的纳什均衡都是合理的,因为可能存在空头威胁的问题。1975年又提出了“颤抖手均衡”的概念。70年代博弈论发展中最重要的事件还包括“进化博弈论”的发展。此外“共同知识”在博弈论中的重要性也受到重视。

五、博弈论的成熟与主流经济学的融合

80、90年代是博弈论走向成熟的时期,在这个时期博弈论在经济学中的应用领域越来越广泛,在经济学中的地位达到了最高峰。这个时期的重要理论进展包括“顺退归纳法”、“序列均衡”的概念、《进化和博弈论》的出版、“完美贝叶斯均衡”的概念。正是这个时期,博弈论受到经济学家真正的广泛的重视,并被看做经济学核心的分析方法。也正是这个阶段开始,博弈论的思想、词汇开始在经济学杂志上大量出现。博弈论之所以会在经济学中的地位上升的这么快答案首先是现代经济活动的规模越来越大,对抗性竞争性越来越强,因此,经济活动的博弈性越来越强。其次,信息技术和社会经济信息化的发展使得人们认识信息的作用和规律的要求不断提高。从而促进了信息经济学的发展要求。因此信息经济学的发展也对博弈论的发展起到了促进作用。

六、博弈论的发展前景

由于博弈论本身优美深刻的本质魅力,新的博弈分析工具和应用领域的不断发现,一定会吸引大量学者加入。而且随着博弈理论的发展和博弈研究的不断深入,人们认识到这种理论还存在不少问题,特别是它的理论基础方面还存在一些没有很好解决的根本问题,这充分保证了博弈论在未来相当长的时间内的发展潜力。在金融、贸易、法律、政治等领域不断提出新的博弈论应用课题这也是今后博弈论进一步发展的巨大动力。而且,在合作博弈和非合作博弈两大博弈中,非合作博弈是博弈的主流,但是,合作博弈也具有相当重要的作用,而且要比非合作博弈理论更加复杂。正是由于这些原因,博弈论在未来一段时间内必然会有更进一步的发展,也会对经济学和其他学科的发展做出更大贡献。

参考文献:

博弈论的方法范文第11篇

一、博弈论的形成和发展

1、博弈理论的早期研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(Waldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Cournot)和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反映函数。这些都是关于博弈问题的早期的零星研究。

2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯・诺伊曼和奥・摩根斯坦(Morgenstern)在1944年的《博弈论与经济行为》这部著作,他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立,则是以纳什(John Nash)1950年的博士论文《非合作博弈》为标志,该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代),美国海萨尼(Harsanyi)和德国塞尔顿(Selten)的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,博弈论逐渐成为经济学的基石。

1944年,冯・诺伊曼(Von Neumann)和奥・摩根斯坦(Morgenstern)合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论。而且,在该书以前,博弈论主要是数学家们研究的课题,主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此,博弈论开始被经济学家们所接受,对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成,但是这个时候的博弈论还是比较幼稚的,研究的范围也较小,总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。

20世纪的40年代末到50年代初,是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年,纳什(John Nash)在他的博士论文《非合作博弈》中,将博弈论扩展到了非零和博弈,最终形成了非合作博弈理论的思想源泉,纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明,发展了以纳什均衡概念为核心的非合作博弈理论。纳什均衡是对古诺模型和伯特兰德模型中均衡概念的一般化,纳什均衡的概念是有关均衡概念的最基本的概念,后来的子博弈精炼纳什均衡,贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念的提出都是以纳什均衡为研究出发点的。

20世纪50年代中后期一直到70年代也是博弈论发展历史上较为重要的一个时期。“微分均衡”、“强均衡”、“重复博弈”以及在此基础上的完全信息动态博弈等概念就是在这一时期提出来的,而且在60年代初开始了博弈论在进化生物学中的应用的研究。这个时期产生的里程碑式的成果是海萨尼(Harsanyi)关于不完全信息博弈理论,他在1967-1968年的三篇关于不完全信息博弈理论的论文中,提出了关于不完全信息静态博弈的“贝叶斯纳什均衡”的概念,此外还在1973年提出了关于“混合策略”的不完全信息解释,以及关于不完全信息动态博弈的严格“纳什均衡”概念。同时这个时期也是进化博弈论发展的重要阶段,提出了“进化稳定策略”等概念。当然,这个时期产生的博弈论成果还有很多,博弈论更多地应用到经济学理论的研究当中,为80-90年代博弈论的成熟以及经济学理论的博弈论革命起了很大的推动作用。

20世纪80-90年代到现在是博弈论走向成熟的时期,期间产生了大量的研究成果和文献,表明博弈论已经作为一种一般的分析方法逐渐走进了政治学、军事学、生物学、统计学等多门学科中。尤其是在经济学中,博弈论占据了核心地位。这个时期,是对非合作博弈理论的进一步深化,产生了博弈论基础上的经济学分支,如信息经济学,以及一些关于特殊问题的理论,如拍卖理论、激励理论。早在1983年,因一般均衡理论而得到诺贝尔经济学奖的德布鲁(J・Debreu)表明,如果没有博弈论中纳什均衡的重要概念,也就没有他对一般均衡的存在性的证明。到了90年代,克莱普斯(D・Kreps)、克鲁格曼(P・Krugman)和格罗斯曼(S・Grossman)都是因为在博弈论上的贡献而获得了美国的克拉克奖(Clark Prize),这是美国对40岁以下经济学家的最高奖。之后,博弈论两度夺得诺贝尔经济学奖,1994年颁给纳什(Nash)、海萨尼(John Harsanyi)和塞尔顿(Reinhard Selten)三位博弈论专家;2005年颁给罗伯特・奥曼(Robert J・Aumann)和托马斯・谢林(Thomas C・Schelling )。

二、博弈的类型及其均衡概念

博弈理论有合作博弈和非合作博弈之分。合作博弈强调团体理性,强调效率、公平和公正,非合作博弈更强调个体理性、个体的最优决策。按照参与人行动的先后顺序,博弈可以分为静态博弈和动态博弈。完全信息博弈是指每个参与者对所有其他参与者的特征、策略空间和支付函数有准确的知识;否则,就是不完全信息博弈。下图是基于上述分类方法的博弈类型以及各自的均衡概念。

三、博弈论的研究趋势及未来

1、合作博弈和非合作博弈之分。博弈论有合作博弈和非合作博弈之分,现在的研究更多地是基于非合作博弈的研究,事实上合作博弈也是博弈理论的重要内容。当前合作博弈理论研究的落后,正说明这个领域有很大的发展潜力,基于这方面的研究可能会带来博弈理论以及经济学理论的重大革命。

博弈论的方法范文第12篇

关键词:博弈论;行为经济学;理性人;行为博弈论

中图分类号:F224.32 文献标志码:A 文章编号:1673-291X(2010)26-0277-02

一、博弈论的定义

博弈论是一门研究相互影响着的博弈参与者进行策略选择时的行为规律的科学。它研究:(1)存在若干博弈的参与者;(2)每一参与者有一系列可选择的策略;(3)博弈结果取决于参与者策略的组合;(4)参与者了解博弈局势预设的信息等。博弈包含四个要素:博弈的参与者、策略、可评价结果与信息结构。博弈论是研究博弈弈的参与者的理,博弈的参与者策略选择时的相互影响以及他们之间的利益冲突与吻合关系。博弈论研究利益冲突与吻合的,将特定经济问题纳入博弈四要素中以转化为待研究的博弈局势,然后加以分析解决。(1)将特定经济问题转化为博弈问题。(2)运用博弈理论方法得出博弈问题的解。(3)将博弈问题的结论转化回经济语言,同时与第一步中所省略的信息一起为原始经济问题提供解释。

二、标准博弈论的现状和缺陷

标准博弈论包括完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。尽管标准博弈论的发展就是不断放松一系列严格假定的过程,但它仍然存在一个重大的缺陷――严格的理性人假定。假定了现实行为主体能力以外的复杂思维过程,假设所有博弈参与者都符合三个条件:(1)策略思考,即在对其他参与者将如何行动的基础上形成信念;(2)最优化,即对于给定信念选择最优反应;(3)均衡,即参与者调整信念和最优反应至相互达成一致。但是,现实的博弈参与者并不都是经济理性的,并且,由于博弈参与者是相互影响的,即使只有极少数的博弈参与者违背经济理性,其他理性参与者的行为也会随之改变,理想化均衡也同样无法实现。因此,经济现实并不能满足标准博弈论对博弈参与者的假定条件。为了延伸博弈论对现实活动的解释,应该是有限理性的前提下重构标准博弈论。如果说,标准博弈论提供了有关经济理性的行为人如何行动的理论,那么,行为博弈论就试图探讨行为人如何在理想的经济理性和现实的有限理性之间进行折衷,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。作为研究不同条件下行为人如何进行互动决策的经济理论,博弈论应该尽可能准确地预言和解释经济现实活动;当经济现实和理论模型不一致时,研究者的工作方向就是改造模型,提高其实证效用。

标准博弈论在“经济理性”假设下分析博弈参与者如何在追求各自最优目标的同时实现均衡。但由于现实行为人是“有限理性”的,标准博弈论对实践的理解和指导受到限制。为了延伸博弈论对现实活动的解释,行为博弈论将实验经济学与标准博弈论相融合,在博弈实验的基础上,考察和解释标准理论推断和实验结果之间的差异,引入行为因素改进标准博弈的基本假定,重构博弈分析模型,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。

三、几种基本博弈的介绍及分析

1.投资博弈

投资博弈中有两位互不相识的参与人A和B。A得到一笔钱并被告知可以完全保留也可以将其中的任意比例投资于B,他给出的任何金额都会以大于1的某一倍数付给B,然后由B决定是否回报和回报多少给A。标准博弈论的均是:理性的B应该最大化他自身的利益,保留获得的所有支付,而理性 的A会估计到B的策略,因此,不会投资于B,结果双方都得不到超额支付。

标准博弈论认为理性自利的人不会信任别人,但它忽略了人类是自利的,是高度社会化的动物,因此,标准博弈论的结论是:博弈中理性人的个人理导致机体的非理性,而行为博弈论的结论是:博弈中参与人的个人非理性但而导致机体的理性。

2.可置信威胁的议价博弈

它是讨价还价博弈中最简单的一种,即如果双方的交易成功就会有一定的利益,A出价,要求对方 要么接受、要么拒绝,如果B接受,那么双方就按照A提出的分配比例瓜分利润,如果B拒绝,那么双方之间不会有交易行为。按照标准博弈论,这个博弈具有无穷多个纳什均衡。

但不少时候对应者宁愿牺牲自身的利益去惩罚那些未公平对待他们的出价者 ,这种报复性回报在社会领域表现得很明显,为了伤害对方不惜牺牲自己。人类当被欺侮时,反应机制会使人愤怒,因为愤怒在进化过程中是作为一种生存优势保留下来的。不同的文化观使人具有不同的公平标准,参与人有时并不在意分配比例是否公平,即使出价者只支付很少的金额对应者也愿意接受。议价博弈中的拒绝并不意味着参与人没有意识到标准博弈论中的最优策略,他们明白使自己经济利益最大化的策略是什么,只是因为情感或社会的因素使他们不再是传统经济学意义上最大化经济利益的理性人,在某些情况下,他们宁愿牺牲自己的经济利益以达到其他方面的满意。

3.协调博弈

在协调博弈中,参与人都希望自己的行动和其他参与人的行动取得某种一致。但是社会习俗、相互的交流、博弈呈现的不同方式、参与人曾有的类似经历以及自己的幸运数字都会影响均衡的形成。

4. 竞猜博弈

竞猜博弈指的是:让每个参与人去猜谁会是选美比赛中的最后得主,最后得主由所有参与人的平均看法决定,这时每个参与人既不是选择自己认为最漂亮的也不是选出所有人平均认为最漂亮的,而是要去思考所有参与人对平均看法的平均预期。因此,行为博弈论提出利用有限重复推理来理解参与人的初次选择,用认知的深化来解释参与人选择的变化。

5.总结分析

大量的实验研究为行为博弈论的提出提供了坚实的数据基础,行为博弈论并不是要否定标准博弈论,他们两者也并不矛盾。标准博弈论体现一种完美的策略分析过程,整个推理严谨周密,是由于经济理性人的假定使其缺乏可操作性,因为人类的目标不仅仅是经济利益最大化,而行为博弈论正是从这一点出发,将博弈论拉回到现实的框架中来,使其更真实,更人性化和社会化 。

四、行为博弈的模型研究

行为博弈的模型的构建遵循精确性、一般性和实验规则的原则。它研究的基础数据都是经实验取得的。博弈实验对博弈预测的敏感因素进行了严格的控制,包括博弈参与者知道什么、什么时候行动、各自的支付是多少等等。博弈实验的关键在于通过实验控制来区别哪种理论更加有效,然后再使用该理论来进行一般事件的研究。行为博弈研究就是要在标准均衡概念失效的情况下,以实验控制为主要手段,以实验数据为基本依据,通过不断地试错与修正建立能够对博弈参与者的未来行为进行准确预测的理论。

行为博弈模型主要包括三方面内容:第一,在一次性博弈中,有限理性条件下,构建博弈参与者的思考模型,发展一个有限理性的指标系来衡量博弈参与者的思考步骤,并且使用一个参数来说明博弈参与者的异质性。与最优反应相联系,该指标系可以对任何一个一次性博弈中的行动进行了唯一的统计预测。第二,在思考模型的基础上,构造一个学习运算法则来估计博弈参与者的行为均衡路径。这一运算法则既包括了虚拟的博弈和强化模型,也具有很强的经验预测能力。因此,EWA可以作为经验性工具去寻求表现为初始函数形式的行为静止点。第三,提出如何将有限理性指标系和学习运算法则应用于分析重复博弈中的博弈参与者行为,为利用行为博弈论分析价格竞争、专利竞赛等现实经济活动奠定基础。

五、总结

标准博弈论对实践的理解和指导是有限制的。为了延伸博弈论对现实活动的解释,作为研究不同条件下行为人如何进行互动决策的经济理论,博弈论应该尽可能准确地预言和解释经济现实活动;当经济现实和理论模型不一致时,研究者的工作方向就是改造模型,提高其实证效用。这一思潮引致了行为博弈论的出现。行为博弈论将实验经济学与标准博弈论相融合,在博弈实验的基础上,考察和解释标准理论推断和实验结果之间的差异,引入行为因素改进标准博弈的基本假定,重构博弈分析模型,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。

行为博弈研究的起点就是进行博弈实验,将实验结果与标准博弈论的预测进行比较,并用不同方法分析差异存在的原因,为进一步构建正式模型提供现实依据。需要说明的是,行为博弈论并没有否定纳什均衡的意义,而是作为标准博弈论的延续,在有限理性的前提下深化了对博弈均衡的讨论,以更加贴近现实的研究视角对具有某种内生变动性的博弈均衡的存在方式和形成过程进行了新的思索。行为博弈论最重要的观点就是在大量实验数据的基础上提出利用有限重复推理来理解参与者的初次选择,利用认知和学习的深化来解释参与者选择的变化,而行为博弈正式模型则试图为上述观点提供完美的数理表达,提高理论的精确性和一般性。

参考文献:

[1] 阿克罗夫,乔治 A.宏观行为经济学和宏观经济行为[J].当代经济科学,2OO2,(5).

[2] Camerer,C…F Behavioral Game Theory:Experiment in Strategic Interaction[M].Princeton University Press,2003:11-20.

博弈论的方法范文第13篇

关键词:博弈论 电力市场 Nash均衡理论

引 言

博弈论又称为对策论或竞赛论,其实质是一种理论方法。它是一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论[1]。而在电力市场中,博弈论的运用更是显得尤为的突出,用博弈论模拟电力市场,模拟的结果能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,也可以用博弈论来分析市场,研究如何报价获利最大。因此,博弈论在电力市场中起到的作用是相当巨大的。

一、博弈论的发展

博弈论思想的起源可以追溯至我国的春秋末年,孙武所著的《孙子兵法》,它不仅是一部军事著作,而且还算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯・诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯・诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》、《非合作博弈》等,给出了纳什均衡的概念和均衡存在定理[2]。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用,如今博弈论已发展成一门较完善的的学科。

二、博弈论的类型

博弈问题有多种不同的分类方法,按参与者之间是否存在相互协作可分为“非协调博弈”和“协调博弈”;按参与者获利之和的特性可分为“零和博弈”和“非零和博弈”;按静态和动态的观点,可分为静态博弈和动态博弈。

2.1 非协作博弈和协作博弈

非协作博弈是指参与者互相独立,各自争取最大利益的博弈。其广泛运用Nash均衡概念来求解。在Nash均衡上,如果某一个人的策略保持不变,会导致这个人的获利减少。非协作博弈是研究少数制造商操控市场的若干标准问题的理论基础,对于研究市场力有重大意义。

协作博弈一般是指基于参与者结成联合体,共同协作争取联合体的最大利益,再将利益进行内部分配的博弈。

2.2 零和博弈和非零和博弈

在零和博弈中,一个参与者的获利直接等于另一个参与者的损失。例如下棋,扑克牌之类。而在非零和博弈中,参与者的获利和损失不相等,即代数和不必为零,这是更大的博弈问题,是数学家Nash首先提出和解决的,即著名的Nash均衡及其相应求解方法。

2.3 静态博弈和动态博弈

静态博弈是指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。而动态博弈是指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。[3]

三、博弈论在电力市场中的运用

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。

3.1 在购售电决策方面的运用

购售电决策与电力市场模式有很大的关系,如在联营体模式下,参与者众多,若干发电公司或购电商可以结成联合体去投标,这也就是协作博弈问题,这可以比独自去投标取得更大的利益。同时,在联合体模式下各参与者也可以不合作而各自决策,这也就成了非协作博弈问题,这类问题现在大量采用Nash均衡理论来求解。

3.2 在区域间功率交换、转运和输电成本分配方面的运用

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题,如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题都需用到博弈论来进行优化决策。

3.3 在研究市场行为方面的运用

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如,在电力市场中参与者都可以联合起来运用协作博弈方法进行投标来控制市场,特别是在参与者较少时,往往都会出现寡头垄断问题,因此市场运行必须防止和阻止这类市场。另外,如果有市场参与者利用线路阻塞、特殊事件和气候。峰荷时段、联络线瓶颈造成的必须运行机会,运用博弈发放和策略哄抬电价,这些问题也都应及时识别并予以纠正的。

结束语:

至1928年Von Neumann发表关于求解“零和”问题的具有里程碑性质的论来以来,博弈论的观点在很多领域都得到了广泛的运用,也在这些方面取得了巨大的成就。在电力市场中,运用博弈论解决了很多电力行业问题,使电力市场得到了巨大的发展与优化。但是,在运用博弈论进行决策的同时也存在了一定的缺陷,如Nash均衡求解的困难较大;由于竞争各方相互保密而造成的决策困难;分析计算中的假定及简化影响决策结果的可靠性等,这些存在的问题都需要得到及时的解决。因此,博弈论在电力市场中的运用还需要很长的一段时间才能得到更好的完善。

博弈论和电力市场发展至今也不过短短的几十年时间,从发展的眼光来看,他们都属于很年轻的学科,他们都有很广阔的发展空间,两者的结合可以互相促进、相互发展,相信在今后的将来电力市场定会在博弈论的理论发放下而得到更好的完善与发展。

参考文献:

[1]杜松杯. 电力市场[M].中国电力出版社, 2008.7

博弈论的方法范文第14篇

【关键词】唯物辩证法 经典博弈论 演化博弈论 经济学革命

一、博弈论与辩证法

1.辩证法要义

辩证法,源出希腊文,含义是进行谈话、进行论战。这一术语在哲学史上曾在各种不同的意义上被使用,其历史发展经历了古代的朴素辩证法、以黑格尔为代表的唯心辩证法、马克思主义的唯物辩证法等三个阶段。19世纪中叶,马克思和恩格斯在概括革命实践经验和自然科学新成果的基础上,批判地继承了黑格尔的唯心主义辩证法,创立了唯物主义辩证法,他们认为,世界“是一幅由种种联系和相互作用无穷无尽地交织起来的画面”,唯物辩证法就是对这一生动画面的概括和反映。从内容上看,唯物辩证法作为科学的理论体系包括对立统一(矛盾)、质量互变、否定之否定三大基本规律,以及本质与现象、内容与形式、原因和结果、必然性和偶然性、可能性和现实性五对基本范畴。总体上看,唯物辩证法是对客观物质世界普遍联系和永恒发展这一基本特征的揭示和反映,既是一种世界观又是一种方法论。

2.博弈论的内涵及其发展阶段

博弈论作为数学的一个分支,本身不涉及经济问题。这种理论是一种分析工具,它研究怎样以数学模型模拟决策者之间的冲突与合作。由于冲突与合作的结果依赖于所有人所作的选择,每个决策者都企图预测其他人可能的抉择,以确定自己的最佳决策。如何合理地进行这些相互依存的战略策划便是博弈论的主题。

博弈论的发展经历了以下三个阶段:

一是思想萌芽阶段。1838年古诺简单双寡头垄断博弈、1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断、2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的、片断的研究,带有很大的偶然性,很不系统。

二是经典博弈论形成阶段。1944年冯·诺依曼和摩根斯坦的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础;1950年和1951年纳时发表了《n人博弈的均衡点》和《非合作博弈》两篇关于非合作博弈的文章、1950年Tucker定义了“囚徒困境”;60年代,泽尔滕将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念、海萨尼则把不完全信息引入了博弈论的研究;80年代,克瑞普斯和威尔逊研究了动态不完全信息博弈。总体来说,经典博弈论主要关注纳什均衡的形成,以及当纳什均衡存在多重性时,如何通过不断地精炼来寻找最终的结局。

三是博弈论在当前的发展阶段。20世纪90年代以来,演化博弈论、博弈学习理论、行为博弈等研究成为博弈论的最新发展,主要从博弈论的角度探索正式和非正式制度的形成与演变、通过实验来检验和修正有关经济人的行为理论等问题。

二、博弈论对西方经济学的改良

首先,传统西方经济学对寡头市场和垄断竞争市场和市场失灵问题的研究是苍白无力的,这使得传统西方经济学解释现实的能力并不像其宣扬的那样完美。博弈论作为工具在西方经济学中的应用正好弥补了传统西方经济学的这一缺陷。正如克雷普斯在《博弈论与经济模型》一书中所作的评价:“我认为博弈论最成功之处在于使一望而知的直觉认识规范化,从而使人们了解这类直觉认识怎样应用于新的形势,以及在较为复杂的形势下怎样获得这种直觉认识。”“博弈论提出的问题正是那些‘在理论上难以解释’的合乎情理的直观行为,非合作博弈理论只是应用数学理论提供了分析这类行为的简单工具。”

其次,“博弈论在经济学获得巨大成功的主要原因,是它提供了模拟和分析动态性竞争互动的技术手段。”互动结构是一种社会结构,长期以来,经济学家一直试图理解个人行为与社会结构之间的关系。美国经济学家H·培顿·扬在《个人策略与社会结构——制度的演化理论》一书中认为:“经济制度和行为模式可以被解释为很多个人决策的产物或者说结果……那么,有哪些特征能将‘演化’的观点与经济学中的古典观点区别开来呢?一个是符合均衡的状态,另一个是符合理性的状态。”H·培顿·扬是演化博弈论领域的领军人物,他的上述这段引文清楚地表明了新古典研究传统的两大缺陷:一是没有动态分析,尤其是没有关于复杂情况下的动态分析;二是脱离现实太远的强经济人假定。演化博弈论将经济运行理解为一个动态演化的过程,并认为经济人并不是强理性的,而是适应性理性的。在动态演化的过程中,经济人通过不断的学习来提高理性程度,进而实现最优决策,这无疑推动了西方经济学的发展。

上面我们从两个方面分析了博弈论给西方经济学带来的变化,但不能据此就认为博弈论给西方经济学带来了革命。第一,博弈论并没有从整个体系上改革西方经济学,只是对其进行修修补补,将西方经济学原本不能解决或解决不好的问题给予改良。第二,新兴起的演化博弈论虽然为西方经济学的动态演化分析提供了工具,但随着研究的深入也对西方经济学提出了挑战。“随着一组新的分析工具特别是博弈论和信息经济学的出现和越来越明显的经验证据表明,瓦尔拉斯模型存在缺陷,经济学教学和实践的方式正在发生改变。经济参与人不再单纯与自然或是其他环境参数打交道,而是有策略地与其他经济人交往。”经典博弈论(如非合作博弈论中的完全信息条件下的静动态博弈和不完全信息条件下的静动态博弈)为经济人的互动决策建立了模型,从而部分解决了上述问题。然而,非合作博弈论在基本模式上依然遵循均衡模式,只不过将范围从瓦尔拉斯的单个经济人拓展到相互影响的两个人或多人之间的均衡。经济社会运行是一个不断从均衡走向非均衡,又从非均衡走向均衡的动态演变过程。这与瓦尔拉斯传统所宣扬的一般均衡是不相容的。如果说以非合作博弈理论为代表的经典博弈论还能在某种程度上对西方经济学进行补充的话,当演化博弈论兴起以后,瓦尔拉斯传统就再也无法自圆其说了。但由于西方经济学本身固有的辩护性,它不会允许新理论去触动传统理论的核心,与上述引文出自同一本书的一段话清楚地表明了这一点,“在许多经济学家和其他学科学者贡献的基础上,本书提出了关于个人行为与经济制度如何相互作用产生总体效果,以及两者随着时间的推移如何变化的理论。”根据上面的分析,我们不难看出博弈论改良了西方经济学,但却没给其带来革命。一方面,博弈论本身体现着辩证思维,其与传统西方经济学形而上学的方法论相比,更符合真实世界的运行,因而能在一定意义上给西方经济学带来改变,使其科学性稍稍加强;但另一方面,博弈论又囿于西方经济学本身的辩护性,作为一个工具它的应用被限制在一定的范围内,无法给西方经济学带来革命。只有将马克思唯物辩证法与博弈论相结合,使其具有唯物辩证法所具有的革命性,才有可能为经济学带来一场革命。

三、改造博弈论的设想及借鉴意义

我们设想可以从以下几个方面对博弈论进行批判性的吸收和改造,以便为马克思经济学的发展所用。

1.“社会生活在本质上是实践的。凡是把理论导致神秘主义的神秘东西,都能在人的实践中以及对这个实践的理解中得到合理的解决。”演化博弈论之所以在当前蓬勃发展且应用前景广泛,其根本原因在于其突破了经济人的超理性假定,如果再向前走几步,其科学性会大大增强,指望西方经济学家来完成这项工作是不可能的,只有马克思和马克思经济学者有这样的革命性。从这个意义上说,演化博弈论中学习着的人正在向马克思实践的人靠近,也为马克思经济学的发展提供了新的工具。

2.将马克思生产力与生产关系辩证统一原理与演化博弈论关于经济社会动态演变的理论分析结合起来。马克思生产力与生产关系辩证统一原理是唯物辩证法在人类社会历史发展中的应用。马克思主义哲学认为,生产力与生产关系、经济基础与上层建筑之间的矛盾是社会基本矛盾,它们的运动形成社会发展的基本规律,同时也构成社会发展的根本动力,社会是在对立统一、否定之否定的螺旋式发展中上升的。这一原理体现在马克思经济学中就是资本主义制度自身的发展造就了替代自己的新的共产主义制度,同时,每一制度下的各种上层建筑又由构成其经济基础决定的。演化博弈论主张用从均衡到非均衡、再由非均衡到均衡动态演变方法来分析社会制度的形成、驻存和演变,这一点与马克思的分析有着相通之处,可以用马克思的思想对其进行改造。

3.利用西方社会科学正以博弈论为基本分析工具走向融合之路的契机,可以在改造后的博弈论框架下批判吸收西方相关社会科学发展的成果。近年来,西方社会科学各学科在大量地应用博弈论对本学科进行改写和发展,呈现出各社会科学统一的趋势,跨学科研究方兴未艾。如果能将博弈论这种分析工具融入马克思的分析中,那么将为马克思理论批判吸收西方社会科学的最新研究成果提供一个平台。

参考文献:

[1]马克思恩格斯选集(中文第二版):733.

[2] [美]戴维·M.克雷普斯著,邓方译.博弈论与经济模型.商务印书馆,2006:94.

[3][美]戴维·M.克雷普斯著,邓方译.博弈论与经济模型.商务印书馆,2006:45.

[4][美] H·培顿·扬著,王勇译.个人策略与社会结构——制度的演化理论.上海三联书店、上海人民出版社,2004:4.

[5][美]萨缪·鲍尔斯著,江艇、洪福海、周业安译,微观经济学:行为,制度和演化.中国人民大学出版社,2006:6.

[6]马克思恩格斯选集(中文第二版)(第一卷):58.

[7]马克思恩格斯选集(中文第二版)(第1—4卷).北京:人民出版社,1995.

[8]梁树发.马克思主义哲学原理.北京:中国人民大学出版社,2003.

[9]李建平.《资本论》第一卷辩证法探索.北京:社会科学文献出版社,2006.

[10]李云峰.马克思学说中人的概念.北京:人民出版社,2007.

[11]杨耕,陈志良,马俊峰.马克思主义哲学研究.北京:中国人民大学出版社,2000.

博弈论的方法范文第15篇

WTO作为世界经济发展的重要支柱,在管理全球经济和贸易秩序的同时,也为各成员国进行多边博弈提供了一个大舞台。在这个舞台上,各成员国通过降低关税、开放市场、取消壁垒、进行平等的自由贸易,不仅带来了更多的利益,也使成员有机会平等地参与国际竞争。上世纪50年代起,博弈论作为一种方法论在经济学领域得到了广泛的应用,国内外众多学者也开始运用这一全新方法从不同角度对GATT/WTO的产生、规则和运行进行了分析和研究,并取得了丰硕的研究成果。

【关键词】

博弈论;GATT/WTO;国际经济政策

西方传统经济理论大多是研究经济行为主体在市场完全竞争且信息充分对称的假设下进行决策,以实现稀缺资源的有效配置,但却忽视了外部变量对经济行为主体决策的影响。博弈论作为20世纪70年之后在经济领域得到广泛运用的方法论,紧紧抓住经济行为主体之间利益冲突与协调以及策略相互制约这一关键,提出了比西方传统经济理论更贴近实际的分析方法。博弈论的广泛运用为现实中复杂经济问题的分析提供了最佳分析工具,拓宽了现代经济学的研究领域。

GATT/WTO就是一种从非合作博弈走向合作博弈的产物,为国家和地区提供国际贸易行为准则,对协议实施中的问题和未来贸易自由化提供了谈判的程序,以达到各成员均从中获益的博弈结果。所以说,GATT/WTO是一套使成员之实现制度性合作博弈以摆脱非合作博弈的制度安排,这套制度安排确保所有成员实现福利改进。

一、博弈论方法应用于GATT/WTO研究

真正将博弈论方法应用于GATT/WTO研究始于美国学者McMillan(1986)。他通过建立关税博弈模型,证明了“互惠贸易协定能增进国民福利”这一命题,从而为GATT/WTO的确立奠定了理论基础。

Dixit(1987)研究了在无限重复博弈条件下的关税谈判与关税减让问题,结果显示,通过对背叛国家惩罚的可信威胁,世界可以维持一个低于纳什均衡关税的合作关税水平。

Thomas Hungerford(1991)进一步将关税博弈模型扩展至非关税博弈领域,得出类似结论,即“削减非关税壁垒也会增进双方的福利。”

Hoekman和Kostecki(2001)结合乌拉圭回合谈判,从博弈论视角论述了WTO多边贸易谈判的运行机制和互惠性质,指出“在WTO支持下的多边贸易谈判可以被认为是制定国际贸易博弈规则的努力”,“多边贸易谈判是多阶段、多议题、多方的博弈”。

Bagwell和Staiger(2002)从经济学角度论述世界贸易体制的理论基础和运行机制,利用博弈论的研究方法,解得合作博弈情况下的关税均衡,称之为“政治最优关税”,进而说明了WTO体制和规则框架的经济原理。

二、WTO的体制、规则和运行机制

盛斌(2001)借鉴Bagwell和Staiger的博弈模型,系统地解释了WTO的目的是各国通过合作博弈来摆脱非合作博弈情况下的“囚徒困境”,说明了WTO体制和规则框架的经济原理和哲学理念。该文可被视为国内运用博弈论研究GATT/WTO的奠基之作。

夏晖和韩轶(2001)从博弈论角度,以两国关税政策静态博弈模型为基础,分析了WTO成立的原因及条件。该文为用数理博弈模型研究GATT/WTO提供了一个全新视角。

冯春丽和周骏宇(2005)从制度经济学的层面,运用博弈论的方法来分析WTO,指出最惠国待遇原则和多边争端解决机制是WTO规则体系中最重要的制度安排,并利用一个收益不对称的智猪博弈模型分析了权力结构的变动所引致的WTO制度变迁。

三、多边贸易谈判中的博弈

施锡铨(2001)运用不完全信息博弈、复杂变量的博弈和盈利函数的估计,分析了中国加入WTO谈判过程中一系列讨价还价的博弈问题。

刘光溪和查永贵(2003)运用“双层博弈”理论分析了中国复关入世谈判中的博弈现象,阐释了谈判历程复杂而艰巨的原因;他又与邹彦(2003)研究了国际贸易谈判中的博弈战略,建议我国必须抓住时机,改革“不谋于众”的谈判体制,增强政府谈判能力,为国内企业奠定迎接挑战、公平竞争的良好基础。

四、运用博弈论就WTO的某一具体规则进行研究

房向明和侯光明(2002)从博弈论的角度出发,通过建立我国反倾销部门与外国企业的博弈模型,给出了我国对外倾销企业的罚款系数以及我国反倾销调查概率的确定方法,进而提出了加强我国反倾销力度的建议。

杨仕辉(2005)将WTO保障措施规则转化为三阶段动态博弈模型,重点比较和讨论了对一国和两国同时实施保障措施的区别,以及保障措施对实施国和目标国贸易条件、产品选择的影响。

杨波(2007)运用博弈论和经验检验的方法,分析得出技术水平发展的不对称导致国家间技术性贸易壁垒通报数量的差距,发达国家由于具备在技术和贸易两方面的优势,更倾向于主动采取设置技术性贸易壁垒的战略,而发展中国家则被迫采取亦步亦趋的跟从策略。

综观上述研究成果,中外学者运用博弈论来研究WTO在国内外还很空白,在研究成果、内容上都带有探索性和尝试性。作为一种方法论,将博弈理论作为研究GATT/WTO的视角,不仅可以有效诠释GATT/WTO的制度基础、规则体系和运行机制,也能说明GATT/WTO成员在世贸组织谈判中的动态博弈策略,从而为GATT/WTO的确立和运行提供一个全新的解释途径。

然而,无论国外还是国内,对WTO博弈论的研究都处于起步阶段,在研究内容上显得过于分散,无法形成统一的整体,从而无法形成对WTO博弈论的全面解释。同时,在定量分析方面,由于统计数据的不同与缺失,多边博弈在确定真实支付函数时也受到很大限制。

参考文献:

[1]盛斌.WTO体制、规则与谈判:一个博弈论的经济分析[J].世界经济,2001,12:3-12.

[2]夏晖,韩轶.世界贸易组织的博弈分析[J].电子科技大学学报,2001,05:520-524.

[3]冯春丽,周骏宇.WTO制度的博弈分析[J].国际经贸探索,2005,04:54-57.

[4]施锡铨.由WTO谈判所衍生的博弈研究[J].上海财经大学学报.2001(03).