你好,欢迎访问云杂志! 关于我们 企业资质 权益保障 投稿策略
咨询热线:400-838-9661
当前位置: 首页 精选范文 进化博弈理论

进化博弈理论范文

发布时间:2023-09-27 15:06:10

导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的13篇进化博弈理论范例,将为您的写作提供有力的支持和灵感!

进化博弈理论

篇1

关键词:进化稳定策略;渐近稳定性;严格N群体ESS;随机稳定集;群体稳定集

引言

进化博弈理论来自于达尔文的生物进化论,至少自雷威丁(Lewontin 1960)用于解释生态现象 ②就已经产生了。但直到1973年梅纳德·史密斯和普莱斯(Maynard Smith and Price)、梅纳德·史密斯(1974)提出了该理论的基本均衡概念----进化稳定策略[3](evolutionary stable strategy, ESS)及泰勒和乔克(Taylor and Jonker)提出该理论的基本动态概念---模拟者动态以后,进化博弈理论得到了理论界的普遍关注。特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开,正式确定了进化博弈理论在经济学上的学术地位,此后,该理论在经济学便上获得了迅速的发展及广泛的应用。越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981);阿克赛尔罗德(1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向[康利斯克(Conlisk 1980);利奈尔和罗尔(Cornell and Roll 1981)]、消费者对品牌的选择[凯思和史培罗(Katz and Shapiro 1985)]、社会学习过程[弗登博格(Fudenberg 1995)]及社会习俗形成[彼特·杨,(H. Peyton Young 1993,1998)等领域的相关问题。进化稳定策略是进化博弈理论最基本的均衡概念,它具有广泛的应用并在发展中得到了不断完善。本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。

一、原初ESS定义及其缺陷

在梅纳德·史密斯和普莱斯(1973);梅纳德·史密斯(1974)提出进化稳定策略概念以前,进化博弈理论的发展还仅仅处于萌芽阶段。在这一时期生态学家们主要应用纯数学理论如极限环、分岔、奇异吸引子(罗森,Rosen 1970)等概念来描述生态演化系统并用于解释生态现象,同时把生物之间的互动行为纳入到进化模型之中(威尔·艾德瓦兹,Wynne-Edwards 1962),他们处理问题的方法已经蕴含了进化博弈理论的基本思想。

在七十年代,生态学理论和博弈理论在各自领域中都获得了迅速的发展,同时实验经济学作为一门学科也获得了经济学界的一致认同,这些条件为进化论与博弈论的结合提供了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973)在总结以前理论的基础上,提出进化博弈理论的基本均衡概念----进化稳定策略③ ,该均衡概念的提出使得进化博弈理论的研究有了明确的方向,为进化博弈理论的进一步发展奠定了坚实的基础。

所谓进化稳定策略就是指:如果占群体绝大多数的个体选择进化稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下,突变者要么改变策略而选择进化稳定策略,要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973)所定义的进化稳定策略(文献[3]对此有详细的介绍):

说是进化稳定策略,如果,存在一个④,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入界限(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。从定义可以看出,当系统处于进化稳定状态时(群体选择进化稳定策略时所处的状态就是进化稳定状态),除非有来自外部强大的冲击,否则系统就不会偏离进化稳定状态,即系统会“锁定”(Lock in)于该状态。定义的直观意思就是,当一个系统处于进化稳定均衡的吸引域范围之内时,它就能够抵抗来自外部的小冲击。显然,进化稳定策略是一个静态概念,但它却可以描述出系统的局部即吸引域内的动态性质。

原初进化稳定策略定义为以后的研究者提供了理论基础,但它是建立在许多理想化的假定之上,存在着许多不够完善的地方:第一,梅纳德·史密斯等是在研究生态现象时提出的进化稳定策略概念的,由于动植物的行为完全是由其基因决定的。因而,每个种群体都被程式化为一个纯策略,整个生态环境的所有种群也被看作一个大群体。然而,同一种群的个体由于其性别不同、需要不同、能力不同、基因突变或基因遗传⑤ 等因素都会影响到它们的行为,把每一个种群行为程式化一个纯策略是没有太强说服力的,把一个生态环境中所有种群看作一个大群体也存在不妥之处;第二,从梅纳德·史密斯等提出的进化稳定策略定义可以看出,它仅适应于互不重叠且相互独立的突变因素的影响,其吸引域半径只与单个突变因素y有关,也就是说只有等到一个突变因素对群体的影响消失之后,才能出现另一个突变因素,现实中出现这种现象是非常偶然的;第三,梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体规模无限大 ⑥,即隐含地假定博弈的支付⑦ 空间是一个连通、闭集,这个假定不符合现实;第四,从原初的进化稳定策略定义可以看出,它是一个静态概念,只能描述系统的局部动态性质,没有涉及到动态系统整体的调整过程,而现实中许多系统的均衡依赖于系统的整体动态性质。

从生态意义上说,进化稳定策略把种群之间的互动行为纳入到模型之中,推广了达尔文的优胜劣汰理论,然而与纳什均衡概念相比,进化稳定策略并不能解释群体如何达到稳定的。它只能回答一旦达到了这种稳定状态,原群体就对突变者群体者具有较强的抵抗力。也就是说,它只能回答当系统处于某一个均衡点的吸引域时,在一定条件下,随着时间的演化,该系统就会趋于这个均衡点,而当系统有多重均衡或者多个吸引域时,原初的定义就显得无能为力了。事实上梅纳德·史密斯和帕克(Maynard Smith and Parker 1976)、梅纳德·史密斯(1978;1979)已经识到原初定义的某些缺陷,梅纳德·史密斯(1982)给予了一定程度的修进并提出了修进的ESS(Modified ESS)概念。下面我们从四个方面来介绍理论家对进化稳定均衡所作的拓展。

二、非对称群体中的ESS概念

梅纳德·史密斯早在1979年就已经意识到,原初的进化稳定策略在处理多群体非对称博弈时遇到了困难。他发现,在现实中,如生态学、经济学和其他社会科学中的许多策略互动行为可能发生于两个或多个群体的个体之间,个体之间进行的是非对称博弈,单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化稳定标准拓展到多群体情形呢?在单群体中,所有的个体都被程式化了一个纯策略(梅纳德·史密斯假定只有纯策略是可以遗传的),个体之间进行的是两两重复匿名博弈;并且在单群体中,规模很少的突变因素对群体所产生的影响是可以忽略的,因此,非严格纳什均衡策略不可能侵入到最优反应的严格纳什均衡策略群体。在多群体中,突变因素可能来自于各个群体,突变策略者的互动行为会对群体行为产生不可忽略的影响。因此,原初的进化稳定标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。Selten(1980)认为,把均衡概念由单群体拓展到多群体不是一个简单的过渡,而是涉及到系统的动态调整过程及动态稳定性等一系列的变化。哈曼斯顿(Hammerstein 1981)认为,在非对称博弈中,个体更加倾向于应用稳定策略来选择行为并决定竞争结果,而这些稳定策略与进化稳定策略相比,可能会有更少的“吸引域”。因此,由进化稳定策略定义所得的结论就显得有点似是而非了,但他没有作出进一步解释。

泽尔腾(Selten (1980))首次深入地研究了非对称博弈动态稳定性并利用两群体博弈情形证明 “在非对称博弈原初进化稳定策略必定是严格纳什均衡”。后来,Van Damme(1987)在更一般的情形下证明了这个命题⑧ 。我们知道,严格纳什均衡本来就显示出很好的性质,如果一个理论把其主要的注意力集中于研究严格纳什均衡,那么它就没有任何理论价值;更重要的是许多非对称博弈根本就不存在严格纳什均衡,因而也就无法研究动态系统的稳定性;在非对称博弈中,渐近稳定性(Asymptotic Stability)实质上也蕴含了严格纳什均衡,因此,渐近稳定性在非对称博弈中也不是一个合适概念;进化稳定策略是一个静态概念,虽然能够描述系统的局部动态性质,但在非对称博弈中,原初的进化稳定均衡与动态演化过程极限结果之间的对应关系却不明显(即出现了局部与全局的矛盾)。因此,要研究非对称博弈的动态稳定性就必须通过考察系统的动态演化过程来寻求能够适应于对称博弈与非对称博弈的稳定性概念。为了能够更精确地描述非对称博弈,泽尔腾(1983,1988)通过对引入角色限制行为(Role Conditioned Behavior)而提出了适应于非对称博弈的ESS概念。

他的定义如下:在有角色限制的博弈G中,一个行为策略称为进化稳定策略,

如果 (ⅰ)对任意的,满足

(ⅱ)如果那么对任意的有。

然而,泽尔滕的ESS概念尽管适应于描述两群体非对称博弈的情形,但它只能描述系统的局部动态性质,而且该定义并不能够显示出均衡概念与动态演化过程极限结果之间的关系。因此,要更好地描述非对称博弈均衡,就必须正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是,弗里德曼(Friedman 1991)考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论:(1)每一个纳什均衡都是动态系统的静止点(rest point)⑨ ;(2)渐近稳定结果必定是纳什均衡;(3)在对称和非对称博弈中,对所有单调调整过程而言ESS不一定是渐近稳定的;(4)对某些单调调整过程而言,正规ESS是渐近稳定的。在此基础上,他得出了“渐近稳定结果必定是纳什均衡”结论。莱瑞·萨谬尔森和张建波(Larry Samuelson and Jianbo Zhang 1992)在弗里德曼(1991)的基础上进一步考察了非对称博弈的累积单调选择动态(Aggregate Monotonic Selection Dynamic)并得出:在非对称博弈中,单调调整过程能够剔除所有严格劣的纯策略,并且能够确保均衡结果必定是纳什均衡。同时,他们证明了“稳定点必定是纳什均衡”及“渐近稳定结果必定是严格纳什均衡”,进而强化了弗里德曼(1991)的“渐近稳定结果必定是纳什均衡”的结论。

Swinkels(1992)认为,进化稳定标准不对突变策略组合给予适当限制是说不过去的。特别地,在处理某些经济问题时,突变策略可能来自于参与人或者企业的创新、试验等活动,这些突变策略组合本身可能会影响系统的稳定性。因此,考察相对于后进入突变群体最优反应策略组合的稳定性可能会更合理,并且这些稳定性概念很容易由单群体情形推广到多群体N-人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。

定义:称之为相对于均衡进入者的稳健策略(Robust against Equilibrium Entrants REE),如果存在对所有的策略组合及满足:。其中表示突变策略;表示选择突变策略者在群体中所占的比例;表示混合群体;表示突变策略相对于策略x的最优反应策略,他并且证明了REE是ESS的一个子集。然后,他又把REE概念推广到了N-人非对称博弈的情形而提出了均衡进化稳定(Equilibrium Evolutionarily Stable EES)概念:

定义:称集合是均衡进化稳定的(EES),如果它是相对于下面性质的最小集: X是纳什均衡策略集合一个非空闭子集,存在,如果及,那么。

换句话说,EES集是纳什均衡策略集的最小闭集,它能够保证任何小规模的均衡进入突变者不可能使得群体离开进化稳定均衡的吸引域。

三、有限群体上的ESS概念

梅纳德·史密斯等提出的ESS概念另一个缺陷就是,他们为了在技术上处理的方便而认为群体规模无限大,这个假定与现实尤其应用于解决经济问题时并不相符。为了使理论与现实更接近,许多博弈论理论家对有限群体的均衡问题进行了深入的研究。沙弗尔(Schaffer 1988)首次放开群体规模无限大的假定,考察了有限规模群体的进化稳定性并提出了有限群体ESS(Finite Population Ess)概念。他证明“在一般情况下,有限群体ESS并不是纳什均衡策略”。汉森和萨谬尔森(Hansen and Samuelson 1988)分析了经济博弈的演化过程,并把有限群体ESS称之为“普遍生存策略”(universal survival strategy)。他们认为,在现实世界竞争中,未来的利润和可供选择的策略具有不确定性,这就会阻碍企业选择最优化策略,企业必须通过不断的试验、学习过程来寻求有利可图的满意策略 ⑩(不一定是最优策略)。沙弗尔(1989)应用“普遍生存策略”来研究寡头企业之间的竞争并得出结论:通过经济自然选择过程 ⑾而得以生存下来的策略是相对的而不是绝对的利润最大化策略。泰尼克(Tanaka 2000)利用模拟者动态,考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”(Globally Surviving Strategy GSS)。他得出结论的是:在价格与数量竞争的寡头模型中,GSS都是随机稳定的并且在两种情况下它们是等价的。

以上所得到的均衡概念基本上是适应于单群体有限个体情形,并不适应于有限个体多群体博弈。哈佛保尔和西格蒙德(Hofbauer and Sigmund 1988)证明了“两群体对称博弈中不存在混合策略ESS”。泽尔腾(1988)在考察了大量的两人对称博弈的基础上也得出了类似的结论。克瑞斯曼(Cressman 1992)定义了有限两群体非对称博弈的进化稳定策略,1996年对他所定义的概念作了进一步说明。他认为,在模拟者动态下,至少一个群体的突变者所得到的平均支付少于选择稳定策略者所获得的支付,才能保证静止点的渐近稳定性。Garay and Varga(2000)认为,定义有限数目多群体的均衡概念应该满足如下三点:其一是突变者不能侵入他自己的群体;其二是现有群体对来自外部的随机冲击具有较强的抵抗力;其三是多群体ESS定义应该与非对称博弈理论的基本结论一致。众所周知,纯策略模拟者动态的渐近稳定集并不一定是ESS。那么,哪一种动态稳定概念等价于ESS呢?克瑞斯曼(1990)指出,在单群体条件下强稳定性等价于ESS,那么多群体的ESS定义也应该满足多群体稳定性概念等价于多群体ESS。根据这个标准,Garay and Varga(2000)定义了严格N群体ESS概念。其定义如下:

定义:策略组合 称之为N-群体进化稳定策略,如果对每一个,存在,对所有的都有:

框架。

四、随机因素影响下ESS概念

梅纳德·史密斯等提出的ESS概念第三个缺陷是要求突变因素是不连续且不重叠的。原初ESS定义由于仅仅考虑单个因素对系统的影响,所以任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态。帕克和菲尔德曼(Peck and Feldman 1988)认为,由于群体规模和后代数目很大,因而随机因素对动态系统的影响是可以忽略不计的。现实并不是这样,经济演化系统常常会受到来自突变和其他偶然事件的冲击,这些因素可能会对系统产生不可忽略的影响。福斯特和杨(Foster and Young 1990)认为,首先,ESS概念把影响系统的因素都看成是一个个孤立的事件,而在现实中系统常常会受到连续的随机冲击。如果假定有一个因素的影响消失以后,再考虑另一个因素对系统的影响,那么,系统当然就不会远离原来的均衡状态;其次,现实中出现上述情况纯属偶然现象,一个只能处理偶然现象的理论是没有任何存在价值。现实中,尽管单个随机因素对动态系统的影响较少,但它们却可能对系统产生累积作用而定量地改变系统的稳定性,使得系统离开进化稳定状态,系统什么时候回复到当初的进化稳定状态,依赖于动态过程的全局结构,而ESS定义是一个局部概念,因此在考虑随机冲击时就不能作为判断系统稳定性的标准;再次,由于系统的极限行为依赖于初始条件,同时在吸引子集合中只有一部分状态是随机稳定的,且随机稳定状态的选择还依赖于随机过程特定的结构,因此,ESS和一般意义上的吸引子(Attractors)由于没有充分地考虑到随机因素对进化系统的影响,在描述随机系统的稳定性时也很不理想。于是,他们首次把影响系统的随机因素纳入到进化模型之中并提出了一个既不同于传统ESS也不同于吸引子(Attractor)概念的随机稳定性(Stochastic Stability)概念。他们的定义如下:

定义:群体向量是随机稳定的,如果随着随机影响,极限密度对的每一个小邻域都赋有正概率;更精确地说,其中。其中是当时,的极限分布,表示随机因素对系统所产生的影响。

粗略地说,一个状态P是一个随机稳定的,如果在长期中,随着随机冲击因素影响的不断变少,系统几乎一定(nearly certain)不会离开P的任意少的邻域。随机稳定的群体向量总是存在的,它有如下性质:随着及,它是一个最小闭集。接着,他们又提出了更一般的概念----随机稳定集(Stochastic Stable Set)。随机稳定集 是一个满足如下条件的状态集合,即从长期来看,随着随机冲击的不断变少,系统几乎一定处于包含于S的任何一个开邻域中。随机稳定集概念的提出把传统确定性动态模型中的ESS拓展到随机性动态系统中,并且它是一个比进化稳定策略集更精练的概念,是进化稳定集的子集。随机稳定集已经成为描述随机动态系统的基本均衡概念。

五、ESS与动态的结合

从ESS的定义可以看出,它只能描述系统的局部动态性质而与系统的全局动态过程无关,然而,要更准确地描述一个系统的动态性质就必须对仔细考察整个系统的动态调整过程。泰勒和乔克(Taylor and Jonker 1978)首次把传统的ESS定义用模拟者动态模型表示出来,他们证明在一个多群体的模型中,进化稳定策略是渐近稳定的充分但非必要条件。但他们没有作出进一步的研究。鉴于此,吉尔博和马特休(Gilboa and Matsui (1991))在考察群体行动态调整过程的基础上,提出了“循环稳定集”(Cyclically Stable Set)又一均衡概念。“循环稳定集”直接来源于群体行为的调整过程,其基本思想是“可接近性”(Accessibility)。一个策略分布f称为可以从另一个策略分布g接近是指,如果存在一条从f到g的道路,且在该道路方向上任何一点都是相对于该点的最优反应。“循环稳定集”是指在满足“可接近性”条件下是封闭的策略分布集合(在该集合中任何两个分布之间都是接近的)。与一般均衡理论不同,仅当参与人按照均衡策略而作出选择时才有效,CSS并不要求群体保持这种决策状态。CSS的直观意义是,在一个很短的时间间隔内,只有少部分人离开或者死亡并且由一些新来的人(新生的孩子)代替,这些新来者从他们的母体那里继承一些行为模式,并且在现行预期(也就是说他们并不关心行为模式未来的变化)条件下作出最优的反应,一旦新来者选择了某一行动,他就会一直坚持下去(转换成本的存在是他坚持这个行动的一个重要原因)。马特休(Matsui 1992)给出了一个“稳定”策略的静态表述,在存在对原群体中各策略的初始分布冲击的情况下该策略能够保持这种分布。斯温克斯(1992)在马特休的基础上提出了“群体稳定策略”(Socially Stable Strategy SSS)。相对于均衡的进入者而言,所谓“群体稳定策略”是指如果存在一个突变群体(或者进入者群体,譬如说群体A),其支付高于原群体的支付,那么必定存在另外一个群体(如群体B),在这个包含大部分原群体个体而有一少部分群体A的个体的群体中,群体B将获得高于群体A的支付。这个概念也称为“稳健策略组合”。当然在某些情况下,“群体稳定策略”可能并不存在,但不是这个概念本身的缺点,出现这种情况与我们所研究的动态过程本身是分不开的。然而,我们可能会问,实际的行为模式又是怎么样呢?如果这个过程并不是稳定状态,那么稳定状态又是什么呢?在对这个问题作出回答时,马特休利用了吉尔博和马特休(1991)所提出的集值解的概念(Set-valued Solution),同时他也证明了循环稳定集的存在性。Binmore and Samuelson(1993)把参与人的学习过程纳入到了进化模型中并提出了自我强化均衡[10](Self-confirming Equilibrium)。他们认为,每个参与人都会通过自己的经验来推断对手可能选择的策略而作出最优反应,这个学习过程可能使得系统在不同自我强化均衡的吸引域之间漂移而不会停留在某一个均衡,由于在非均衡路径上的推断不一定正确,所以自我强化均衡可能不一定是纳什均衡。

结束语

进化博弈理论从发展到现在虽然只有二十几年的历史,但它却受到社会学、经济学、生态学们的普遍关注。特别是该理论的基本均衡概念----进化稳定均衡提出以后,理论界已经从不同的方面对它进行了拓展,并取得了令人瞩目的成果,使进化博弈理论体系得到了在发展中不断完善。进化博弈理论具有较强的实用性和广阔的发展前景 ⑿,相信它会引起更多经济学家的兴趣,必将成为主流经济学的一部分。

注释: ①张良桥:中山大学岭南学院经济学系数量经济学硕士研究生,广东省顺德职业技术学院经济管理系教师(邮政编码:528300;联系电话:0765-2338029;13825507060,值此文发表之际谨向他们致以深深的谢意,同时要感谢经济管理系的仇颖老师对此文中英文名字进行了认真的翻译。 ②生物学家在研究生态现象时发现,利用纳什均衡可以很好地解释生物进化结果。然而,生物是没有思维的更谈不上理性要求了,它们的行为却可以趋于纳什均衡,因此,理性要求并不是纳什均衡的必要条件。这样,生物进化论与博弈论的结合便成为可能,为进化博弈理论的产生奠定了基础。进化博弈理论以群体(Population)为研究对象,主要处理群体中近视且幼稚的(Navie)个体进行重复、匿名博弈的动态调整过程。其基本思想为:给定群体所处的状态,随着时间的演化更合适的策略会被更多参与者采用,其目的是为预测群体最终行为提供一个理论依据。 ③此后本文称之为原初定义 ④实际上相当于吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。 ⑤如长颈鹿进化的过程。 ⑥对群体模型为无限大的要求有两个原因:其一是机械式的,为了假想的“侵入界限”(Invasion Barriers)也就是突变者群体在大群体中所占的份额(Population Share),当突变群体模型超过1/n时,n是大群体的个体数,突变群体就有可能侵入到大群体,进化稳定策略的条件就有不满足了。其二是技术上的,群体模型足够大,就可以忽略掉现行群体个体的行为对其他突变者群体未来行为的影响,即不考虑学习过程。 ⑦其中的支付是生态学上的适应度(Fitness)或繁殖成活率。 ⑧下面我给出Van Damme1987的证明:首先设是进化稳定的,并且令所有参与人都选择不变的策略。令,对所有的。令,其中,那么对所有,满足及,因此,由进化稳定性可知。所以,而是任意的,所以。其次,设是一个严格纳什均衡策略,并且,那么至少存在一个满足,由的连续性可知,至少存在一个,对所有及,至少存在一个 满足:,这就说明 是进化稳定的。 ⑨静止点(Rest Point)就是当动态系统处于静止点时就不会离开该点。 ⑩Alchian(1950)指出,企业必须通过对所观察到的市场参与者的行动与结果之间的比较来得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的选择过程,每一个企业所能够选择的策略不随环境的变化而变化。在每一个阶段结束时,如果企业1的利润大于企业2的利润,那么企业1在下一阶段生存下来的概率就大于企业2在下一阶段生存下来的概率。相应地可以把企业的生存规则看作为策略的幸存,成功策略在群体中所占的比例通过企业之间对策略的模仿而得以增长 ⑿杨小凯教授(1995)认为,博弈理论当前最有趣的研究成果及日后有可能获得诺贝尔奖的工作就是信息不对称的动态博弈模型,以及对策游戏规则演化模型(也就是进化博弈模型)。事实上1996年及2001年的诺奖都属于研究信息经济学的经济学家,这说明杨教授具有超前的预见性,进化博弈理论研究者虽然还没有获得诺贝尔经济学奖,但也可以说明杨教授非常看重对进化博弈理论的研究。

[参考文献]

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .

[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.

[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.

[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.

[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.

[10] Fudenberg, D. (1998): Learning in Games, Cambridge MIT Press.

[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.

[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.

[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.

[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.

[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.

[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.

[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.

[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.

[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.

[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.

[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.

[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.

[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.

[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.

[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.

[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.

[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.

[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.

[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.

篇2

一、两个简单的例子

1.1 老鹰(Hawk)与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。

本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰(Hawk)与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:

操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。

1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。

1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:

说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:

化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。

与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。

[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。

[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

篇3

[4]李真.互联网金融征信模式:经济分析,应用研判与完善框架[J].宁夏社会科学,2015,(1).

[5]中国网络信贷行业发展报告(2014-2015)http://.cn/skwx_ps/bookdetail?SiteID=14&ID=3955175.

[6]中国征信业发展报告.http:///gzdt/att/att/site1/20131212/1c6f6506c5d514139c2f01.pdf.

[7]程鑫.互联网金融背景下征信体系完善所面临的机遇与挑战[J].上海金融,2014,(11).

[8]何树红,杨采燕.我国信用体系的健全与商业银行信贷风险的控制[J].经济问题探索,2009,(2).

[9]四川银监局课题组.互联网金融对商业银行传统业务的影响研究[J].西南金融,2013,(12).

[10]许天骆,王亭熙.博弈论域下商业银行信贷的风险控制[J].统计与决策,2012,(12).

[11]彭鹏,罗剑朝.中国信用制度设计的博弈分析[J].西安电子科技大学学报:社会科学版,2006,16(5).

篇4

 

知识经济时代,知识管理的逐渐普及和深化,使得知识共享的地位日益突出。知识共享作为知识管理的关键环节,在提高企业对环境的应变能力和知识创新能力方面有巨大的推动作用。越来越多的企业清楚地认识到,只有致力于知识的共享,才能把分散于个体头脑中的零星知识整

1文献回顾<

在知识经济中,绝大部分知识将通过共享得到应用,个人独占形式的知识将微不足道,共享成为知识价值实现的一种形式,也成为知识增值发展的一种途径。鉴于知识共享的价值和重要性,国内外已有研究人员就知识共享进行了大量的研究企业文化论文,国内对知识共享的研究要晚于国外。通过文献的查询和阅读发现目前国内的研究方向大致集中在对企业知识共享中存在的障碍及对策的分析,如文献[1];对知识共享机制的研究,如文献[2]的研究;企业文

2企业研发团队知识共

2.1知识共享

知识共享(Knowledge Sharing)的概念是伴随着知识管理理论和实践的产生而出现的,在最初的知识管理研究中,学者们只是把知识共享看作知识管理的一个子内容来研究。随着知识管理理论及其实践的逐渐普及和深化,管理者们逐渐认识到组织实施知识管理的

对于知识共享的概念,目前学术界还没有统一的定论。很多学者用不同的文字从不同的角度对知识共享进行了解释和描述,如有的学者从沟通的观点用知识转移(Knowledge Transfer)来描述知识共享,认为知识是通过个体之间的沟通交流来实现知识从拥有者到接受者的转移[2];有的学者从知识社区的视角用知识扩散(Knowledge Distribution)来描述知识共享,认为知识共享就是知识在知识社区内的扩散过程,从而实现知识的增值[6];还有的学者从市场交易的观点用知识交易(Knowledge Transaction)来描述知识共

2.2企业研发团队的

企业研发团队的知识水平决定了企业开发新产品的能力。企业研发团队的成员都是高水平的知识工作者,都拥有很专业的知

结合以上关于知识共享的定义和企业研发团队的实际,可以将研发团队的知识共享理解为将研发团队中从属不同个体的知识进行整合的过程,在这个过程中研发团队成员之间不断地进行沟通和学习小论文。在知识共享的过程中,研发团队中作为知识提供者的个体成员将其本身所拥有的知识、技能、经验等外化,提供出来,以获得某种有形或无形的收益;而作为知识接收者的其他成员通过各种方式与知识提供者互动学习

3企业研发团队知识共享的

3.1进化博弈

进化博弈论(Evolutionary Game Theory)是近年来博弈理论的新发展,最初产生于生物学领域。进化博弈论是基于生物进化论,以有限理性为前提的实用性较强的博弈理论,它突破了传统博弈论对参与人完全理性假定的限制。以进化理论为基本的进化博弈理论的基本思路是:在具有一定规模的博弈群体中,博弈双方进行着反复的博弈活动[2]。进化博弈论遵从生物进化论中“物竞天择,适者生存”的基本原则。在进化博弈论中,由于有

在进化博弈论中企业文化论文,最核心的概念是“进化稳定策略”(Evolutionary Stable Strategy ,ESS)和“复制动态”(Replicator Dynamics)[8]

若策略s*是一个ESS,当

s*构成一个Nash均衡(即对任意的s,有u (s* ,s*)

如果s*s满足u (s* ,s*)= (s*,s),则必有u(s* ,s*)>u(s,

复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程。根据进化的原理,一种策略的适应度或支付(Payoff)比种群的平均适应度高,这种策略就会在种群中发展,即适者生存体现在这种策略的增长

=[u(k ,s)-u(s ,s)],k=1,2…K

其中为一个种群中采用策略k的比例,u(k ,s)表示采用策略k时的适应度,

3.2研发团队知识共享进化

由于掌握知识的个体的创新能力高于没有掌握的个体,所以其所得的企业报酬相对要高,加之知识共享使得员工充满不安全感,于是就产生了知识共享的障碍,这里将这些障碍因素看作一个综合效益参数。

研发团队知识共享的进化博弈的支付

表1 博弈双方的支

知识共享者S

知识独占者M

 

 

共享(Co)

篇5

企业内部的知识有多种形式,如个人经验、产品信息、客户信息、工作流程、各种文档。企业知识共享,就是员工互相交流彼此的知识,使知识由个人的经验扩散到企业的层面,从而提高企业的工作效率。知识共享在企业中产生的是一种知识放大效应,它通过知识管理等手段,使企业的知识资源不断得到整合与利用,从根本上推动企业竞争能力的提升。

进化博弈理论与企业知识共享机制

对于企业知识共享机制问题,可以用博弈理论进行研究。目前,国内一些研究已对此做出了初步的探索,如用“囚徒困境”模型解释不愿知识共享的问题,但是这些分析研究均是应用经典博弈理论进行分析。经典博弈理论从博弈方的完全理性出发,在信息充分的前提下找到了博弈的均衡解。然而对现实中的决策行为者来说,完全理性是很难满足的高要求。当社会经济环境和决策问题较复杂时,人的理性局限是非常明显的。因此要保证博弈分析的理论和应用价值,必须对有理性局限的博弈方之间的博弈进行分析,进化博弈论从有限理性的个体出发,以群体行为为研究对象,合理解释了生物行为的进化过程。生物进化中生物性状和行为特征动态变化过程的“复制动态”,在有限理性博弈分析中正是模拟有限理性博弈方学习博弈和调整策略过程最主要的动态机制之一,而生物进化理论中具有在动态调整过程中达到,在受到少量干扰后仍能“恢复”的稳健性均衡概念“进化稳定策略”,正是有限理性博弈分析最核心的均衡概念,或者说动态策略稳定性概念。

一般来说, 在企业内部的知识共享行为上,行为主体的理性层次较低。这主要是因为这类决策是群体决策,而行为是企业行为。此时行为主体意识到错误和调整策略的能力较差,其行为变化更多的是一种缓慢进化而不是快速学习与调整机制。因此可以用生物进化的复制动态机制模拟,即进化稳定策略(ESS)。在重复博弈中,具备有限信息的个体根据其既得利益不断地在边际上对其策略进行调整以追求自身利益的改善,不断地用较满足的事态代替较不满足的事态,最终达到一种动态平衡。在这种平衡中,任何一个个体不再愿意单方面改变其策略,这种平衡状态下的策略称为进化稳定策略。因此,利用进化博弈的方法分析企业知识共享机制更加接近于现实情况,也更有实际意义。

理论基础和模型构建

(一)理论基础

假定两类行为主体均采用纯策略,令S是行为主体所有纯策略的集合,(S)代表所有在t阶段采用纯策略s∈S的行为主体集合,定义状态变量θt(S)表示在t阶段采用纯策略 s的行为主体的群体比例向量,于是有:

根据前面的假设,有限理性的行为主体有一定的统计分析能力和对不同策略收益的事后判断能力, 收益较差的行为人迟早会发现这种差异,并开始学习模仿另一类行为人, 因此行为人的比例是随时间而变化的,是时间的函数。上述比例随时间变化的速度取决于行为主体的学习模仿速度。学习模仿速度取决于两个因素: 一是模仿对象数量的大小(可用相应类型的行为人的比例表示),因为这关系到观察和模仿的难易程度;二是模仿对象的成功程度(可用模仿对象的策略收益超过平均收益的幅度表示),因为这关系到判断差异的难易程度和对模仿激励的大小。于是,有以下连续时间的动态模型:

这是一个模仿者复制动态方程,在本模型中,有如下的定理:

定理(Fudenberrg,1998)模仿者动态的一个稳定稳态是一个纳什均衡,更一般地说,具有源于内部路径限制的任何稳态都是纳什均衡。反之, 如果对于一个非纳什均衡,存在一个σ>0,所有内部路径最终将从该稳态的σ邻域内被清除。

(二)模型构建

假设与前提条件。

1.博弈方:假设该博弈方都是有限理性,且划分为两类,即同事群体1和同事群体2。分析的框架是反复在两个群体中各随机抽取一个成员配对进行博弈。博弈方的学习和策略模仿局限在他们所在的群体内部。这样我们就可以分别对两类群体进行复制动态和进化稳定策略分析。

2.行为策略。博弈方都有两种行为方式:共享;不共享。如果他们的知识都不愿共享,相互封锁,那么个人的知识就会出现低水平重复,使他们各自获得的利益不多,假设为0收益;如果有一个企业成员打破常规,进行知识共享,那么他就获得m(0.5<m<1)发展机会,但共享者是有学习成本z的;如果他们的知识都实行共享,就会获得更多的发展机会p(m<p<1),此时各有学习成本z。

3.行为策略的采取比例。博弈方中可能采取“共享”与“不共享”的比例分别为x、1-x。

4.得益矩阵。用w表示参与人的收益。随机博弈中双方的得益矩阵如图1所示。

企业知识共享行为的博弈分析

由得益矩阵可知,该博弈的纳什均衡取决于其中P、m、z的具体水平或者说相对水平。根据上述假设,按照博弈的一般公式:

博弈方1中,“共享”类型参与人的收益为:

根据进化稳定策略的性质, 一个稳定态必须对微小扰动具有稳健性才能称为进化稳定策略。也就是说,作为进化稳定策略的点x*,除了本身必须是均衡状态外,还必须具有这样的性质,即如果某些博弈方由于偶然的错误偏离了它们,复制动态还会使x恢复到x*。在数学上,相当于要求当干扰使x出现低于x*时,必须大于0,当干扰使x出现高于x*时, 必须小于0。这就是微分方程的“稳定性定理”。

当0<(m-x)/(1-P)<1时,上述进化过程复制动态的三个稳定状态都是合理的,因为都处于0≤x≤1的有效范围。这时候复制动态方程的相位如图2所示。

由图2可以看出,x*=(m-z)/(1-P)是进化稳定策略。这意味着一旦企业内少数成员开始共享,那么随着获得利益的机会增多,就有更多的成员进行仿效,开始共享,直到组织中成员共享的数量比重为x*=(m-z)/(1-P)。如果超出这个比重,甚至所有的成员都进行共享,那么就会出现有些成员不愿贡献自己的知识让他人共享,反而利用其他成员创造环境氛围,从中牟利,出现“搭便车”的现象,最终仍然回到了x*=(m-z)/(1-P)的均衡比例。

随着支付矩阵的不同取值,x*可能与其它的两全解相等或者不存在第三个解,博弈退化为只有两个稳定态。

当(m-z)/(1-P)<0,也就是m由图3不难看出,这时候复制动态的唯一稳定的均衡点为x*=0,也就是说企业所有的成员都是不愿共享的。只要不是一开始所有成员都是共享型的极端情况,最终都会在长期的动态变化中趋于不共享。即使是所有成员都共享,只要在组织内部有不共享的人出现,就会破坏共享学习的氛围,破坏整个企业的现状,企业去管理就会增加成本,这样企业反而不去管,最终会趋向所有成员都不愿共享的均衡。

当(m-z)/(1-P)>1,也就是m-z>1-P的情况。此时,复制动态的三个不动点中也只有x*=0和x*=1两点符合要求。复制动态方程的相位如图4所示。

由图4可以看出,现在的进化稳定策略是x*=1,也就是所有的成员都共享,整个企业组织就是学习共享型的。在社会环境和成员的素质都很好以及从学习中获得的收益远远大于成本代价时,这样的条件下是合理的。

通过对以上三种情况的分析,我们可以知道,企业知识共享机制是个长期的问题,无法以短期来解决。企业中的成员不是每个都是知识共享型的,而是存在着“搭便车”的现象,在有限理性的条件下,不是所有的企业都是知识共享型的,不是所有的企业都能做到长期性的知识共享。这也可以解释我国有很多的企业在实施知识管理,但真正取得好的结果的却并不多。

企业知识共享的行为演化机制

通过进化博弈的参数分析,可以看出企业知识共享机制的进化博弈包括如下几种可能的行为演化机制。

企业知识共享机制的选择机制,即在博弈中能够获得较高收益的策略,在以后演化过程中被更多的参与者选择。通过进化博弈的得益矩阵分析,使企业知识共享机制容易实现较高效率进化策略均衡。只要调整好P、m和z的大小,就可以保证较高效率的企业知识共享机制顺利进行。具体来说是要求用更低的成本z,创造更多的发展机会P和m,企业就会促使更多的工作人员去实施知识共享。为此企业需要加大内部不共享行为的机会成本,务必对企业内部成员的知识自私行为进行惩罚和压制,以提高这种变异的门槛,使这种不愿知识共享的行为成为一种风险很大收益很小的活动,从而压缩不实现知识共享者的生存空间,避免企业内部的知识共享机制向不利的方向演进。

企业知识共享机制的放弃机制,即在博弈中获得较低收益的策略,在以后演化过程中被更多的参与者放弃。在进化博弈分析的第二种情况下,由于m企业知识共享机制的突变机制,即参与者以随机(无目的性)的方式选择策略,其中包括突变策略,参与者将选择获得较高收益的策略。通过进化博弈的得益矩阵分析,使p-z 变大或1-m 变小,促使(p-z)-(1-m)增大,保证企业较易地实现较高相互支持、相互协作、相互沟通,鼓励和促进企业内部的知识共享行为,褒扬部门、同事的团队精神,把知识共享变成一种自动机制,从而使企业内部采取知识共享行为者获得较高的收益,这样使企业内部采取少数不共享行为的人所占的比例越来越小,提高企业知识共享机制向理想方向进化的可能性和比例,从而促进企业知识共享机制向最理想的方向演进。

参考文献:

篇6

Study on the Enterprise Competitive Behavior Based on Evolutionary Ecology and Evolutionary Stable Strategy

HE Qiang1, ZHAO Tao2(1 School of Humanistic Management Tianjin University of Traditional Chinese Medicine, Tianjin 300073;2 Buchang pharmaceutical Co. Ltd, Xi’an 710075)

Abstract:The article study the knowledge of the evolutionary ecology and evolutionary stable strategy, and analysis the competition behavior of the enterprise by the help of the hawk-dove game model, Bourgeois optimization. And give the general model for evolutionary stable equilibrium.

Key words:Evolutionary stable strategy (ESS); Evolutionary stable equilibrium; Hawk-dove game

一、引言

在分析动态竞争的理论工具中,由于竞争的动态性与互动性,所以博弈论是一个比较适合的研究工具。这也使得博弈论成为研究行为生态学和动态竞争的共同工具。而演化博弈论则是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它既不同于博弈论将重点放在静态均衡和比较静态均衡上,又不同于早期的演化经济学忽视静态均衡分析的意义而流于动态的不可知论。演化博弈论源于生物进化论,相当成功地解释了生物进化过程中的某些现象,并在分析社会习惯、规范、制度或体制形成的影响因素及其自发形成过程中,也取得了令人瞩目的成绩。演化博弈论目前已成为演化经济学的一个重要分析手段,并逐渐发展成一个经济学的新领域。

传统的博弈理论集中讨论博弈均衡,尤其是纳什均衡(又称非合作均衡,是指博弈中,当其他参与人的策略既定时,没有任何一个参与人还能改善其收益。)及其精炼解传统博弈论解的概念是以博弈规则、参与者的理性以及参与者的收益函数都是共同知识为前提的。然而现实中的人们并不是在对博弈结构及参与者是理性的这些事完全认知的前提下,对博弈进行理性预测并采取行动的。另外,传统的博弈论只考虑最终的均衡结果,而忽视了系统是如何达到最终均衡的,以及系统经过多久才达到均衡的。当完全理性被有限理性所代替,旧的方法不再适用,这就需要一种新的研究方法,人们把目光投向了一门新兴的方向――演化博弈论。演化博弈论的基本思路认为,有限理性的经济主体不可能正确地知道自己所处的利害状态,它通过最有利的战略逐渐模仿下去,而最终达到一种均衡状态。在这样变化的系统中,采用支付盈利高的战略的人数比率逐渐上升,这便引出了ESS均衡的概念。ESS均衡又称进化稳定策略均衡,是动态博弈理论的核心概念之一,当博弈参与人构成的某一群体内所有个体都采取某种策略后,其他参与人不能侵入该群体,它是一种长期的动态纳什均衡。

进化稳定策略(ESS)是Maynard Smith(1974)在博弈论的基础上提出来的,是进化论和博弈论的结合,在社会学、经济学和生态学领域获得了广泛的应用。Dawkins(1976)非常推崇ESS概念,他认为:我们可能最终不得不承认ESS概念的发明是达尔文以来进化理论上最重要的发展之一,凡是有利害冲突的地方它都适用,ESS概念使我们第一次能够清楚地看到一个由许多独立的自私个体所组成的群体是如何变得像一个有组织的群体。

这个定义的核心思想是提出了相对优势的概念,与以往的绝对优势概念不同,它并不认为生物在进化过程中会选择最优的策略。针对一个进化事件,生物群体一开始会采取多样化的反应策略,但随着时间的推移,最终会停留在一个相对优势的策略上,即群体中的大部分个体采纳的策略,而少数突变个体的策略在竞争中获胜的概率将会很小。它类似于纳什均衡当中的吸引域,除非有来自于外部的强大冲击,否则系统就不会偏离进化稳定状态,即系统会“锁定”于此状态。这个定义的直观解释是,当一个系统处于进化稳定均衡的吸引域范围之内时,它就能够抵抗来自外部的小冲击。

这个基本理论可以应用到动物、植物等生物体的演化分析上。同时人们的行为有时也可以被看作为一种演化过程的结果,人的某些行动表现出的继承行为的结果多于理性选择的结果,因此这个理论也可应用于社会经济系统的行为分析。

ESS策略是生物进化过程中的一个普遍现象,几乎所有的优化都涉及这样的策略。虽然ESS目前最成功的应用是种内或种间个体竞争行为的分析,这在很大程度上依赖于ESS数学解析能力的发展。但是ESS包含的生物学意义远不止于此,它能够帮助我们更好地理解生物进化、生物多样性以及生态系统无可比拟的复杂性,从某种程度上来说,它是一种哲学观点,而不仅仅是一个数学定义。达尔文的进化论认为自然选择是进化的动力,变异是进化的基础,最适应环境的个体有较多的机会传播自己的基因,任何有利的突变都有可能被固定下来,因此进化是渐进累积式的。然而,从ESS的观点来看,进化是一个寻优的过程,当达到一个相对优势的状态时,生物的进化过程就会稳定下来,直到下一次寻优过程启动,宏观上表现为跳跃式的进化模式。

以上基于演化博弈论基础上的ESS策略选择所表现出的跳跃式的进化模式也能更形象地用于企业战略演化过程的分析。在企业的实际运营中,企业的战略既需要调整以适应外界环境的变化,同时,又不得不在一定时间段内保持相对的稳定性。一个公司的战略,如果失去了前者的变化与调整,企业战略将走向僵化,企业也将走向消亡;而一个战略没有了后者相对的稳定性,企业员工将无所适从,后果是任何战略都难以最终落实。

二、进化稳定策略ESS与进化稳定均衡

演化理论中适者生存的思想以及由此衍生的最适性理论的研究均指出:自然选择总是倾向于使动物最有效地传递它们的基因,因而也是最有效地从事各种活动,包括使它们在时间分配和能量利用以及竞争行为的选择方面达到最适状态。然而,这一理论的挑战在于:经常很难找到一个单一的、显而易见的最适行为对策。因为在生物群体行为中,一个行为的价值要视群体中其他个体的行为而定。

为了从理论上解决这一问题,就不得不寻找一种对策或一组混合对策,这种对策是被群体成员中大多数所采取的,而且不会受到其他任何可选对策的侵蚀,这样的对策就称为进化稳定对策(ESS)。ESS的基本特性就是它的不可侵蚀性,即ESS一旦被群体中大多数成员所采纳,该群体在进化过程中就会保持稳定。“对策”在此处应当被理解为一种群体应对预案,应当特别加以说明的是,对策并不是个体有意识地制定出来的,而是自然选择的产物。比如“如果对手逃跑就追击,如果对手还击就逃跑”就可以视其为一种对策。下面通过鹰鸽博弈来引出进化稳定对策(ESS)。

(一)鹰鸽博弈策略分析

在企业战略竞争行为的选择上,基本上可分为两种类型:一种是强硬型,被称为鹰派或鹰对策(以下简称为鹰);另一种是妥协型,被称为鸽派或鸽对策(以下简称为鸽)。鹰竞争起来总是全力以赴、孤注一掷,除非身负重伤,否则绝不退却;而鸽则总是以惯常的方式进行威胁恫吓,但从不伤害对方。当一个鹰对策者与一个鸽对策者相遇时,鸽总是逃跑,因此鸽从不会受伤;当鹰和鹰相遇时会一直打到一只鹰重伤或者死亡为止;当鸽和鸽相对时,双方谁也不会受伤,但它们可能长时间摆出对峙的架势,直到其中一只感到厌烦或者疲倦而决定不再对峙下去,从而做出让步为止。

在以上场景设置中,所谓的鹰和鸽,只用作对对策使用者的区分,并不代表真正的鹰或者鸽子。所以,从外形以及其他外部特征上是无法在竞争对峙行为之前加以区分的,必要时,参与者(Player)还可能特意伪装成另外的角色模样。为了便于明晰两类对策的不同应对结果,假设:赢一场得100分,输一场得0分,重伤得-200分,长时间对峙浪费时间得-20分。得分高的个体则意味着能在种群基因库中留下较多的基因。那么在如此的状态下,鹰对策和鸽对策哪一个是进化稳定对策?显然,不管是鹰对策还是鸽对策,单凭其自身的力量不可能在进化上保持稳定,因此,它们之中的任何一个都不可能得以进化。

如果种群全由鸽对策个体组成,则每次竞争总是其中一方得胜者得100分,但因与对方对峙成本扣20分,净得80分;另一方退却收益得0分,扣去对峙成本净得-20分。由于每只鸽输赢概率各半,因此平均得分是(80-20)/ 2=30分。在以上这个看起来不错的博弈对策中,如果因为基因突变出现一个鹰对策者,它每次竞争都是同鸽进行,结果总是赢,每场净得100分。此时其平均分也是100分,与30分相比,鹰占有优势,于是鹰的基因得以在种群中流传,但是,此后鹰再也不可能遇到它以后的对手都是鸽子的局面。

与以上相对的另一个极端是,如果鹰基因的流传最终使得整个种群都成了鹰的天下,那么所有的竞争都是鹰对鹰了,结果总是一方得胜得100分,另一方重伤得-200分,因为大家都是胜负几率各半,所以平均净得分是(100-200)/ 2=-50分。此时,如果鹰种群中基因突变产生一只鸽对策者的话,尽管它每次竞争都是要输,但是因为不受伤,平均下来得分为0。比鹰的收益要大,于是鸽的基因就会在种群中流传开来。

从以上两段分析可以看出,纯鹰或者纯鸽都是不稳定的,似乎会出现从鹰到鸽,再从鸽到鹰的有规律的周期性摆动,但事实上不是这样,当鹰和鸽之间达到一个平衡比例后,这一状态即会被稳定保持下来。

假定一个群体中鹰的数量比例为p,则鸽的数量比例为1-p,博弈的平均收益矩阵为:

通过以上计算可知为“鹰”:“鸽”=7:5时最稳定,此时鹰与鸽的平均净得分完全相等。在这个平衡比例下,如果群体中鹰的数量开始上升,则鸽会获得额外的优势,这将迫使鹰的比例下降,从而使群体恢复平衡。当然,鸽对策者上升的结局也是如此。

在按以上比例组成的稳定群体中,每个鹰和鸽个体的平均得分都是25/ 4分。可以看出,这个比分比纯鸽种群的个体平均分少很多,也就是说,如果大家都同意成为“鸽”,那么每个个体将获益更多。所以说,生活在清一色的鸽种群中,每一只鸽的境遇要比上述稳定种群中的鸽好一些。但问题是,鸽群中如果出现一只鹰,那么任何力量也无法阻止它的进化,它单枪匹马就会创造无与伦比的业绩,这个最佳获益群体就会因为出现内部的背叛行为而土崩瓦解。可见,ESS种群的稳定并不是因为它特别有利于其中的个体,而仅仅是由于它不会存在内部背叛行为的隐患。当然,ESS种群的稳定也可以通过下述方式达到,即每个个体都能采取上述两种对策,但采取鹰对策和鸽对策的概率分别是7/12和5/12,而且必须是随机的,因为只有随机才能保证任何一个对手事先无法猜出对方在竞争中将采取何种对策。那种以为一个个体连续7次采取鹰对策,再连续5次用鸽对策的简单思维是绝对不可取的,因为它的对手很快将识破这种对策并采取相应的防御对策。

(二)鹰鸽博弈的Bourgeois对策优化

以上是进化稳定对策的一个简单举例,经过丰富发展,就可以更加接近实际的复杂模型。比如,在以上两种对策的基础上,增加以下原则便形成Bourgeois对策。Bourgeois对策者的行为表现是:当自己是资源占有者时表现为鹰,当自己是入侵者时表现为鸽。假定其两种表现的机率相等,那么按上述得分标准,其收益矩阵便如下表2所示。

对以上不同对策的收益分析后可知,Bourgeois对策是一个进化稳定策略ESS。如果群体成员都采取这一对策,那么当出现两个个体争夺资源的情况时,就不会出现竞争升级的后果,因为其中一个个体是资源占有者,而另一个个体则是资源入侵者。这样,每一个Bourgeois对策者在博弈中的平均得分都是+40。可见,Bourgeois对策既不会受到鹰对策的侵蚀(因为鹰对策的平均分是+25),也不会受到鸽对策的侵蚀(鸽对策平均分只有+15)。事实上,在上述博弈中,Bourgeois对策是唯一的ESS,因为如果群体成员都是鹰,那么鸽和Bourgeois都会侵蚀这一种群;同理,如果群体成员都是鸽,那么Bourgeois对策和鹰也会侵蚀这一群体,从而获得更高的得分。只有当群体内全体成员都是Bourgeois对策者时,才不会受到任何其他对策的侵蚀,而ESS的本质特征便是不被侵蚀性。所以,面对一个互动的、多次博弈的、不确定性的竞争对抗,最有意义的不是寻找什么对策是好对策,而应当探究什么对策才是一个进化稳定对策(ESS)。

关于资源占有者总是能在竞争中获胜的原因分析,Krebs于1982年研究大山雀的领域防御时,验证了如下假设:资源占有者从竞争中获得的东西,要比资源入侵者多,因此它们的竞争意识较强,并愿意为竞争付出更多代价;另一方面,资源占有者对它们为之争夺的资源价值更为熟悉和了解。正是因为资源占有者在此类对抗中占据绝对优势,而且对抗双方都明白这一点,因此才有了Bourgeois对策的胜出。

正如前文指出的那样,在这个场景中,所谓的鹰和鸽只是对策使用者的区分,并不代表真正的鹰或者鸽子,而是企业战略竞争行为性质的区分。强硬型竞争行为被称为鹰派或鹰对策,妥协型的竞争行为被称为鸽派或鸽对策,因此,以上分析有着较强的典型性与代表性。

在企业现实的战略对抗与竞争中,有一个经常出现的现象:追随者如果采用与行业领先者同样策略进行竞争的话,一般而言是没有希望胜出的。因为市场领先者非常熟悉其胜出的逻辑,了解其成长路径中的关键环节,知晓竞争过程中的节点所在,所以能非常有针对性地采取策略对跟随竞争者予以最有效地打击。这也是ESS进化稳定对策中Bourgeois模型解释的最佳实践验证。(三)进化稳定策略(ESS)鹰鸽博弈的数学模型

通过上述分析可知进化稳定对策(ESS)不一定是报偿最高(最好的)的对策,但它是一种不会受到其他任何对策侵蚀的应对策略。这一理论恰恰契合了企业在制定与选择战略时的现实行为:企业面临激烈竞争和变化的环境时,选择战略对策并不一味地追求利润最大化的战略方案,而是选择一个稳定的利润回报率相对满意的战略对策。

同时也可以看出进化稳定策略的结果会依据博弈收益和博弈成本的不同,发生很大的变化,进而影响着策略的选择。考虑到竞争行为中鹰对策与鸽对策有着广泛的代表性,下面,依据以上内容将鹰鸽博弈的一般模型建立起来。

参照博弈知识体系,本文将鹰对策和鸽对策均称为参与者(Player),这里简称为鹰和鸽;不同对策所获得的不同所得,这里称为收益。一方赢得一场竞争的收益是V(Value),在竞争中严重受伤的代价是W(Wound),对峙的成本为T(Time,T

1.鹰攻击鹰

在其他条件都相同的情况下,每只鹰的胜败机会各半,胜者将得到V单位收益,败者将付出W单位的代价。由于胜负概率相等,所以每只鹰的平均净收益为两值的平均数。即:

2.鹰攻击鸽

鹰攻击鸽时,鹰总是赢,而且不会因为受伤付出代价,也没有时间对峙的成本,所以鹰的平均净收益为V。

3.鸽遇到鹰

此种情况下,鹰一定会抓住机会攻击鸽,而且鹰会赢。但是鸽会因退却而不会受伤,也没有时间对峙成本,所以鸽的净收益为0。

4.鸽遇到鸽

鸽遇到鸽时,在其他情况相同的条件下,每只鸽的胜败机会也均等。但双方均会因长时间对峙而付出成本T。胜方获取资源V,净收益为V-T;败者无资源获取,仅付出对峙成本T,所以净收益为-T。由于胜负机会均等,所以平均净收益为:

通过以上分析可知纯鸽群体与纯鹰群体都不是ESS,但由一定比例的鹰和鸽所构成的混合群却可能是稳定的,而且可以计算出这个混合群体中,鹰与鸽所占的比例。

假定P代表群体中鹰所占比例,则(1-P)为种群中鸽的比例。如果种群中个体间相遇的冲突是随机的(即相遇概率与其相对数量一致),那么鹰的平均净收益则是:

从上式中可以看出,资源值V越大,鹰对策的选择者便越多;而受伤W代价越大,则鸽对策的选择者越多。

同时,随着V、W和T值的变化,结果也将不同。也就是说,ESS将依赖于V、W、和T值的变化。当V>W时,只有鹰对策才是ESS;当VW时,鸽与鹰博弈的净收益将会少于鹰与鹰博弈的净收益,此时鹰对策为ESS;但是,如果V

以上ESS关于生物行为和最适模型的研究,从理论上验证了达尔文生前一直坚信的观点:只要是经过一个进化和选择的过程,任何表面看起来复杂和不可思议的生物行为,都是有其内在的规律和逻辑。企业的战略对抗中,无论是鹰派的对抗与鸽派的妥协,其竞争行为的解释与选择也应该从以上分析中有所借鉴或启迪。

三、结论与建议:关于非对称竞争的概念模型及启迪

通过以上介绍可以看出,资源值和竞争实力是影响竞争结果的重要因素,但在很多动物的竞争中,双方的竞争实力和为之争夺的资源值是变化的,这类竞争双方可以沿着一个连续体改变其竞争升级状况的竞争,称为非对称竞争。关于非对称竞争的理论,Parker和 Rubenstein(1981),Hammerstein和 Parker(1982)做过详细的研究。其总体研究结论认为:在非对称竞争中,对于一个参与者来说,如果其竞争力会在其对手之前耗尽,那最好的策略便是退却。用数学表达即为:

如果,//Va KaVb Kb

那么竞争参与者A放弃竞争或退却,就会成为一种进化稳定对策(ESS)。式中V是竞争双方A和B为之争夺的资源值;K是两个竞争参与者在竞争中所付出的增长速率,其值将与竞争参与者的竞争实力相关,一个善于竞争者的代价增长速率将会比不善于竞争者的代价增长速率慢。

进化稳定对策(ESS)是行为生态学中最重要的概念,凡是有利益冲突的地方都适用。从这种意义上说,几乎在一切地方都适用,因为这是一个冲突无处不在的世界。基于同样的原因与逻辑,进化稳定对策(ESS)对研究对抗与争夺互动性极强的企业竞争行为来说更是富于意义,企业一线的经营者也应该从以上的分析中获得某些启迪。

参考文献:

[1] 张维迎. 博弈论与信息经济学[M]. 上海人民出版社. 1996,13-15.

[2] Maynard Smith, J. Models in Ecology [M]. Cambridge University Press,1974.

[3] 蒋学玮. 浅议进化稳定策略ESS. 生物学通报. 2005年40卷04期.

篇7

一、纳什均衡

纳什,在1950年就已经对纳什均衡给出两种解释。第一种是群体作用的解释。此种解释假设,在博弈中存在对每个参与者又称局中人(player)起作用的参与者群体。参与者不断地积累各种纯策略中的令人注意的经验信息,如果此博弈稳定下来,那么这种均衡必是纳什均衡。然而。Shapley在1964年证明,如果博弈没有稳定下来,那么必然存在一种策略选择的有限循环。第二种解释的观点是把均衡看成一个“自动实施协议”或者是理性的预测。如果基于理性的预测是唯一的,那么博弈均衡确实得以存在,这时倘若均衡是众所周知的,它必是纳什均衡。纳什本人对此做了阐述,这是“一种十分强的理性化和理想化的解释”。这对阐述均衡而言是有效的,解决均衡选择问题是一个基本的问题。因此,对于经济学家的研究目的而言,与均衡选择相关的问题是必须加以分析和深入探讨。

对纳什均衡的第三种解释,是由MaynardSmith和Price在1973年首次提出的,它源于生物学领域的研究。在这种解释中完全不存在有意识的选择:参与者预先选取某一种策略,而且更为成功的策略生存下来;如果种群(population在生物学上称为种群,在经济学中我们将其称为群体更好)达到一种稳定状态,那么所有策略必是等价的,因此,这种状态必是纳什均衡。这种生物学上的方法,其优点是它不仅具体指出稳定的结果,而且它还靠可能达成的一些结果来给出一种显示性的过程。

当然,经济学家清楚地意识到将涉及到的生物学领域中的思想和方法应用到经济学领域中的疑问和困难,比如,像生物学中的“复制方程”扩展到经济学领域中的内容和意义是什么,至今还在探索中。

二、进化思想在经济学中应用的回顾

对经济学给出进化的解释不是一种新的手法。实际上,进化解释在社会科学中是先于达尔文(Darwin)而出现。例如,亚当·斯密(AdamSmith)曾说:“带来许多利益的劳动分工,原本不是人类智能的结果,虽然人类智能预见到劳动分工产生普遍富裕,并想利用它来实现普遍富裕。尽管在人类本能里没有意识到这样广泛效用中的一种互通有无、物物交换,以及相互之间交易的倾向,此倾向很缓慢并且渐进产生结果,但是劳动分工是必须的。”

进化思想也能够在马尔萨斯(Malthus)、马歇尔(Marshall),熊彼特(Schumpeter)和哈耶克(Hayek)所写的著作中找到。关于进化经济学,这是一个单独的学科领域,经常与熊彼特的工作相联系。Robson在2001年系统地给出了经济行为的生物学方面的基本解释。

进化经济学与进化对策论至今是完全相互独立地发展起来的。在经济学的理论研究中,理性人的偏好通常是固定的。然而,对于理性人的偏好变化或者进化选择,经济学家对此也进行了研究,特别是利他主义的生存价值以及风险态度等。然而,我们这里的进化对策论是将偏好作为固定的和已知的。

关于市场生存进化方面的研究和探讨,开始于Winter在1964年的文章“经济的‘自然选择’与厂商理论”,接下来Winter在1971年发表了“满足、选择与改革残余物”,Nelson和Winter在1982年出版的著作《经济变迁的演化理论》(有中文版),是这一领域中出现的最为重要的文献。最近由Blume和Easley(1992,1995,1996),Dutta(1992)Dutt和Radner(1993),Radner(1995),Bega—redondo以及Boldeke和Samuelson(1997)等学者在此领域进行探索和研究。虽然这个论题与进化对策论紧密相联系,但是,目前这两种文献在方法论上相距甚远。

三、进化对策论的基本原理与结论

最近10多年里,不像对策论的传统分析方法那样——考虑有限理性的经济行为人以及在严格的认知局限之下必须学习执行策略,这样的对策论理论及其应用有了迅速的发展。这方面的大量研究工作是在称为进化对策论所提供的框架下进行的。正如此学科标题所表示的,这一新学科的原理借用生物学中的进化模型所具有的与众不同的一些特征。然而,此学科本身也发展了一些新的方法和技术,特别地适合于有限理性基本假设下对社会和经济体制方面的分析。进化对策论在10多年里以快速的步伐取得长足的发展。

进化对策沦为人们提供一种具有广泛适用性的工具。其潜在的应用领域从进化生物学延伸到一般的社会科学,特别是经济学中。进化理论在经济学中有着悠久的历史传统。直到最近,这种方法在非合作对策论框架中才得到应用。

进化对策论是研究策略行为的稳健性,它是针对有限理人所组成的大群体中多次博弈背景下的进化力量而言的。这种新的组成部分在经济理论里导致一种新的预测方法,并且为其他社会科学开辟一条崭新的研究途径。

进化对策论的基本内容:

(一)进化稳定策略概念。进化对策论理论中,一个关键概念是进化稳定策略(ESS),这一概念的提出归功于MaynardSmith和Price在1973年的“动物冲突的逻辑”一文。此种策略在特定的意义上对进化压力而言是稳健的:群体执行该种策略对执行任何其他策略而言是非入侵的。假定一对个体是重复随机地来自于大的群体,去参与一个对称并有限的两人博弈,还假定所有的个体在博弈中起初都执行某一个纯的或混合的策略x是进化稳定的,那么对于每一个变异策略y,都存在一个正的“入侵障碍”,使得执行变异策略y的个体群体所获得的支付低于此障碍,从而x赢得的预期支付比执行的y所得要高。下面的不等式对于充分小的ε>0成立,即:

u[x,(1-ε)x+εy]>u[y,(1-ε)x+εy]…………(1)

其中左边的表达式记为对于策略x而言,当执行相对应策略的个体进入之后,混合群体情况的混合策略(1-ε)x+εy时的预期支付,而右边的表达式记为对于策略y而言,其所对应的情况的预期支付。

实际上,由上述定义知道,进化稳定性十分有用的特性是一个策略x是进化稳定的当且仅当(1)它是对自身的最佳反应;(2)它是对所有其他最佳反应的反应,当这些策略对其自身的反应比较时。为了弄清楚(1)是必要的,只需充分观察即知,否则会存在一个对x而言的最佳反应y。在一个充分小的种群中,表现出的这个“变异”策略几乎总会遇到策略x,从而会赢得比x水平高的收益。同样,(2)是必需的,因为否则的话一定会存在一个对x而言的可供选择的最佳反应y,它会赢得与x遇到x的时候或者至少x遇到y时候的收益相同,从而y的平均水平会赢得比混合种群要高一些的收益。注意到,进化稳定性准则没有解释种群是如何达到这种策略的。然而,一旦达到这种策略,则这样的策略对进化压力来说是稳健的。同时,人们发现,进化稳定性没有处理种群中具有两个或更多“变异”同时出现的情况。因而,它隐含地把变异当成稀少事件,以致于种群有时间在另一个变异出现之前响应这种状况。

虽然,进化稳定性准则是一个生物学上的概念,但是它为各种各样的人类行为提供一种有关的稳健性准则。这样,进化稳定性要求人类群体中企图采用可选择的策略的任何一个小团体不比已经采用“固有”策略的那些个体所构成的团体收益好。相反,采用固有策略的那些个体所构成的团体缺乏激励来改变他们的策略。但是,那些采用可选策略的小团体却受激励而具有转变固有策略的行为。在这种社会背景下,进化稳定策略被人们看成是传统习惯或者已经确立起来的行为规则。比如,社会风气、企业管理模式等都可以看为是某种人类群体的规则,而极个别的人群社会行为、习气的变化就会被认为是“变异”。当然,在这种背景下,如果那些极少数的人群或企业的收益比不变异的人群或企业高时,那么这些变异分子会生存得更好!反之,则被淘汰掉。

可惜的是,许多博弈没有进化稳定策略。于是,研究人员探讨各种比进化稳定性稍弱一些的形式,以及集值形式的进化稳定性概念等。此外,ESS概念不能推广到n人对策的情况上。在本质上,ESS要求强的纳什均衡来实施,也就是每一个策略对于策略组而言应是唯一的最佳反应。

(二)复制动力学。复制动力学是选择过程的显性模型,它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。复制动力学的数学公式是由Taylor和Jonker于1978年在“进化稳定策略和对策动力学”一文中提出的。他们认为由随机配对的个体所构成的一个大种群执行有限对策的两人博弈,犹如进化稳定性的设置一样。然而,此处的个体仅仅采用纯策略。种群状态是指在纯策略上的一个分布x。这种状态在数学上与博弈中的混合策略是等价的。

如果博弈中的收益表示成生物学上的适合性,也就是后代的数目,同时每一个后代继续其父母的策略,因此,采用纯策略i的个体数目(在大的种群中)将以某一比率指数增长,而此等于对纯策略i的预期收益u(ei,x),当执行着表示种群中当前策略分布的混合策略x时,采用任何纯策略i的种群分布的增长率等于此策略的收益与种群中平均收益的差。后者,等同于混合策略x当与其自身博弈时的预期收益u(x,x)。这是一个单种群的对称两人博弈的复制动力学。

Xi=[u(ei,x)-u(x,x)]xi………………(2)

注意到,对当前种群状态x的最佳反应具有最高的增长率。第二最佳反应具有第二高的增长率,如此等等。然而,虽然更成功的纯策略比欠成功的纯策略增长得快,但是种群中的平均收益不必随时间而增长。产生这一原因的可能性是,如果一个个体由采用最佳策略的个体所代替,那么遇见这个新个体的成员会得到比较低的收益。例如,这正是囚徒困境博弈的情况。如果最初几乎所有个体采用“合作”,那么个体中将逐渐地转向“抵赖”,从而平均收益将下降。然而,如果博弈在两个人总是获得相等的收益意义上是一个双对称的,那么自然选择的基本规律将成立:种群中收益随时间而增长,即使没有必要成为全局最大的。例如,这就是合作博弈的情况,其中所有个体逐渐地转向到执行同一个纯策略上。复制动力学能够推广到n人博弈的情况上,这可以看成是来自于n种群、中的个体随机地以n类型配对,其中每一个参与者的地位状况正如纳什所给出的群体行为解释的那样。目前,存在两种形式的n种群复制动力学,其中一个是由Taylor在1979年提出的,另一个是由MaynardSmith在1982年给出的。

(三)学习模型与选择动力学

人们把学习模型分成三种类型,即基于信念的学习、强化学习以及模仿学习。最近的一些研究表明,复制动力学是由后面两类的某种模型所促成的。

1.强化学习模型

心理学上的有关个体学习文献的中心模型是所谓的强化模型,这是由Bush和Mosteller在1951年提出的。然而,它的思想可以追溯到Thorndikede的“导致过去好的选择在将来最有可能重复”。当然,人们注意到这里的选择隐含地作为概率上的一种说法。

Bush和Mosteller的强化学习模型及其他的推广形式,已经在一系列的人类主观执行博弈中得到运用。可惜,这些模型的通常数学性质,人们还知道得很少。然而,Borgers和Sarin在1997年发表的“通过强化和复制动力学的学习”文章把Cross的Bush—Mosteller学习模型的形式与Taylor的两种群复制动力学进行了理论上的对比研究。虽然这种学习过程在离散时间背景中是随机的、演化的,而复制动力学在连续时间背景中是确定的、演化的。他们证明,在适当地构造连续时间的界限下,他们的学习过程在有限时间区间内可通过复制动力学来*近。

更确切地讲,他们研究在多次博弈回合中(n=l,2,…),在一个固定的两人参与者采用混合策略对中有限两人博弈的情况。每一个参与者凭借由其所运用的纯策略来记录概率如下。如果参与者1(同样的考察参与者2)在博弈的n次回合中运用纯策略k,并且获得一个正的收益Vk(n),这里Vk(n)作为随机变量,它依赖于参与者2所做出的随机选择,那么参与者1对于运用这个策略的未来概率将越增加,其收益也就越高。参与者2以同样的方法记录其选择概率向量Y。所有收益均假设处于单位开区间上,不过,这里的收益不能解释成N—M(冯·诺依曼和摩根斯藤)效用。因此,一旦所用策略的概率是递增的,那么所有选择均是强化的。

从任何一个初始概率向量X(0)=x0和Y(0)=Y0开始,方程(3)定义出博弈的混合策略空间中的一个马尔可夫链{X(n),Y(n)}∞n=1。其中参数δ>0表示博弈的两次回合之间的时间:t=nδ是n次博弈回合中的“真实”时间。Borgers和Sarin得到这一过程的连续时间界限,通过设n∞和δ0以便有δn=t,在任何有限的“真实”时间上来估计价值。因此,博弈在越来越短的时间区间上执行,同时概率以相称的较小数值得以适应。他们证明,在这个界限内,此过程以状态(x(t),y(t))的形式出现在单位区间概率上,其中如果复制动力学的初始状态在时间0处以(x0,y0)开始,那么复制动力学会在时间t达到。在这个意义上,复制动力学在有限时间区间上近似于强化动力学(3)。

然而,这两类模型的渐进性质却十分不同。例如,为了在直观上理解这点,假设参与者1的收益既是恒定独立于他的策略选择又独立于参与者2的策略选择。设参与者1在强化动力学中的初始状态指派概率等于参与者1的所有可获得纯策略的概率。同样的,设复制动力学的初始状态指派种群的各部分采用策略的概率等于所有可获得纯策略的概率。显然,复制动力学的解是一个常量:所有种群的各部分分得的收益永远相等。然而,强化动力学的实现会容易随时间而收敛到参与者1可获得的任何一个纯策略上。由于在博弈的第一个回合中选用策略的概率将高于在下一次博弈回合中所选用的策略概率,所以强化动力学的性质更有可能把参与者1“锁定”到他的任何一个纯策略上。Borgers和Sarin证明,任何有限两人博弈的强化动力学以概率1收敛到一个纯策略组合上,而不像复制动力学那样。

2.模仿学习模型

博弈论学者Gale,Binmore和Samuelon在1995年提出一个所有个体参与者都采用纯策略的大群体,但是有限博弈的社会学习的简单模型。每一个参与者在博弈中都赢得一个渴望水平的收益。在离散时间0,δ,2δ,…上,任意从群体中抽取个体δ部分,把其当前收益与他们的渴望水平收益相比较,其中δ>0是很小的数。如果个体实现的收益低于其生存水平收益,那么该个体就会随机地模仿已抽取的个体,在相同的参与者群体中,所有其他个体都具有相同的概率被抽取。由此可见,如果渴望水平收益具有均匀分布(某一个区间上包含所有可能的收益值),那么模仿的概率对于个体的当前策略而言,在预期收益上是线性递减的。对于很小的δ,他们证明这个过程可以由有限时间区间上的复制动力学来*近。

人们把个体策略的适应过程作为连续时间中的一个随机过程。假设在有限群体中每一个个体时常得到一个冲动,使其改变纯策略。如果这些冲动是依照i.i.d.的Poisson分布,那么同时发生的概率是零,而且总的过程也是一个Poisson过程。此外,总过程的密度刚好是各个过程密度的和。如果群体是很大的,那么人们利用预期值给出的确定流来近似这个总过程。

Bjornestedt和Weibull在1996年研究了一系列这种模型,其中改变的个体在其博弈的群体中模仿其他的个体,并证明许多正收益的选择动力学可以被人们推导出来,包括复制动力学的三种形式。特别,如果个体改变比率对其策略而言预期收益是线性递减的,那么每一个纯策略Poisson过程的密度是与其个体总数大小成比例,同时比例因素将是其预期收益递减的。如果每一个改变的个体选择其未来的策略是通过在其博弈中随机地模仿抽取的个体,那么其作为结果的流*近也是一个复制动力学。

Schlag在1997年分析当个体经常以参与者的同样地位去模仿其他参与者个体时,个体应该选择什么样的模仿规则的问题,然而参与者的同样地位却受制于信息和记忆的约束。他发现,如果个体想要学习规则是在所有平稳环境中收益递增,那么此个体应该满足:(1)当改变策略时,总是通过模仿来进行;(2)永远不向收益实现比其所拥有收益低的那些个体模仿;(3)向收益实现比其拥有收益高的那些个体模仿。

这种模型被各种各样不同的环境所发展。在有限两人博弈中,Schlag假设在随机地来自于两个相等大小的有限群体的个体之间两两配对,每一个有其自己的地位。个体总是执行纯策略。在每一个收益实现之后,每一个个体都要随机地与其他个体所处的群体进行抽样调查,并且比较两种收益的实现。行为规则是一种函数关系,即把收益实现和所用策略对应到博弈中个体地位上可获得的纯策略集合上的分布,为的是采用新的策略。换句话说,允许使用个体的唯一资料是这种收益实现和纯策略对。特别,从较早的博弈回合中实现收益被忽略。此外,假设个体在所有博弈中运用相同的行为规则,具有相同数目的纯策略可选择;也就是,个体不需要知晓他们执行什么样的博弈,他们知道所使用的纯策略数目就足够了。

在任何这样的博弈中,导致预期收益弱递增的以及在对手种群中对于任何固定策略分布的行为规则,称为改进。本文中的重要结果是对于所有这样规则的刻画。改进规则的一个特征是他们是模仿的:个体坚持其初始的策略或者采用抽样的个体策略;但是不会转向第三个的策略。

行为规则称为是占优的改进规则,如果在某一个博弈中不存在改进规则产生比较高的预期收益改进比例,而且在对手种群中的某一个策略分布上。Schlag证明,某一个行为规则为占优的改进规则,其具有上面给出的性质(1)(2)(3)。这个比例模仿规则是其自己的一个改进规则,而且可以证明它确有一些其他吸引人的性质。Schlag证明,Taylor两种群复制动力学的离散时间形式可以*近在任何给定有限时间范围内导出的一个随机过程,只要种群充分的大就行。

(四)进化对策论中的一些结论

本文集中探讨关于有限n人博弈的显性动力学种群模型方向的介绍,其中个体执行纯策略。首先探讨确定性选择动力学,然后介绍随机进化模型,其中把随机变异过程与确定性选择过程或者随机选择过程结合起来。

研究确定性动力学项目性质的一种直接方法是选取一个初始的种群状态,并且稍后可以计算。然后,人们应该记住让初始的所有纯策略在种群中出现,由于初始的已亡策略将在选择过程中仍保持已亡的状态。这种解的轨迹称为内部的。解的轨迹随时间流逝而安定下来,就称为收敛的。反之,则称为发散的。

如果种群状态是收敛的,那么什么是长时期限制状态的本质呢?可以证明,在任何一种弱的正收益选择动力学中,沿着任何收敛的内部轨迹,限制状态必将构建纳什均衡,研究人员发现,种群执行某种纳什均衡或者在渐进意义上的纳什均衡。Nachbar在1990年第一个证明出单种群复制动力学的这个结果。事实上,如果选择过程遇见弱的正收益的相对温和的条件,且如果汇总的行为随时间而安定下来,那么在长时期种群状态中的个体就好像他们预期一个特殊的纳什均衡对此执行着一个最佳反应,这点颇像是纳什所声称的“群体解释”。

如果对于弱的正收益选择动力学的内部解随时间而收敛,那么我们看到幸存下来的策略在作为结果的混合策略组合的最佳反应的意义上是理性的。此处的问题是,如果解的轨迹不收敛,那么会发生什么情况吗?当长时期中没有均衡达成时,我们产生的问题是,执行是否为理性的。

非合作博弈论中基本的理性假设是参与者不采用作为严格的劣(strictlydominated)纯策略。这个假设要求不知道其他参与者的偏好或者行为。一个更严格的理性一--附有知识的---假设是参与者不采用作为迭代的严格的劣策略。除了回避严格的劣的策略之外,这个假定要求所有参与者相互知道彼此的收益,而这些就是他们知道等等,一直到共同知识的某一个有限水平上使得迭代剔除严格劣的纯策略的过程停止。

因此,进化对策论中的基本问题是进化选择过程是否剔除掉所有的严格劣策略或者所有的迭代的严格劣纯策略。如果所有迭代的严格劣策略消失,那么这提供了在策略上相互作用的参与者行为假设的一种进化证明,就好像此假设是参与者他们作为理性人的共同知识。

Akin在1980年证明,在任何有限对称两人博弈中所有严格劣的纯策略沿着关于单种群复制动力学的任何一个内部解的轨迹都能消失。Samuelson和Zhang在1992年把这一结论推广到某一个两种群选择动力学的正收益子集合中的迭代的严格劣纯策略上。他们将这种情况称为聚集单调的(aggregatemonotonic)。

对长时期进化状态分析的辅助方法是研究种群状态的稳定性,也就是考察种群对于很小的扰动是如何反应的。Bomze教授在1986年曾证明,如果种群状态在单种群复制动力学中是弱的动态稳定的,那么此状态就是对自己的最佳反应,这里的状态被认为是采用混合策略的。经常运用的稳定性准则是李雅普诺夫稳定性,即状态x是李雅普诺夫稳定的,如果x的邻域B包含x的邻域A,使得在A中开始的解将永远保留在B中。不是李雅普诺夫稳定的状态称为不稳定的。因此,不仅进化稳定性的静态稳定性准则,而且复制动力学中的动态稳定性都蕴涵着纳什均衡的实施。这个结果能够推广到任何有限n人博弈中的任何弱的正收益选择动力学上。总之,对进化压力而言,以各种不同方式系统阐述的稳定性都需要纳什均衡来实施。然而,不是所有的纳什均衡在这个方面都是稳定的,因此,这些进化稳定性准则是纳什均衡概念的精炼。

另外,研究者在考察动力学进化稳定性时,把随机因素并入到进化过程的建模当中。特别,变异过程被认为是内在随机的一种情况。随机振动可以凭借稳定性分析方法来解释确定性选择动力学;一个稳定的种群状态对于种群的孤立的很小扰动而言是稳健的。然而,这种稳定分析几乎说不出一系列的小振动或者同时发生的小振动累计之后促成的大振动的稳健性。这样的一系列或者同时发生的连续不断的振动会使种群状态离开选择过程的吸引域。虽然这种大量涌现的小振动不可能是统计意义上的独立而稀少变异的事件,但这一可能性在基本方法上却改变了动力学进化过程的性质。代替历史依赖性(依赖于初始种群状态),此过程会成为遍历的(ergodic),也就是具有一种渐进分布,其中渐进分布是历史独立的(对于所有的初始种群状态都是相同的)。从而,导致人们现今研究的一个专题——随机动力学稳定性。这种研究路线的先驱者是Foster和Young(1990),随后是Fudenberg和Harris(1992),Young(1993)等等。注意到,进化稳定性准则没有解释种群是如何达到这种策略的。然而,一旦达到这种策略,则这样的策略对进化压力来说是稳健的。同时,人们发现,进化稳定性没有处理种群中具有两个或更多“变异”同时出现的情况。因而,它隐含地把变异当成稀少事件,以致于种群有时间在另一个变异出现之前响应这种状况。

虽然,进化稳定性准则是一个生物学上的概念,但是它为各种各样的人类行为提供一种有关的稳健性准则。这样,进化稳定性要求人类群体中企图采用可选择的策略的任何一个小团体不比已经采用“固有”策略的那些个体所构成的团体收益好。相反,采用固有策略的那些个体所构成的团体缺乏激励来改变他们的策略。但是,那些采用可选策略的小团体却受激励而具有转变固有策略的行为。在这种社会背景下,进化稳定策略被人们看成是传统习惯或者已经确立起来的行为规则。比如,社会风气、企业管理模式等都可以看为是某种人类群体的规则,而极个别的人群社会行为、习气的变化就会被认为是“变异”。当然,在这种背景下,如果那些极少数的人群或企业的收益比不变异的人群或企业高时,那么这些变异分子会生存得更好!反之,则被淘汰掉。

可惜的是,许多博弈没有进化稳定策略。于是,研究人员探讨各种比进化稳定性稍弱一些的形式,以及集值形式的进化稳定性概念等。此外,ESS概念不能推广到n人对策的情况上。在本质上,ESS要求强的纳什均衡来实施,也就是每一个策略对于策略组而言应是唯一的最佳反应。

(二)复制动力学。复制动力学是选择过程的显性模型,它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。复制动力学的数学公式是由Taylor和Jonker于1978年在“进化稳定策略和对策动力学”一文中提出的。他们认为由随机配对的个体所构成的一个大种群执行有限对策的两人博弈,犹如进化稳定性的设置一样。然而,此处的个体仅仅采用纯策略。种群状态是指在纯策略上的一个分布x。这种状态在数学上与博弈中的混合策略是等价的。

如果博弈中的收益表示成生物学上的适合性,也就是后代的数目,同时每一个后代继续其父母的策略,因此,采用纯策略i的个体数目(在大的种群中)将以某一比率指数增长,而此等于对纯策略i的预期收益u(ei,x),当执行着表示种群中当前策略分布的混合策略x时,采用任何纯策略i的种群分布的增长率等于此策略的收益与种群中平均收益的差。后者,等同于混合策略x当与其自身博弈时的预期收益u(x,x)。这是一个单种群的对称两人博弈的复制动力学。

Xi=[u(ei,x)-u(x,x)]xi………………(2)

注意到,对当前种群状态x的最佳反应具有最高的增长率。第二最佳反应具有第二高的增长率,如此等等。然而,虽然更成功的纯策略比欠成功的纯策略增长得快,但是种群中的平均收益不必随时间而增长。产生这一原因的可能性是,如果一个个体由采用最佳策略的个体所代替,那么遇见这个新个体的成员会得到比较低的收益。例如,这正是囚徒困境博弈的情况。如果最初几乎所有个体采用“合作”,那么个体中将逐渐地转向“抵赖”,从而平均收益将下降。然而,如果博弈在两个人总是获得相等的收益意义上是一个双对称的,那么自然选择的基本规律将成立:种群中收益随时间而增长,即使没有必要成为全局最大的。例如,这就是合作博弈的情况,其中所有个体逐渐地转向到执行同一个纯策略上。复制动力学能够推广到n人博弈的情况上,这可以看成是来自于n种群、中的个体随机地以n类型配对,其中每一个参与者的地位状况正如纳什所给出的群体行为解释的那样。目前,存在两种形式的n种群复制动力学,其中一个是由Taylor在1979年提出的,另一个是由MaynardSmith在1982年给出的。

(三)学习模型与选择动力学

人们把学习模型分成三种类型,即基于信念的学习、强化学习以及模仿学习。最近的一些研究表明,复制动力学是由后面两类的某种模型所促成的。

1.强化学习模型

心理学上的有关个体学习文献的中心模型是所谓的强化模型,这是由Bush和Mosteller在1951年提出的。然而,它的思想可以追溯到Thorndikede的“导致过去好的选择在将来最有可能重复”。当然,人们注意到这里的选择隐含地作为概率上的一种说法。

Bush和Mosteller的强化学习模型及其他的推广形式,已经在一系列的人类主观执行博弈中得到运用。可惜,这些模型的通常数学性质,人们还知道得很少。然而,Borgers和Sarin在1997年发表的“通过强化和复制动力学的学习”文章把Cross的Bush—Mosteller学习模型的形式与Taylor的两种群复制动力学进行了理论上的对比研究。虽然这种学习过程在离散时间背景中是随机的、演化的,而复制动力学在连续时间背景中是确定的、演化的。他们证明,在适当地构造连续时间的界限下,他们的学习过程在有限时间区间内可通过复制动力学来*近。

更确切地讲,他们研究在多次博弈回合中(n=l,2,…),在一个固定的两人参与者采用混合策略对中有限两人博弈的情况。每一个参与者凭借由其所运用的纯策略来记录概率如下。如果参与者1(同样的考察参与者2)在博弈的n次回合中运用纯策略k,并且获得一个正的收益Vk(n),这里Vk(n)作为随机变量,它依赖于参与者2所做出的随机选择,那么参与者1对于运用这个策略的未来概率将越增加,其收益也就越高。参与者2以同样的方法记录其选择概率向量Y。所有收益均假设处于单位开区间上,不过,这里的收益不能解释成N—M(冯·诺依曼和摩根斯藤)效用。因此,一旦所用策略的概率是递增的,那么所有选择均是强化的。

从任何一个初始概率向量X(0)=x0和Y(0)=Y0开始,方程(3)定义出博弈的混合策略空间中的一个马尔可夫链{X(n),Y(n)}∞n=1。其中参数δ>0表示博弈的两次回合之间的时间:t=nδ是n次博弈回合中的“真实”时间。Borgers和Sarin得到这一过程的连续时间界限,通过设n∞和δ0以便有δn=t,在任何有限的“真实”时间上来估计价值。因此,博弈在越来越短的时间区间上执行,同时概率以相称的较小数值得以适应。他们证明,在这个界限内,此过程以状态(x(t),y(t))的形式出现在单位区间概率上,其中如果复制动力学的初始状态在时间0处以(x0,y0)开始,那么复制动力学会在时间t达到。在这个意义上,复制动力学在有限时间区间上近似于强化动力学(3)。

然而,这两类模型的渐进性质却十分不同。例如,为了在直观上理解这点,假设参与者1的收益既是恒定独立于他的策略选择又独立于参与者2的策略选择。设参与者1在强化动力学中的初始状态指派概率等于参与者1的所有可获得纯策略的概率。同样的,设复制动力学的初始状态指派种群的各部分采用策略的概率等于所有可获得纯策略的概率。显然,复制动力学的解是一个常量:所有种群的各部分分得的收益永远相等。然而,强化动力学的实现会容易随时间而收敛到参与者1可获得的任何一个纯策略上。由于在博弈的第一个回合中选用策略的概率将高于在下一次博弈回合中所选用的策略概率,所以强化动力学的性质更有可能把参与者1“锁定”到他的任何一个纯策略上。Borgers和Sarin证明,任何有限两人博弈的强化动力学以概率1收敛到一个纯策略组合上,而不像复制动力学那样。

2.模仿学习模型

博弈论学者Gale,Binmore和Samuelon在1995年提出一个所有个体参与者都采用纯策略的大群体,但是有限博弈的社会学习的简单模型。每一个参与者在博弈中都赢得一个渴望水平的收益。在离散时间0,δ,2δ,…上,任意从群体中抽取个体δ部分,把其当前收益与他们的渴望水平收益相比较,其中δ>0是很小的数。如果个体实现的收益低于其生存水平收益,那么该个体就会随机地模仿已抽取的个体,在相同的参与者群体中,所有其他个体都具有相同的概率被抽取。由此可见,如果渴望水平收益具有均匀分布(某一个区间上包含所有可能的收益值),那么模仿的概率对于个体的当前策略而言,在预期收益上是线性递减的。对于很小的δ,他们证明这个过程可以由有限时间区间上的复制动力学来*近。

人们把个体策略的适应过程作为连续时间中的一个随机过程。假设在有限群体中每一个个体时常得到一个冲动,使其改变纯策略。如果这些冲动是依照i.i.d.的Poisson分布,那么同时发生的概率是零,而且总的过程也是一个Poisson过程。此外,总过程的密度刚好是各个过程密度的和。如果群体是很大的,那么人们利用预期值给出的确定流来近似这个总过程。

Bjornestedt和Weibull在1996年研究了一系列这种模型,其中改变的个体在其博弈的群体中模仿其他的个体,并证明许多正收益的选择动力学可以被人们推导出来,包括复制动力学的三种形式。特别,如果个体改变比率对其策略而言预期收益是线性递减的,那么每一个纯策略Poisson过程的密度是与其个体总数大小成比例,同时比例因素将是其预期收益递减的。如果每一个改变的个体选择其未来的策略是通过在其博弈中随机地模仿抽取的个体,那么其作为结果的流*近也是一个复制动力学。

Schlag在1997年分析当个体经常以参与者的同样地位去模仿其他参与者个体时,个体应该选择什么样的模仿规则的问题,然而参与者的同样地位却受制于信息和记忆的约束。他发现,如果个体想要学习规则是在所有平稳环境中收益递增,那么此个体应该满足:(1)当改变策略时,总是通过模仿来进行;(2)永远不向收益实现比其所拥有收益低的那些个体模仿;(3)向收益实现比其拥有收益高的那些个体模仿。

这种模型被各种各样不同的环境所发展。在有限两人博弈中,Schlag假设在随机地来自于两个相等大小的有限群体的个体之间两两配对,每一个有其自己的地位。个体总是执行纯策略。在每一个收益实现之后,每一个个体都要随机地与其他个体所处的群体进行抽样调查,并且比较两种收益的实现。行为规则是一种函数关系,即把收益实现和所用策略对应到博弈中个体地位上可获得的纯策略集合上的分布,为的是采用新的策略。换句话说,允许使用个体的唯一资料是这种收益实现和纯策略对。特别,从较早的博弈回合中实现收益被忽略。此外,假设个体在所有博弈中运用相同的行为规则,具有相同数目的纯策略可选择;也就是,个体不需要知晓他们执行什么样的博弈,他们知道所使用的纯策略数目就足够了。

在任何这样的博弈中,导致预期收益弱递增的以及在对手种群中对于任何固定策略分布的行为规则,称为改进。本文中的重要结果是对于所有这样规则的刻画。改进规则的一个特征是他们是模仿的:个体坚持其初始的策略或者采用抽样的个体策略;但是不会转向第三个的策略。

行为规则称为是占优的改进规则,如果在某一个博弈中不存在改进规则产生比较高的预期收益改进比例,而且在对手种群中的某一个策略分布上。Schlag证明,某一个行为规则为占优的改进规则,其具有上面给出的性质(1)(2)(3)。这个比例模仿规则是其自己的一个改进规则,而且可以证明它确有一些其他吸引人的性质。Schlag证明,Taylor两种群复制动力学的离散时间形式可以*近在任何给定有限时间范围内导出的一个随机过程,只要种群充分的大就行。

(四)进化对策论中的一些结论

本文集中探讨关于有限n人博弈的显性动力学种群模型方向的介绍,其中个体执行纯策略。首先探讨确定性选择动力学,然后介绍随机进化模型,其中把随机变异过程与确定性选择过程或者随机选择过程结合起来。

研究确定性动力学项目性质的一种直接方法是选取一个初始的种群状态,并且稍后可以计算。然后,人们应该记住让初始的所有纯策略在种群中出现,由于初始的已亡策略将在选择过程中仍保持已亡的状态。这种解的轨迹称为内部的。解的轨迹随时间流逝而安定下来,就称为收敛的。反之,则称为发散的。

如果种群状态是收敛的,那么什么是长时期限制状态的本质呢?可以证明,在任何一种弱的正收益选择动力学中,沿着任何收敛的内部轨迹,限制状态必将构建纳什均衡,研究人员发现,种群执行某种纳什均衡或者在渐进意义上的纳什均衡。Nachbar在1990年第一个证明出单种群复制动力学的这个结果。事实上,如果选择过程遇见弱的正收益的相对温和的条件,且如果汇总的行为随时间而安定下来,那么在长时期种群状态中的个体就好像他们预期一个特殊的纳什均衡对此执行着一个最佳反应,这点颇像是纳什所声称的“群体解释”。

如果对于弱的正收益选择动力学的内部解随时间而收敛,那么我们看到幸存下来的策略在作为结果的混合策略组合的最佳反应的意义上是理性的。此处的问题是,如果解的轨迹不收敛,那么会发生什么情况吗?当长时期中没有均衡达成时,我们产生的问题是,执行是否为理性的。

非合作博弈论中基本的理性假设是参与者不采用作为严格的劣(strictlydominated)纯策略。这个假设要求不知道其他参与者的偏好或者行为。一个更严格的理性一--附有知识的---假设是参与者不采用作为迭代的严格的劣策略。除了回避严格的劣的策略之外,这个假定要求所有参与者相互知道彼此的收益,而这些就是他们知道等等,一直到共同知识的某一个有限水平上使得迭代剔除严格劣的纯策略的过程停止。

因此,进化对策论中的基本问题是进化选择过程是否剔除掉所有的严格劣策略或者所有的迭代的严格劣纯策略。如果所有迭代的严格劣策略消失,那么这提供了在策略上相互作用的参与者行为假设的一种进化证明,就好像此假设是参与者他们作为理性人的共同知识。

Akin在1980年证明,在任何有限对称两人博弈中所有严格劣的纯策略沿着关于单种群复制动力学的任何一个内部解的轨迹都能消失。Samuelson和Zhang在1992年把这一结论推广到某一个两种群选择动力学的正收益子集合中的迭代的严格劣纯策略上。他们将这种情况称为聚集单调的(aggregatemonotonic)。

对长时期进化状态分析的辅助方法是研究种群状态的稳定性,也就是考察种群对于很小的扰动是如何反应的。Bomze教授在1986年曾证明,如果种群状态在单种群复制动力学中是弱的动态稳定的,那么此状态就是对自己的最佳反应,这里的状态被认为是采用混合策略的。经常运用的稳定性准则是李雅普诺夫稳定性,即状态x是李雅普诺夫稳定的,如果x的邻域B包含x的邻域A,使得在A中开始的解将永远保留在B中。不是李雅普诺夫稳定的状态称为不稳定的。因此,不仅进化稳定性的静态稳定性准则,而且复制动力学中的动态稳定性都蕴涵着纳什均衡的实施。这个结果能够推广到任何有限n人博弈中的任何弱的正收益选择动力学上。总之,对进化压力而言,以各种不同方式系统阐述的稳定性都需要纳什均衡来实施。然而,不是所有的纳什均衡在这个方面都是稳定的,因此,这些进化稳定性准则是纳什均衡概念的精炼。

另外,研究者在考察动力学进化稳定性时,把随机因素并入到进化过程的建模当中。特别,变异过程被认为是内在随机的一种情况。随机振动可以凭借稳定性分析方法来解释确定性选择动力学;一个稳定的种群状态对于种群的孤立的很小扰动而言是稳健的。然而,这种稳定分析几乎说不出一系列的小振动或者同时发生的小振动累计之后促成的大振动的稳健性。这样的一系列或者同时发生的连续不断的振动会使种群状态离开选择过程的吸引域。虽然这种大量涌现的小振动不可能是统计意义上的独立而稀少变异的事件,但这一可能性在基本方法上却改变了动力学进化过程的性质。代替历史依赖性(依赖于初始种群状态),此过程会成为遍历的(ergodic),也就是具有一种渐进分布,其中渐进分布是历史独立的(对于所有的初始种群状态都是相同的)。从而,导致人们现今研究的一个专题——随机动力学稳定性。这种研究路线的先驱者是Foster和Young(1990),随后是Fudenberg和Harris(1992),Young(1993)等等。四、进化对策论在经济学中的应用

进化对策论的产生、发展在本质上就是起因于对策论中关于理人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。从上述的阐述中,我们可以看到,进化对策论在经济学里的应用前景是十分广阔的和吸引人的。

最近,Routledge探讨了金融市场上个体行为人是如何通过适应性或者进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过对来自于模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Routledge运用Grossman和Stiglitz的1980年发表的经济模型的形式。Grossman和Stiglitz(GS)模型提供了考察适应学习过程的一种良好的框架,因为它是获得内生信息的标准模型,这点已经被后来的其他许多关于学习方面的模型都是基于GS而提出的事实所证明。

如果假设交易者能够观察到他们自己的适应度和其他行为人的行为,那么模仿是如何发生的许多特殊细节就显得不重要了。Routledge的研究结果表明:首先,作为单调选择动力学的适应学习会促成GS均衡;其次,由单凋适应学习驱使的模仿的稳健性可从随机实验中来获得噪声(noise)来研究。他发现,适应学习是缺少稳健性的。特别,他运用Binmore和Samuelson(1999)的技术来对模仿和经验建模。为了使带有漂移(drift)的适应学习产生GS理性预期均衡,必要的条件是在风险资产供给中的噪声与学习过程中的经验水平有很大的关系。

五、问题与前景

我们注意到,进化过程并不总是导致最优性、均衡或者社会有效性。通过目前已取得的一些成果,我们认为下面的一些方向或许是值得学者进一步探讨与研究的:

(1)引进机构,分析市场选择机制。

(2)探讨博弈中学习规则的进化稳定性。结果,这就会导致拥有适度认知能力的个体的模型。

(3)进一步探讨扩展形式博弈中的进化过程。

(4)对*近理论方面的进一步探讨。我们需要更多地了解确定性模型和随机性模型之间的联系与关系。

(5)探索、研究结构化的稳健预测。显然,某种博弈的子结构,诸如在最佳反应和弱最佳反应的条件下所促成的纯策略集合,是进化过程的稳健吸引子(robustattractor)等。

本文概括地阐述了进化对策论中的理论内容和一些模型,特别是博弈中有关学习模型的新近发展。通过上面的分析,我们发现,进化对策论的发展动力来自于与其他社会学科的交叉融合,吸收其他社会科学中的有益知识。为了把有关的选择过程、学习过程以及变异过程的类别变窄,我们需要更多地知晓个体、团体、组织、厂商以及整个社会是如何随时间而适应和学习的。这里的部分内容正是实验对策论中所要探讨的,同时这也是我们应向其他社会科学学习的领域。

参考文献:

1.王忠玉:《1994年度诺贝尔经济学奖与对策论》,载《科学(ScientificAmerican中文版)》,1996(7),3—5页。

2.王忠玉:《金融市场从众行为的数理模型》,载《中国管理科学》,2000(2),50~55页。

3.Binmore,K.,1990.EssaysontheFoundationsofGameTheory,BasilBlackwell.

4.Binmore,K.,Samuelson,L.andVaughan,R.,1995.MusicalChairs:ModellingNoisyEvolution.GameandEconomicBehavior11,1--35.

5.Binmore,K.andSamuelson,L.,1999.EvolutionaryDriftandEquilibriumSelection.ReviewofEconomicStudies,66,363--393.

6.Blume,L.andEasleyD,1992.EvolutionandMarketBehavior.JournalofEconomicTheory58,9-45.

7.BlumeL.andEasley,D.,1990.EvolutionandLearninginCompetitiveMarkets,inKirman,A.andSalmon,M.(eds.),LearningandRationalityinEconomics,Blackwell(Oxford).

8.Bomze,1.andPotscher,B.,1989.GameTheoreticalFoundationsofEvolutionaryStability.SpringerVerlag(Berlin).

9.Bomze,I.andWeibull,J.,1996.DoesNeutralStabilityImplyLyapunovStability.9Gameand

EconomicBehavior11,173--192.

10.Bryan,R.Routledge,1999.AdaptiveLearninginFinancialMarkets.TheReviewofFinancial

Studies12,1165--1202.

11.Canning,D.,1990.LearningandSocialEquilibriuminLargePopulations,in

Kirman,A.andSalmon,M.(eds.),LearningandRationalityinEconomics,Blackwell(Oxford).

12.Cressman,R.,1992.TheStabilityConceptofEvolutionaryGameTheory,SpringerVerlag(Berlin).

13.VanDammeE.,1987.StabilityandPerfectionofNashEquilibria,SpringerVerlag(Berlin).

14.Dekel,E.andScotchmer,S.,1992.ontheEvolutionofOptimalBehavior.Journalof

EaonomicTheory57,392--406.

15.Fudenberg,D.andLevine,D.,1993.Steady-stateLearningandNashEquilibrium,Econometrica61,523-574.

16.Fudenberg,D.andLevine,D.,1997.TheTheoryofLearninginGames.MITPress.

17.Haesanyi,J.andSelten,R.,1988.AGeneralTheoryofEquilibriumSelectioninGame,MITPress.

18.Kandori,M.,Mailath,G.andRob,R.,1993.Learning,Mutation,andLong-runEquilibriainGame,Econometrica61,29--56.

19.Nelson,R.andWinter,S.1982.AnEvolutionaryTheoryofEconomicChange.HarvardUniversityPress(CambridgeMA).

20.Robson,J.A.2001.TheBiologicalBasisofEconomicBehavior.JournalofEconomicLiterature,Vol.ⅩⅩⅩⅨ(March2001),11--33.

篇8

一、问题的提出

学校是培育人才的摇篮,班级是学校的基本构成单元。班级安全文化是指班级在教学、科研以及生活等领域所创造的理念、形象、设施与行为等的总和,班级安全文化建设是学校安全文化建设的基本立足点。学生是班级的主体,班级安全文化是全班学生共建共享的,一个班级的安全文化氛围浓厚只是一枝独秀,只有当学校所有班级的安全文化不断优化,才能有助于学校安全文化的提升,为学生的学习和生活提供安全保障。彻底否定传统博弈论赖以成立的基础即“理性人假设”的进化博弈理论从具有有限理性的“社会人”出发,分析参与人的行为从而建立起崭新的分析框架。自从1973年生态学家史密斯和普赖斯引进进化稳定策略,TaylorandJonker于1978年提出模仿者动态概念后,进化博弈论被广泛应用于各学科。经典的博弈论建立在完全理性的假设基础上,在解释现实行为方面具有明显不足。而进化博弈论用于解释群体之间的行为是如何相互影响的动态变化过程,因而适用于班级安全文化建设的解释性分析及探索性研究。

二、有限理性条件下学生之间的安全文化建设进化博弈分析

学生作为行为主体,具有有限理性,在班级安全文化建设中的策略选择也是可模仿学习的。运用进化博弈原理对具有有限理性的学生间的相互行为及班级安全文化建设进行分析,颇具理论及现实意义。

(一)基本假设

学生之间是无差异的,由学生组成的群体成员间进行了随机配对博弈,形成两人对称博弈,学生的策略选择受其他学生的策略影响,策略的调整是一个缓慢的动态调整过程。

(二)模型构建

第一,博弈参与者。根据进化博弈原理,将随机配对的两名学生分别记作“学生1”和“学生2”。在班级安全文化建设中,学生有认真参与和敷衍了事两种选择。第二,博弈方的行为策略。在班级安全文化建设中,学生采取的博弈策略有两种:一是积极主动,另一种是敷衍应付,分别记作“主动”和“敷衍”。第三,博弈得益。通过开展班级安全文化建设,假设两名学生都能够认真学习安全知识和技能,可以在很大程度上避免和防范常见校园安全事故,即使遇到安全事件也能尽其所能成功应对的概率为1,从而获得一定的效用,记作V。假设两名学生中,一名学生在班级安全文化建设中采取“主动”策略,安全素质得以提高,从而获得了安全文化建设效用,另一名学生选择“敷衍”策略。严格来讲,学校安全事故的发生具有偶然性,即两名学生在防范和应对校园安全事故时也有一定的成功概率,分别记作R和r。因此,采取“主动”策略的学生获得的效用水平为V*R,采取“敷衍”策略的学生获得的效用水平为r*V,且r≤R,0≤r≤1,0≤R≤1。假设在班级安全文化建设中,两名学生都采取“敷衍”策略,则获得的效用均为M,可正可负,在学校安全形势比较稳定的条件下,学生即使不积极主动参与班级安全文化建设,也不会有任何损失,此时M为正值。相反,校园安全事件的发生会造成一定的人身财产损失以及不良声誉,此时M为负值。

(三)随机配对的两名学生

对称博弈模型的纳什均衡求解根据划线法对博弈模型进行分析,班级安全文化建设中“主动”的学生都能获得较高的效用,即V*R≥M。根据班级安全文化建设实际,运用划线法求解得:当r≤R,V*R>M时,“主动”是每名学生在任何情况下都不会改变的占优策略,因此(认真学习,认真学习)成为随机配对的两名学生对称博弈模型的唯一纳什均衡。当r≥R,V*R<M,存在两个纳什均衡,即两名学生会相互影响,(认真学习,认真学习)和(敷衍学习,敷衍学习),学生以一定的概率选择参与班级安全文化建设策略,要么都“主动”,要么都“敷衍”。当r≥R,认真学习安全知识和技能,即“主动”参与班级安全文化建设的学生仍然不幸遇到安全事故,当事故具有偶然性时,“主动”参与班级安全文化建设的学生会改变策略,转为“敷衍”参与班级安全文化建设。

(四)有限理性条件下学生之间的安全文化建设进化博弈分析

当进行班级安全文化建设,对学生开展安全教育和安全管理时,假定以y(t)表示选择纯策略———“主动”参与班级安全文化建设策略的学生人数在群体中所占的比重,则选择“敷衍”策略的学生人数所占比重为1-y(t)。

三、结论及建议

通过构建学生参与班级安全文化建设的进化博弈模型并进行分析求解,得到不同条件下两种不同的进化稳定策略,从而得出学生在参与班级安全文化建设过程中,受其他同学的影响非常明显,要么都“主动”,要么都“敷衍”。安全文化建设是一种居安思危、预防为主、防患于未然的系统工程,如同温水煮蛙实验。从学生参与班级安全文化建设的演化过程看,要改变目前多数学生都存在“敷衍”的现状,应注重对学生学习安全知识和技能的引导,强化安全防范意识,提高“主动”参与班级安全文化建设的效用。采取多种形式开展班级安全文化建设,对学生开展人性化的安全管理尤其是参与式管理,例如通过应急演练、情境模拟等方式吸引学生参与,激发学生的学习力,提高学生安全素质,提升班级安全文化建设实效。

参考文献:

篇9

一、前言

战略管理理论产生的直接原因来源于企业经营环境的变化。因此,经营环境的不断变化,导致了战略管理理论也在不断地发展和创新。20世纪90年代以来,企业的经营环境发生了巨大的变化。一方面,企业竞争的范围无限扩大,进入了一个无国界的竞争时代;另一方面,企业与其供应商、生产者、销售商、顾客、其他组织和相关利益者的合作关系越来越密切,企业间的竞争已不在是工业时代那种你死我活的竞争,而是基于网络思维下的合作网络竞争,即网络经济下的竞争已不在是单个企业之间的竞争,而是企业合作网络之间的竞争,这是一种新的竞争形态——网络竞争。

在网络竞争环境下,战略管理研究者纷纷从不同的角度来研究网络竞争环境下的企业战略管理理论,这些具有开拓性的研究极大地丰富了企业战略管理理论。综观20世纪90年代以来企业战略管理理论研究的历程,我们认为,理论界和实践中有较大影响的理论有4种:能力理论、动态能力理论、复杂理论、合作竞争理论。本文重点分析了现有 4种战略管理理论的核心逻辑(见表1),通过对这些理论核心逻辑评述,可有效地认识到企业战略管理理论的发展趋势。

二、企业能力理论的核心逻辑分析

企业能力理论的出现源于对传统竞争战略管理理论不足的认识,认为企业的利润并非完全来自于市场的机会、市场的发展状况和产业结构等外部因素,更重要的是来源于企业内部的资源和能力。正如Rumelt分析的那样,产业内公司之间的利润率分散程度要比产业间的利润率分散程度大得很多,“很明显,最重要的超额利润源泉是企业具有的特殊性,而非产业间的相互关系。”因此,以C.K.Pahalad和Gary Hamel为代表的企业能力理论“越来越注重对公司资源和能力的分析”,强调从识别、培养、应用和捉升企业内部生产经营及其过程中的独特能力出发,来制定和实施企业战略。

1.能力理论的逻辑思维是:企业核心能力识别和企业的机会空间分析树立战略意图制定基于核心能力培养和应用的战略规划选择合作伙伴来发挥核心能力的杠杆作用战略实施企业超额利润的获取和企业的持续发展。基于能力的企业战略,首先分析企业的核心能力所在和基于核心能力发挥的机会,在此基础上树立企业的战略意图和制定现有核心能力发挥与未来核心能力培养的规划,为将自身的资源专注于核心能力之中,必须选择和培养合作伙伴,从而发挥核心能力的杠杆作用,然后实施战略,实现企业的持续发展。

表1

4种战略管理理论核心逻辑比较表

理论类别

对市场条件的认识

对竞争优势

之源的认识

分析单元

战略重点

合作的态度

战略的特性

能力理论

相对稳定、线性可测

难于模仿的

企业内部

培养、利用和提升核心 衡,创造不连续的创新

机会主义的合作

长期性、稳定性

动态能力理论 无序、突变、不可预测 系统和合作能力

企业与企业经营环境

快速、敏捷地打破均

化和关系网络管理

短期的合作

短期性、不定性

复杂理论

混沌、非线性、周期性 进化的商业生态

商业生态系统

保持商业生态系统进

保持合作关系

共生的周期合作

周期性、互动性

合作竞争理论 互动性、系统性

有效地合作竞争的能力 博弈参与者构成的价值链 PARTS模式分析

能力,发挥其杠杆作用

竞争的合作

动态性、互动性、适应性

2.企业生存和发展的源泉来源于有价值的、独特的、难于模仿的企业核心能力。C.K.Pahalad和GaryHamel把一个多种经营的企业比喻成一棵大树,树干和主要分枝是核心,产品,小的树枝是经营单位,树叶、花朵和果实是最终产品,而提供抚育、营养来保持企业稳定成长的根系则是核心能力。只有企业的根系——核心能力不断加强,将其营养和能量不断扩展到最终产品,从而不断提供创新产品,创造新市场,使消费者得到更大的满足,为企业创造更多的利润。

3.基于能力理论的企业战略起点,是分析和识别企业的核心能力。能力理论认为,企业“战略的核心不在于公司产品、市场的结构,而在于其行为反应能力;战略的目标在于识别和开发别人难以模仿的组织能力;在顾客眼里,这种组织能力是将一个企业与其竞争对手区别开来的标志。”C.K.Pahalad和Gary Hamel提出了识别核心能力的三条标准:(1)有价值性。核心能力是有很多的经济价值,能为企业带来垄断的超额利润,同时,它也能为顾客提供更多的价值,也就为企业产品进入多个市场提供了潜在的途径。(2)难于模仿性。核心能力是竞争对手难于模仿的,它是企业通过长期积累的多种技术、知识的有机综合体,具有路径依赖性。(3)不易替代性。核心能力在较长的时间内不易被其他能力所代替,否则,其价值性就会降低,无法再继续保持企业的竞争优势。

4.基于能力理论的企业战略的重点是企业核心能力的培养、应用和提升。能力理论认为,核心能力是企业利润的源泉,由于各个企业的核心能力不同,所以就产生了企业的异质性,要保持企业长期的盈利,企业战略必须重点考虑现有核心能力发挥。同时要考虑未来核心能力的方向和培养提升的规划,这样才能保证企业的持续发展。

5.基于能力理论的企业战略,改变了对传统的竞争本质的理解。能力理论认为,当今的企业竞争不再是你死我活的对抗竞争,而是企业内部自身的核心能力强弱的竞争,你的核心能力强,你就可获得更多的超额利润。但企业核心能力作用的发挥需要其他企业的合作,能力理论强调要既竞争又合作,通过合作来发挥核心能力的杠杆作用,从而提高企业的竞争优势。

从上述核心逻辑分析可知,基于能力理论的企业战略也有不足之处。(1)它的前提是把外部环境看成是线性变化和相对稳定的,这样就可发挥企业现有的核心能力,而实际上当今的环境的变化是非线性的和日趋剧烈。(2)它的合作理念是基于保护自己的核心能力,防止其他公司模仿。因此这种合作是机会主义的合作,不可能保持长期合作。(3)过分强调了内部组织核心能力的作用,而忽略了外部组织的支持、互补作用。

三、动态能力理论的核心逻辑分析

动态能力理论源于20世纪90年代市场环境变化的特点而产生的。市场环境日益动态化,技术创新速度加速,经济的国际化和市场的全球化,顾客需求的多样化,造成了竞争内容越来越快,竞争优势的可保持性越来越低,惟有不断创新,才能持续成功。该理论的代表人物是R.D’Aveni,他于1994年出版了《超越竞争》一书,全面阐述了动态能力理论的框架。

1.动态能力理论的逻辑思维是:外部环境分析定义新的创新机遇制定响应新的机遇的战略寻找完成新创新机遇的合作伙伴合作竞争新的竞争优势并结束现有合作。即在外部环境分析的基础上,发现和定义新的机遇,并制定出响应的战略,选择暂时的、不连续的伙伴来完成特定战略,通过合作竞争,取得新的竞争优势,在完成预定的战略后解散现有的合作,在回到起点去寻找新的创新机遇。通过不断创新来保持企业在超级竞争环境下的持续发展。

2.基于动态能力理论的战略目标是不断创造新优势。因为在瞬息万变、不可预测的环境下,所有的竞争优势都是短暂的,若固守在保持原有的优势上将导致更大的灾难。只有认真地、不断地和出其不意地打破现有平衡,快速响应机会和企业内外资源的重构,形成一系列暂时的、不相容的新优势,才能保证企业持续的竞争优势。因此,动态能力战略实质是一个创新战略。

3.基于动态能力理论的战略制定的关键,是分析竞争对手之间的战略互动(Strategic Interactions)。该理论认为,在超级竞争环境下,竞争对手之间的动态互动明显加快,竞争互动已成为制定战略的决定因素,只有及时正确地预测竞争对手的战略动态,才能保证自己正确地把握时机放弃原有优势,创造新优势。

4.基于动态能力理论的战略重点,是企业动态能力的培养,不断创造新的核心能力。这种战略是一种动态战略,整个战略实施过程就是按照灵活性、敏捷性的原则动态设计组织结构和系统,企业内外部资源的动态重构,形成有自身风格的系统,用自己的战略行为创造一个发展和赢利潜力大的空间。

5.基于动态能力理论的战略目标的实现,需要其他组织的合作来实现。但这种合作是基于时间和任务的合作,与其他组织建立的是一种暂时的、不连续的合作关系,只要任务一完成就解除现有的合作关系。然后,又重新发现新的创新机遇,重新寻找新的合作伙伴,开始新的战略实施。

从上分析,可知这种理论的主要缺点有:(1)这种理论的前提是假设市场的环境瞬息万变、不可预测,而实际上,市场环境在一定的时间内是可以预测的和相对的稳定。(2)企业不存在可持久发挥作用的核心能力,否定了一个企业核心能力的积累性、路径的依赖性和不可模仿性。(3)组织间的合作是基于任务的合作,合作的关系具有时间性、暂时性。

四、复杂理论的核心逻辑分析

复杂理论研究,源于对网络经济环境下市场的认识及商业生态系统和混沌理论的研究。复杂理论的代表人物是 Moor,1996年出版了其代表作《竞争的衰亡:商业生态系统时代的领导和战略》。他认为,网络经济世界的运行并不都是你死我活的斗争,而是像生态系统那样,企业与其他组织之间存在“共同进化”关系。在企业的商业生态系统中,为了企业的生存和发展,彼此间应该合作,努力营造与维护一个共生的商业生态系统。因此,他强调企业战略管理必须有“新的语言、新的战略逻辑和新的实施方法”,用全新的理论——商业生态学来全面阐述了商业生态系统的企业战略。该理论的核心逻辑是复杂性,反映了企业战略在动态非线形的复杂环境下,要以创建一个商业生态系统、注重嵌入于系统的不同参与者和过程的动态张力及其相互关系为重点。

1.复杂理论的逻辑思维是:“信息空间”环境和内部条件分析制定企业战略创造和完善商业生态系统加强网络关系管理和贡献各自的核心能力网络竞争优势企业业绩商业生态系统进化和企业的发展。即首先以“充满机会”的环境分析和论证为起点,结合企业内部的能力和价值分析,制定以创新为重点的企业战略,在战略实施中以创新机会为中心,创造和完善商业生态系统,加强网络关系管理和贡献各自的核心能力,从而在与其他相类似的商业生态系统竞争中获取网络竞争优势,实现企业的业绩和核心能力的不断提升,促进商业生态系统的进化。

2.基于复杂理论的战略,突出了企业战略的系统性,提出了商业生态系统的新观念。复杂理论认为,这个系统是一个复杂动态非线性的混沌系统,这个系统包括了供应商、主要生产者、竞争对手、顾客、科研机构、高等院校、行政管理部门、政府及其他利益相关者,企业是这个系统的成员之一,系统决定了企业的行为和价值,决定了企业的战略方向,要求企业从整个企业生态系统来制定战略。

3.基于复杂理论的战略,强调按照自相似、自组织、自学习与动态进化的原则来设计网状结构组织和系统(即网络组织),通过共创愿景、系统思考、网络学习、共享知识、协同作用,使企业在创造未来中实现可持续发展。这是由商业生态系统内在的本质特性所决定的。

4.基于复杂理论的战略,目标是建立和保持一个相互依赖、相互学习、共同进化的商业生态系统。复杂理论认为,企业是商业生态系统的一个成员,这个系统的好坏和是否稳定直接关系到企业的生存与发展,反过来系统的稳定、发展和进化也有赖于各成员的通力合作和相互间的关系。因此,企业的绩效取决于其在这个系统中合作和网络关系管理能力的水平。

5.基于复杂理论的战略,具有周期性。复杂理论把一个商业生态系统的合作进化过程分为开拓、扩展、权威、重振或死亡4个阶段,企业在其自身的商业生态系统的合作过程具有周期性,通过系统的不断循环,促进商业生态系统的不断进化和企业的不断发展。

从上分析可知,该理论的主要缺点是:(1)强调系统选择企业,弱化了企业对系统的选择自由。它认为企业的初始条件对建立系统并不重要,而实际上企业本身的能力直接关系到系统能否稳定和发展的关键,也影响到其在系统中的位置和收益。(2)它认为商业系统的进化如同自然系统一样,其成长和发展依赖于商业生态系统的性质,而忽略了企业本身的能动作用。(3)合作有周期性,而实际上合作往往会随时间的推移而得到加强。

五、合作竞争理论核心逻辑分析

合作竞争理论,源于对竞争对抗性本身固有的缺点的认识和适应当今复杂的经营环境。该理论的代表人物是 B.J.Nalebuf和A.M.Brandenbuger,他们的代表作是1996年合著出版的《合作竞争》。他们认为,企业经营活动是一种特殊的博弈,是一种可以实现双赢的非零和博弈。企业的经营活动必须进行竞争,也有合作,提出了合作竞争(Co-petition)的新理念。它是对网络经济时代企业如何创造价值和获取价值的新思维,强调合作的重要性,有效克服了传统企业战略过分强调竞争的弊端,为企业战略管理理论研究注入了崭新的思想。同时,利用博弈理论和方法来制定企业合作竞争战略,强调了战略制定的互动性和系统性,并通过大量的实际案例进行博弈策略分析,为企业战略管理研究提供了新的分析工具。合作竞争战略管理理论的核心逻辑是共赢性,反映了企业战略在网络信息环境下,要以博弈思想分析各种商业互动关系、与商业博弈活动所有参与者建立起公平合理的合作竞争关系为重点。

1.合作竞争理论的逻辑思维是:绘制价值链确定所有商业博弈参与者的竞争合作关系实施PARTS战略来改变博弈分析和比较各种商业博弈结果确定合作竞争战略扩大商业机会、实现共赢。即首先将商业博弈绘制成一幅可视化的图——价值链,利用价值链定义所有的参与者,分析与竞争者、供应商、顾客和互补者的互动型关系,寻找合作与竞争的机会。在此基础上,改变构成商业博弈的5要素(参与者,Participators;附加值,Added values;规则,Rules;战术,Tactics;范围,Scope,简称PARTS)中的任何一个要素,形成多个不同的博弈,保证了“PARTS不会失去任何机会”、“不断产生新战略”,并分析和比较各种博弈的结果,确定适应商业环境的合作竞争战略。通过实施,最终实现扩大商业机会和共同发展的战略目标。

2.基于合作竞争理论的战略起点,是分析商业博弈活动参与者之间的互动关系。合作竞争理论提出了参与者价值链的新观念,利用价值链来描述所有的参与者的竞争合作的互动关系。价值链的思想强调了企业经营活动中同时竞争与合作两种行为,两者的结合意味着一种动态的关系,而不是“竞争”和“合作”的两字所单独的意思,有效克服了Porter经典竞争战略管理理论利用5个力量模型仅从竞争的角度来分析所有参与者竞争态势的弊端。

3.基于合作竞争理论的战略目标,是建立和保持与所有参与者的一种动态合作竞争关系,最终实现共赢局面。合作竞争理论提出了互补者(Complementor)的新概念,认为商业博弈的参与者除了包括竞争者、供应商、顾客外,还有互补者。强调了博弈的参与者之间的相互依存、互惠互利的关系,“要创造价值,就要与顾客、供应商、雇员及其他人密切合作。这是开发新市场和扩大原有市场的途径”。因此,企业的生存与发展离不开其他组织的支持和合作,这是对经典竞争战略管理理论的完善和补充。

4.基于合作竞争理论的战略制定过程,贯穿了博弈思想。战略要“从其他参与者的认知角度”来制定战略,克服了传统战略仅从企业本身的利益制定战略的弊端。同时,通过参与者、附加值、规则、战术和范围这5个杠杆对博弈行为和结果的作用分析,选择合适的战略,使企业战略更具有互动性、现实性和可行性。博弈思想是一种结合了合作与竞争思想的革命性战略思维,博弈的理论方法为网络竞争环境下企业战略管理研究提供了新的分析工具。

5.基于合作竞争理论的战略,是一种着眼于未来的动态战略。合作竞争理论认为,商业博弈是一种重复博弈,而且构成博弈的五要素PARTS会随时间而变化,从而改变每次博弈的行为和结果。因此,企业战略并非都是事先计划好的,而是一种不断调整和变化的动态战略,以适应商业博弈的改变。同时,在商业博弈中,“没有什么东西是固定的”、而且“充满活力,不断进化”,PARTS模式的变化带来博弈的变化,不断创造新的机会。因此,基于合作竞争的企业战略必须着眼于未来的博弈,才能把握住未来的机遇。

从上分析,我们认为合作竞争理论也有明显的不足之处。(1)从组织的有限理性出发,按X理论来考虑企业之间的合作竞争博弈关系,忽略了企业的社会性和复杂性对博弈的影响。(2)仅研究了参与者两两之间的两元合作竞争关系,没有结合企业网络理论来研究合作竞争的网络关系。(3)没有建立一套完整的合作竞争战略管理过程。

六、企业战略管理理论研究的发展趋势

尽管现有的主要战略管理理论核心逻辑各有不同,但通过比较分析,我们认为它们至少有4个共同点:系统性、合作性、创新性、动态性。这些共同点,反映了企业战略管理理论研究在网络竞争环境下的发展趋势。

1.企业战略的主体,已有单个企业转向与企业相关的整个网络。4种理论都已意识到,战略必须具有系统性,企业作为商业系统的子系统,企业战略必然与整个商业系统密切相关。特别是在网络经济环境下,企业与环境的边界越来越模糊,企业的关系网络及其管理“必然将成为新的管理范式与新的竞争游戏规则”,“关系管理是当今企业成功的关键”,企业的生存与发展依赖于与之相关的参与者及其所构成的商业系统。一种整合网络思想植根于企业战略管理理论研究之中,是网络竞争环境下企业战略管理理论研究的新动向。

2.企业战略的核心思想,由传统的敌对竞争思想转变为共赢的合作竞争思想。4种理论都强调合作的重要性,认为要跨越传统企业的边界,加强发展个人间、部门间和组织间的交流与合作,“成功需要边界的渗透性和多种至少是暂时的联盟与交流”,同时竞争与合作,以合作求生存,靠竞争求发展。因此,以实现共赢为目标的合作竞争思想,已成为网络经济环境下的企业战略的主导思想。

篇10

在科学技术高速发展的今天,企业科技研发的能力关系到企业的生存与发展[1]。企业研发团队作为企业创新的主要载体,已成为企业不可分割的一部分。但是,随着企业研发团队规模的不断增大,需要团队内成员间共同协调和配合的研发任务越来越多,研发任务也越来越复杂和困难,不可避免的团队内冲突也以各种各样的形式表现了出来,适度的过程冲突对团队的有效性有促进的作用,然而,过多的过程冲突会影响团队的有效性,不利于企业科技研发任务的顺利展开[2]。关于企业研发团队过程冲突问题的研究逐渐引起广大学者的重视[3],国内外学者已经从过程冲突产生的原因和形成、冲突的类型及冲突管理方面进行了一些研究[45]。但是,研究的方法大都是采用实证或者是用传统的博弈理论进行研究的。而采用传统博弈理论,虽然可以针对所有研发团队的情况,但其不足之处在于理论本身的缺陷,该理论在理性基础方面采用的是一种完全理性的假设,该假设不仅要求行为个体始终以自身最大利益为目标,还要求他们在存在交互作用的博弈环境中具有完美的判断和预测能力,这种完全理性假设的现实性明显是有问题的,因为它不仅意味着博弈方绝对不会犯错误,决不会冲动和不理智,即使在复杂的多层次交互推理中也不会糊涂,它对行为主体能力的要求过高,在现实中不可能存在这样的理性个人或群体。因此,本文决定以进化博弈理论为基础,建立非对称企业研发团队成员的进化博弈模型,该模型不但考虑了传统企业团队成员工作中的利益得失,还注重了研发团队成员工作的特殊性和收益的不同,引入了超额收益的概念,使模型更合理。而且该理论的理性基础是有限理性,其允许博弈成员犯错和有非理性的行为,更符合我们的实际情况。综上可以看出,本文所采用的方法更适合对团队冲突的问题进行研究,得到的结果也会更准确。

一、文献综述

在企业研发团队中,注重企业研发团队的过程管理,对于确保团队工作的平稳运行具有重要意义。正如谢舜龙等[6]指出的,从企业长远发展的角度看,建立一个规范的研发过程管理体系,其重要意义远远大于某一两个研发成果。在研发过程受控的条件下,企业可以使资源通过过程方法得到最大限度的增值,并有效地实现研发成果[7]。团队过程冲突是团队成员互动的负效应,也是团队成员异质性的必然结果[3],只有合理地控制和利用它,而不是彻底消除它。研发团队过程冲突是企业研发团队成员在共同完成研发目标的过程中,由于彼此间的差异、观点的不同,利益和资源安排的分歧,而产生的各种情绪。团队成员相互作用的结果有讨论、争论、冲突等行为。

关于团队过程冲突的研究,国内外已经取得了一些研究成果,Jehn[8]通过再次观察和访谈工作团队后,发现团队中除了任务冲突和关系冲突外,还存在第三种冲突:过程冲突。在此之后,过程冲突才逐渐进入了学者的研究视线,并展开了一些论述和研究。Dreu[9]认为,不适当的冲突对组织来说会影响到工作的满意度及组织的绩效,在高水平的冲突条件下,组织之间秩序混乱绩效不佳,成员间处在高压环境状态下,工作满意度将下滑,而组织目标将无法达成;在低水平的冲突水平下,绩效及工作满意度更不会良好,故只有在适当的冲突水平下,即冲突达到最佳状态时,绩效以及工作的满意度会到达最佳状态,见图1。

要有效地管理冲突,首先要把建设性冲突和破坏性冲突区分开来。一方面要设法消除和避免阻碍团队目标实现与功能失调的破坏性冲突(如关系冲突);另一方面又要使团队营造一种批评与自我批评、不断创新进取的氛围,维持和保护有益的建设性冲突(如任务冲突和过程冲突),激发员工的创造性,即冲突具有二重性,其效果也有利有弊,应区别对待[10]。Thatcher等[11]指出,过多的过程冲突会造成成员责任的不确定以及对于工作能力的相互怀疑,特别是利益分配的不协调将导致团队的分化,导致团队过程冲突的加剧,从而对团队绩效产生消极的影响。张兰霞等[12]认为,适度的过程冲突能促进团队的发展,但是,随着过程冲突程度的日益增加,团队成员的行动、思想都会受到妨碍,从而危害团队成员的创造力。

综上所述,我们可以得出如下结论:其一,在企业研发团队中,保持适度的过程冲突有利于团队的发展,可以提高团队的有效性,过多的过程冲突不利于企业研发任务的顺利进行,会严重影响研发团队的绩效,因此,要对过程冲突进行控制,使其维持在适度的水平。其二,学者对团队过程冲突的研究大多数是研究冲突的影响或是提出冲突的解决策略(既消除冲突),而对于过程冲突进行有效地控制和管理,使其保持适度的水平,从而合理利用冲突的研究却并不多见。因此,本文分析与研究的主题是运用进化博弈的方法,对过程冲突双方的得益进行分析,有效的控制恶性过程冲突的发生(双方成员不进行合作),使团队的过程冲突维持在一个适度可控制的水平,使团队成员间总能保持合作的状态,从而使企业研发团队的过程管理达到最佳状态。

二、进化博弈的模型构建

(一)模型假设

假设1:企业研发团队成员1和成员2代表专业能力不同、对事物认识理解感知有差异的两类研发团队成员,且他们都是有限理性的。

假设2:企业技术创新团队成员1和成员2对是否展开合作创新的策略集都为{合作,冲突}。合作策略下,双方过程冲突都在适度的范围内,大家全力以赴,进行合作创新。冲突策略下,双方选择互不合作的方式,各自成员独立进行研发或在已经开始的合作过程中消极怠工,搭便车,此时过程冲突处于不可控的范围,即恶性过程冲突发生。

假设3:Ra 、Rb分别表示企业研发团队成员1和成员2在恶性过程冲突发生(既冲突)状态下独立研发所获得的收益,Ra ≠Rb,Ra 、Rb>0;ΔR为企业研发团队成员1与成员2因在创新过程中互相合作而在独立研发收益基础上获得的超额收益(如因合作创新提前完成创新研发任务而受到的企业团队领导的奖励),ΔR >0;α为超额收益在企业研发团队成员1、2间的分配系数,0≤α≤1;R为企业研发团队一方成员继续合作创新而另一方在合作过程中选择冲突策略而在原平均正常收益的基础上获得的额外收益(如学到对方的知识、技术后自己私下独立研发等),R>0;C为企业研发团队成员选择冲突策略所付出的成本(如当被合作方发现搭便车,合作方将问题反映给团队领导,导致其受到处罚);π为合作方单独采取合作策略而受到的损失(如因为恶性冲突发生,对方不合作,使研发任务中途停止,从而使单独采取合作策略一方前面的努力作废)。

假设4:在企业研发团队成员1群体中,有比例为x的博弈方采取合作策略,则有比例为1- x的博弈方采取冲突的策略;在企业研发团队成员2群体中,有比例为y的博弈方采取合作策略,则有比例为1- y的博弈方采取冲突的策略,x、y[0,1]。

(二)进化博弈模型的建立

首先构建研发团队成员过程冲突博弈支付矩阵,见表1。

四、结论

本文基于进化博弈理论对企业研发团队成员在过程冲突情况下的策略选择进行了博弈分析,分析结果表明:

其一,当企业研发团队成员冲突策略的净收益大于选择合作的超额收益时,成员在长期进化学习的过程中都会慢慢地采取冲突的策略,从而使恶性过程冲突全面升级,团队的过程管理趋于失败。

其二,在企业研发团队成员的工作过程中,当企业研发团队成员冲突策略的净收益小于选择合作的超额收益时,由于团队成员都是有限理性的特点,当过程冲突发生时,企业研发团队成员也不一定会选择最佳的策略(即保持合作),即使是在长期的进化学习过程中,也无法

篇11

二、相关概念阐述

(一)影子银行

影子银行一词来源于美国次贷危机爆发后,首次被Paul Mcculleys提出的。后来FBS(2011)正式指出,影子银行是传统银行体系之外所涉及信用融资活动的机构。这成为了国内外学者接受度最大的界定。

我国对影子银行的界定一直与体制外金融、民间金融、民营金融、地下金融等概念混用的现象。但是大家对影子银行的基本认知都包括未受国家法律规范,游离于监管当局监管之外等等。有的学者还指出,除了金融机构外,还应包含金融创新产品、服务以及产品和服务适用的金融市场。不过由于本文讨论的是两个主体间的合作关系,故而本文所指的影子银行即是游离于传统银行管理体系之外的非银行金融机构。

(二)有限理性

由于现实生活中许多现象无法用传统金融学来解释,故而后起之秀――行为金融学因合理解释了这些金融现象被广大学者所接受,行为金融学与传统金融理论最大的不同之处就在于,行为金融学认为是投资者不是完全理性人,而是有限理性人。他们总是会受到心理、环境、他人的影响而作出决定。投资行为不全是根据利益最大化原则,还包括安全最大化等等。

(三)进化博弈模型

进化博弈论博弈是一个动态的博弈过程,是有限理性博弈双方群体在一定的前提下对当前局面进行选择,在一个群体中得益较差的博弈方迟早会发现这种差异,并开始学习模仿得益较高的博弈方,后经过自我体验以及学习其他人的选择,而不断改变自己的策略。最终市场会根据“优胜劣汰”的自然规律,形成一个稳定的策略。这种类似于生物进化论的动态博弈方式被称为进化博弈论。最终形成的策略成为进化稳定策略(ESS)。

本文基于进化博弈论的研究方法,对传统银行和影子银行二者的合作进行预测,并判断何时能够达到二者自然选择“合作”策略。基于进化博弈论的基本理论,我们假设传统银行和影子银行都是有限的理性人,对两个博弈方不再细分其内部的个体,并且假设传统银行与影子银行的最大的区分是是否受监管当局监管。

三、影子银行和传统银行合作问题的进化博弈分析

我们粗略地假定我国金融市场中有传统银行机构和影子银行两类机构,而双方面临的选择只有“合作”和“不合作”两种策略,自我的选择和其他群体的选择都将影响自身与他人的收益。他们都将依据这种相对收益率不断地调整自己的策略。两个群体不断地博弈交流,最终通过“物竞天择、适者生存”的进化法则自发进化到具有稳定性的均衡状态――进化稳定策略(ESS)。

1.博弈双方的得益

我们先假设传统银行和影子银行在非合作状态下的收益分别为Rc和RY。我们假设,当二者采取合作时,由于渠道拓宽,客户量增大以及销售效率提升,双方的收益将会增加πc和πY,此时双方存在一个合作的成本分别Cc和CY,且我们假定πc大于Cc,πY大于CY。根据上述假设,可以得到如表1所示的矩阵图。我们发现,如果传统银行与影子银行都是理性“经济人”时,表1的结果必然存在一个纯战略的纳什均衡(合作、合作);但是如果我们把前提假设放宽至“有限理性”,我们发展最后的进化稳定策略并非都是(合作,合作)

2.传统银行和影子银行的期望得益及其动态微分方程

假定当t时,x是传统银行群体中选择合作策略的银行占传统银行的且X∈(0,1),则选择不合作策略银行比例为1-x;同理,在影子银行群体中,y是选择合作策略的银行占影子银行的比例,且Y∈(0,1),则选择不合作策略的银行比例为1-y。

在传统银行群体中采取“合作”和“不合作”策略两类博弈方的期望得益分别为μCHZ和μCNH,群体平均期望得益为μC:

3、基于传统银行群体和影子银行复制动态微分方程的分析

从(7)式可知,传统银行群体中选择“合作”策略博弈方的比例x的变化率与该类型博弈方的超额期望得益呈正相关关系,也与该类型博弈方的比例x呈正相关。

当y=时,,传统银行中选择 “合作 ”策略的银行的比例的变化率为0,即采取“合作”策略的博弈方比例不会发生变化,此时传统银行群体处于稳定状态。当,即采取“合作”策略的银行获得超额收益,那么,选择“不合作”策略的银行将逐渐发现并调整策略的策,选择“合作”策略,选择“合作”的比例x会向趋近1,此时是该群体复制动态下的一个ESS。当,即采取“合作”策略的博弈方的期望得益小于群体平均得益。那么, 选择“合作”策略的银行也会逐渐选择“不合作”策略,采取“合作”策略的博弈方数量会逐渐减少,直到X=0 ,此时是该群体复制动态下的另一个ESS。下图1给出了上述三种情况 的动态变化的相位图和稳定状态。

同理可知影子银行群里的情况。当,在影子银行里选择“合作”策略银行比例y的变化率为0 ,即y不会发生变化,此时影子银行群体处于稳定状态。当0,即选择“合作”的影子能够获得超额收益,此时采取“不合作”策略的银行将会调整策略,最终选择“合作”,之后y会向趋近1,当y=1时,该群体处于进化稳定策略。当,表示,选择“合作”的影子银行不能获得超额收益,甚至所获得的收益低于平均收益,故而采取“合作”策略的银行数量会调整策略,y会向趋近0,此时是该群体复制动态下的另一个进化稳定策略。下图2给出了上述三种情况的动态变化的相位图和稳定状态。

4. 传统银行与影子银行合作的进化博弈系统复制动态分析将传统银行和影子银行两个特殊群体类型的比例变化复制动态的关系用一个坐标平面图表示,可得到下图3:

篇12

引言

在建筑市场中,业主、监理单位和施工单位是针对建筑工程项目的三大主体,业主与施工单位通过签订合同对工程进行建设,为确保施工单位与业主的利益保持一致,需要委托代表业主利益的监理单位对施工单位进行监督和控制。然而作为有限理性的经济人,各方为使自己的利益最大化,目标利益并不一致,此时有可能出现监理单位和施工单位的合谋行为。合谋行为的目的是以牺牲委托人的利益为代价来提高合谋者的效用状态,我们称子契约的形成和实施行为为共谋行为,参与子契约的人为共谋者,在建筑市场中,有着合谋行为出现的基本条件――多人、权利以及信息不对称等[1,2]。在追求个人利益的同时,监理单位和施工单位的合谋行为严重损害了业主的利益,破坏建筑市场的和谐健康发展,然而在项目实施中,业主出于自身的能力和技术水平有限,不可能时时处处对监理单位和施工单位是否合谋进行监督,否则所花费的成本太大,业主只有通过一定概率进行监督,并检查监督查处的惩罚力度,尽量减少监理单位和施工单位的合谋,以维护自身利益。本文基于建筑群体有限理性的前提下,通过建立业主与监理单位和施工单位组成的合谋体之间的进化博弈模型,分析业主及合谋体针对合谋行为的进化稳定策略,找出影响主体策略选择的因素,并探究其受初始状态影响的演化方向,进而提出相应建议。

1 基本假设

假设1构成博弈的两个局中人,局中人1是作为建设投资者或拥有者的业主,局中人2是与业主产生委托关系的施工单位和建立单位组成的合谋体,将局中人1和局中人2认为是具有有限理性的群体,“有限理性”首先意味着博弈方往往不能或不会采用完全理性条件下的最优策略,意味着博弈方之间的策略均衡往往是学习调整的结果,不是一次性选择的结果,而且即使达到了均衡也可能再次偏离[3]。分析框架要求反复在设定的两群体内部随机抽取一组要素配对进行博弈[4],为分别对两类群体进行复制动态和进化稳定策略分析,要求博弈方的学习和策略模仿需局限在所在群体内部[5];

假设2业主对监理单位和施工单位是否合谋不能确定,其需要一定的概率进行监督,业主此时的策略选择有“监督”和“不监督”两种,且以x概率选择“监督”,则选择“不监督”的概率为(1-x);业主选择“监督”,由于业主不具有相应的专业知识和技术水平,若施工单位和监理单位合谋,业主证实其合谋的概率为θ,则不能证实其合谋概率为(1-θ)[6];

假设3施工单位和监理单位组成的合谋体的策略选择也有两种,即选择“不合谋”策略和“合谋”策略,且其选择“不合谋”策略的概率为y,相应选择“合谋”策略的概率为(1-y);

假设4在施工单位和监理单位不进行合谋下,施工单位仅得到自己的正常利润,而监理单位只得到自己的相应监理费,即此时双方没有获得额外收益。在业主选择不监督时合谋体具有额外收益m,而此时工程质量会留有隐患,给业主造成一定的经济损失及信誉损失,便于计算,记为n;若业主进行监督,为了对监理单位和施工单位的合谋行为进行激励约束,证实其没有合谋行为,则对其进行奖励P,若证实其进行了合谋,不仅要收回合谋得到的额外收益m,还要对其进行相应的罚款,罚款系数k;业主进行监督也要付出相应的监督成本C。

2 局中人双方的收益向量分析

2.1 局中人1(合谋体)不合谋,局中人2(业主)监督

若合谋体选择不合谋,业主选择合谋体进行监督,由于监理单位和施工单位不存在合谋行为,此时业主需要对监理单位和施工单位进行奖励P,即此时合谋体的收益为P,而业主要付出监督成本及对合谋体的奖励成本,即此时业主的收益为(-C-P)。

2.2 局中人1(合谋体)不合谋,局中人2(业主)不监督

若合谋体选择不合谋,业主选择合谋体进行不监督,此时监理单位及施工单位仅能得到正常的利润,即此时的收益为0,而业主选择也无需付出监督费用及吉利哦费用,即此时的得益也未0.

2.3 局中人1(合谋体)合谋,局中人2(业主)监督

由于业主选择进行监督,能证实监理单位及施工单位合谋的概率为θ,则要被罚款km,若不能证实合谋,则可得收益为(m+P),故此时监理单位和施工单位选择合谋的期望收益为[(m+P)(1-θ)-kmθ];若业主能证实合谋体进行了合谋,则其可获收益为(km-C),若不能证实则其收益为(-C-P),故此时业主的期望收益为(km-C)θ+(1-θ) (-C-P)

2.4 局中人1(合谋体)合谋,局中人2(业主)不监督

若业主选择不对监理单位及施工单位的合谋行为进行监督,此时合谋体能获得额外收益m,然而会给工程带来质量或安全隐患,此时业主的收益将会为(-n)。

由以上分析,构建一个随机配对的博弈模型,可得业主与合谋体间的博弈得益矩阵,见表1。

表1合谋体与业主间的得益矩阵

业主

合谋体 监督(x) 不监督(1-x)

不合谋(y) P , -C-P 0 , 0

合谋(1-y) (m+P)(1-θ)-kmθ, (km-C)θ+(1-θ) (-C-P) m , -n

3 合谋体和业主的进化博弈分析[7-8]

3.1 业主和合谋体间的复制动态方程

根据表1,对于业主群体来讲,选择监督策略的期望收益(U1)和不监督策略的期望收益(U2)以及群

式(7)描述了业主选择监督策略的进化过程,反映了如果业主选择监督策略的得益U1优于群体的平均得益,则选择该策略的业主群体在整个种群中的比例就会上升;式(8)描述了合谋体选择不合谋策略的进化过程,反映了如果政府选择不合谋策略的得益U3优于群体的平均得益,则合谋体选择不合谋的比例也会上升。

3.2 业主的动态方程分析

令F(x)=0,得出其两个可能的稳定状态点、以及;

当y=y*时,始终等于0,即所有的x均为稳定状态;当y>y*时,和是x的两个稳定状态,且是进化稳定策略(ESS);当y

图1 业主监督进化博弈复制动态方程相图

3.3 合谋体的复制动态方程分析

同理,令F(y)=0,得出其两个可能的稳定状态点、以及.

当x=x*时,始终等于0,即所有的y均为稳定状态;当x>x*时,和是y的两个稳定状态,且是进化稳定策略(ESS);当x

3.4 业主和合谋体策略选择的初始状态分析

将上述复制动态在以两个比例为坐标的坐标平面图上表示出来,如图3所示。可以发现,没有策略点满足复制动态中的收敛性和抗干扰性,因此,此博弈中没有进化稳定的策略点。也就是说,不存在一个自发的演化趋势,使得业主和合谋体都采用某一策略,而不受突变策略的侵入。从图3中的箭头方向可以看出,在该博弈中,当初始策略在A区域时,会收敛到x*=1,y*=0,即业主群体选择监督策略,而合谋体选择合谋策略;当初始策略在B区域时,会收敛到x*=0,y*=0,即业主群体选择不监督策略,而合谋体选择合谋策略;当初始策略在C区域时,会收敛到x*=0,y*=1,即业主群体选择不监督策略,而合谋体选择不合谋策略;当初始策略在D区域时,会收敛到x*=1,y*=1,即业主群体选择监督策略,而合谋体选择不合谋策略;策略均,是临界点。

当时,由于平均盈利相等,业主对采取监督策略和不监督策略持无所谓的态度;同样,当时,合谋体对选择合谋策略还是不合谋策略也是抱着无所谓的态度。当很小时,即此时业主的监督与激励成本很大或业主对证实有合谋行为的惩罚力度很小以及合谋行为造成的损失不是很严重时,此时选择合谋策略的合谋体的比例会很大;类似的,当很小时,即此时合谋体选择合谋策略的收益很小或者约束激励措施很严重以及业主能够证实的概率很大时,此时选择不监督策略的业主的比例就会很大。

4 博弈演化结果分析

通过引入有限理性理论,构建业主与合谋体群体间的博弈模型,运用“进化稳定策略”和“复制动态”方法分析各自策略稳定条件和策略演变动态轨迹,可得如下结论:

4.1 由业主的进化稳定策略分析可知,业主群体选择监督策略监督成本、激励约束成本、惩罚系数等有关。当合谋体选择不合谋的比例y

4.2 同样,由合谋体的进化稳定策略分析可知,合谋体的策略选择受选择合谋的收益m、业主的激励约束P以及惩罚系数k等的影响。当业主选择监督的比例x

5 结语

作为具有有限理性的建筑市场的主体,分析业主以及监理单位和施工单位组成的合谋体关于监督和合谋的策略选择是很重要的。在建立的业主及监理单位与施工单位组成的合谋体的进化博弈系统中,演化方向与双方的收益及对方的策略选择有关,并受到初始状态的影响。在建筑市场中,应坚决抵制监理单位和施工单位进行合谋,进行合谋不仅损害业主的利益,为建筑工程埋下质量和安全隐患,更会破坏将建筑市场是健康和谐发展,所以应提倡业主对合谋行为做一定比例的合理的监督。减小监督成本C及激励约束成本P,加大惩罚系数k、提高监督单位的监督水平θ以及增强合谋行为带来的危害n(即应加大宣传力度,使业主清楚由合谋行为带来的危害及损失),这样就可以很大程度上减少监理单位和施工单位合谋的概率;另外,监理单位和施工单位进行合谋的策略选择还受到初始状态的影响,应适当加大业主的监督比例,使初始状态区域处于图3中的区域C和D,合谋体的稳定策略趋向于不合谋,这样就可以保证工程那个,维护业主利益,规范建筑市场。

参考文献

[1]赵文华,安立仁,席酉民.一个新的委托问题――共谋行为[J].西北大学学报(哲学社会科学版),1998,28(3):34-38

[2]郑晓薇.共谋行为在政府采购中的表现及对策分析[J]. 上海管理科学,2006(4):50-52

[3]谢识予. 有限理性条件下的进化博弈理论[J].上海财经大学学报,2001,3(5):3-9

[4]Bames Robert W. The structure and Responsibilities of the Surgical Organizations: How Do Fit into the Program Director’s Responsibilities? [J].Current Surgery, January 2, 1999, 56(1-2):87-89

[5]付继娟,聂锐. 基于有限理性的员工与组织匹配的进化博弈模型分析[J].中国管理科学,2007,15(专辑):587-590

[6]龙化良. 电力工程项目建设过程中主体合谋行为的业主监督博弈分析[J]. 科技信息,2009(25):723-724

[7]杨玉静,樊新安. 基于心理契约的房地产购销进化博弈行为分析[J].价值工程,2009(7):100-102

篇13

与主流经济学相比,演化经济学更加注重于动态因素的研究。由于超越了主流经济学完全理性和个体偏好不变得到假设,使得演化经济学方法对于不管是微观还是宏观经济行为的分析更接近于现实。近年来,使用演化经济学范式研究经济问题的文献也逐渐增多,在理论界的影响力也越来越大。对西方演化经济学思想进行梳理,对在今后的的研究中能够更加精准的使用演化经济学这一工具分析问题有促进作用。

一、演化经济学思想的起源:达尔文时代的社会进化思想

生物和演化论隐喻在社会科学中的应用已经有相当长的历史,其中以德国和英国的发展程度最高。在德语世界中,有机生物类比采取了许多种形式,跟许多种命题联结在一起,包括对有机主义本体论的描述、对个人所受社会影响的认同、对整个社会经济体系中的系统相互依赖的认识以及明确参照有机生物体成长过程的历史“阶段”理论。在对社会经济系统进行分析时,可以认为它有自己的意志和想法,而这种意志凌驾于个人意愿之上。在英国,1870―1920年间,生物学的化约主义十分常见。大家普遍相信,社会进步最终取决于人类的基因遗传。斯宾塞将社会比作一个活着的有机生物体,他认为社会知识追求各自目标的、自我约束的个人之间的相互作用,加上连接这些个人的社会安排,他强调有机生物对环境的适应过程。

社会进化思想与当今演化经济学思想相比,显然具有更大的应用范围,同时也更加抽象和概括,但思想的内核都指向了一个问题:制度是否可以设计?如果承认制度是可以设计的便承认了人类理性的超能作用,这便和主流经济学构成了同样的理性假设。显然,达尔文时代的社会进化思想同时蕴涵了主流经济学的思想内核,比如黑格尔提出的世界历史是一个确定和序列。

二、早期演化经济学思想的流派:制度经济学和奥地利学派

这里的制度经济学是区别于以科斯为代表的新制度经济学,它的代表人物为凡勃仑。演化经济学这一术语最早源于凡勃仑的著名论文《经济学为什么不是一门进化的科学》,而美国演化经济学会也是在美国制度主义发展的过程中得以建立的。凡勃仑综合了达尔文的进化论、杜威的实用主义哲学、德国历史学派和马克思的观点和方法。他从本能出发分析社会冲突和社会结构变化,将本能划分为建设性本能和破坏性本能,前者包括劳作本能、闲散的好奇心和父母之爱;后者包络竞赛、好斗和掠夺。凡勃仑的工具―礼仪、金钱―工业的划分都是在这种本能演化基础上发展起来的。他将社会知识分为工具性和礼仪性知识,工具性知识是实用的知识。他通过这两种知识背后的拥有者工人和资本家之间的抗衡论述资本主义社会和经济结构的变化,而这种结构的变化也是制度变迁的方式。凡勃仑在这种思想的基础上提出了制度主义,其出发点是制度作为社会结构的一种特定类型,不仅是一种约束,还能够潜在的改变行为者的目标或偏好。制度对个人的行为具有重建力量。同时,制度是个体在群体交往中的产物,制度不能离开个人的存在。由此可见,此时凡勃仑的制度观中已经有了朴素的博弈均衡思想的存在。另外,凡勃仑给出了制度变迁的一个范式,即本能―习俗―习惯―制度的制度变迁演变阶段,其中,习惯和本能是核心范畴,这其中既蕴含了道格拉斯诺斯的非正式制度与正式制度的思想雏形,也具备了纳尔逊和温特提到的惯例在制度变迁中的作用的思想框架。

奥地利学派在演化经济学流派中独树一帜,原因在于它的观点与新古典经济学颇为类似,但方法论确实演化性质的。奥地利学派预设经济行为人是在真实的历史领域中活动的。这意味着未来的确具有不确定性,他们需要在个人的主观领域中进行经济分析。与制度主义相比,奥地利学派更倾向于强调历史对个人决策行为的影响,因而可以因之构建经济运用所需的恰当的主观抽象概念。相应产生的交互作用的复杂性被认为将会阻碍对历史过程进行宏观经济学上的正式描述。自发秩序被看做是突发的,并内生于惯例、规范、规章、法律和其他制度中的。因此在制度分析中,奥地利学派重视对新奇、能动性、异质性、过程性这类问题。

三、演化经济学的模型化:纳尔逊和温特的演化理论

纳尔逊和温特模型化了竞争市场中产生调整过程的机制,从模型化中所得出的结果,不管是与新观点理论的中间主张和终极主张都是相容的,而非冲突,但他们对于古典理论的异议却让人信服。以产业行为分析为例,他们是以单个企业遵循的决策规则即惯例的用语进行的,产业行为被作为产业中单个企业行为的总和来分析。惯例是指企业有固定的行事方式,生产、惯例、销售、投资与研发都有一定的惯例,整个企业的运转离不开这些惯例。企业的惯例与人类的技巧有相似之处。组织是由个人构成的,组织的行为可以归结为组织成员的个人行为。理解技巧在个人发挥功能中的作用,就可以理解惯例在组织发挥功能中的作用。熟练的个人往往不假思索的采取某种行为,而且许多知识是无法言传的。企业的惯例通常是持久不变,但有时需要适应业已改变的市场情况而作修改,这需要搜寻新的知识和惯例,这就是熊彼特所说的创新过程。企业的惯例犹如生物学中的基因,在经济变迁过程中起作用。

纳尔逊和温特先后使用模型分析了以利润最大化和长期均衡为条件静态选择均衡、企业和行为对已改变的市场情况的反映、演化经济增长和竞争过程中行业结构的变化。同时,经济变迁的演化还为政策分析提供了全新的思路,即经济变迁的演化不仅通过市场机制,还通过有意识的社会政策来进行。该政策观并不等同与主流经济学中的分析思路。主流经济学认为政策是对市场失灵的补救,政策的目的是实现利益最大化。演化经济学的政策观认为政策的实现受到信息、公平要求和官僚政治的限制,政策的选择很多时候并非最优政策,即经济效益最大化的政策,而是“较好”的政策,即各种限制条件下的政策。显然,这种政策观更符合实际情况。

四、演化经济学新进展:演化博弈论制度分析

演化博弈论这一分析工具的引入为制度演化分析提供了新的分析思路,也为演化经济学的发展提供了更加丰富的内容。20世纪80年代以来,经济学家将这一分析工具用语制度分析,并取得突破性进展。其中肖特在演化理论观点考察了制度源自理性设计还是演化生成,他通过博弈论模型再现了制度的演化过程,并验证了哈耶克的“自发秩序”理论。他认为福利经济学必须研究形成社会行动博弈的规则以及有助于决定其结果的那些规则、法律和制度的比较最优性。培顿・杨认为博弈者不是完全理性且信息不完全。人们根据有限地数据进行决策,使用简单的可预测的模型,有时候还做一些无法解释甚至愚蠢的事情。经过一段时间,这种简单的适应性学习过程就能趋同于颇为复杂的均衡行为模式,并把这种思路用于社会经济制度的研究。他认为制度是由许多个体的积累性经验经过长期发展而出现,一旦他们互相作用结合成一种固定的期望与行为模式时,一种制度便产生了。同时,这一理论对该过程会遵循的演化路径以及由此产生的制度形式的多样性做出定量的预测。

青木昌彦认为博弈规则是由参与人的策略互动内生,存在于参与人的意识中,并且是可自我实施的。显然,这里的制度已经不再是简单的外在约束条件,制度主体的经济行为也不仅仅是特定制度约束下追求利益最大化的过程,而是“共有信念的自我维系系统,其实质是对博弈均衡的信息浓缩”。这种关于制度的定义拓展了传统制度的分析范围和精确度。该制度观引入了博弈论(古典博弈论、演化博弈论和主观博弈论)做为基础分析工具,博弈的主体为一固定集合的参与人,每个参与人面临一个技术上可行的行动集合。行动集合决定了每个参与人的报酬分配,而决定报酬分配结果的规则称为博弈的外生性规则。

除肖特之外,多数博弈论制度分析者都声称自己是哈耶克主义者,并把自己的博弈论关于习俗、惯例、制度的经济分析的理论任务,界定为对哈耶克思想的程序化。

五、结论

综上所述,演化经济学思想的演化特点有以下几方面:一是来源于达尔文生物学和进化社会学,其思想的涵盖范围非常广泛。二是演化经济学的研究经历了从抽象的思想研究到具体的经济现象研究的转变。三是时至今日,跨学科研究依然是演化经济学研究的鲜明特点。

参考文献

[1] 杰弗里・M・霍奇逊著,任荣华等译:演化与制度:论演化经济学与经济学的演化[M].中国人民大学出版社,2007.

[2] 理查德・R・纳尔逊,悉尼・G・温特:经济变迁的演化理论[M].商务印书馆,1997.

[3] 杨虎涛:演化经济学讲义―方法论与思想史[M].科学出版社,2011.

[4] 库尔特・多鲁弗著,锁凌燕译:经济学的演化基础[M].北京大学出版社,2011.

友情链接