第一篇:博弈论的发展及其应用
博弈论的发展及其应用
【摘要】博弈论主要是研究策略选择问题,强调的是个人理性。纳什均衡在非合作博弈理论中起着不可替代的作用,博弈不仅在日常的生活中司空见惯,而且广泛应用在经济、社会、军事等各个领域中。博弈论对人类最大的贡献就是它的哲学思维方式推动着人类思维方式不断向前发展。
关键词:博弈论 纳什均衡 应用 经济学
引言
博弈论又称对策论、竞赛论,用于分析竞争的形势。在存在利益冲突的竞争及斗争中,竞争的结果不仅依赖于某个参与者的抉择、决策和机会,而且也依赖于竞争对手或其他参与者的抉择。由于竞争结果依赖于所有局中人的抉择,每个局中人都企图预测其他人的可能抉择,以确定自己的最佳对策。博弈论是用数学方法来分析斗争形式的学科,也叫冲突分析。
一、博弈论的概述
1、博弈论的发展
博弈论又称对策论,英文名称是Game Theory,是使用严谨的数学模型研究冲突对抗条件下最优策略的问题的理论,属应用数学的一个分支。主要研究公式化了的激励结构间的相互作用和具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论经过半个多世纪的短暂发展,目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论的正式提出是由美国经济学家冯·诺依曼在1937年提出来的,他与经济学家奥斯卡·摩根斯特恩于1944年合著的《博弈论与经济行为》被公认为是博弈论诞生的标志,是关于纯粹理论的理论。到50年代,博弈论得到了巨大的发展,Tucker于1950年提出了“囚徒困境”。纳什在1950年和1951 年发表了两篇关于非合作博弈的重要文章,提出了“纳什均衡”的概念,以及证明纳什均衡存在的纳什定理,奠定了现代博弈论学科体系的基础,这个时期的博弈论研究主要集中在对静态博弈模型的研究。
50年代中后期到70年代是博弈论产生重要成果的阶段。泽尔藤将纳什均衡的概念引入了动态分析,提出了“多步政策”,“子博弈完美纳什均衡”和“颤抖均衡”的概念,并发展了倒推归纳法等分析方法。豪尔绍尼开创了不完全信息对策研究的新领地,提出了“贝叶斯纳什均衡”的概念和分析不完全信息博弈问题的标准方法,初步运用随机分析方法解决信息不完全和不对称问题。
80年代以后,博弈论开始走向成熟,理论框架逐渐完整和清晰,和其他学科之间的关系也逐渐深入,并开始受到经济学家真正的重视。1994年著名博弈论专家纳什、泽尔藤、豪尔绍尼因为在非合作博弈均衡领域的开创性贡献获得当年的诺贝尔经济学奖。2005年奥曼和谢林因为“以博弈论分析方法增进了对冲突和合作的理解”而获得诺贝尔经济学奖,这说明博弈论已得到了世界的普遍认可。
2、博弈论的分类
一是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的便主要是非合作博弈。在合作博弈中往往包含着非合作博弈。二是分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零,各种赌博就属于零和博弈。
三是分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。譬如,在投标活动中,投标人投出标书一般虽有先后,但因为所有投标人在开标前都不知道其他投标人的标价,因此可看作同时选择策略,采取行动。动态博弈则是指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。如A企业降价后,B企业也跟着降价等。四是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。
3、纳什均衡博弈
1950年和1951年纳什的两篇关于非合作博弈论的重要论文, 不仅证明了非合作博弈及均衡解, 也证明了均衡解的存在性, 这就是著名的非合作博弈论的纳什均衡。
纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。纳什均衡揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开。纳什均衡博弈论在现实中的应用也很广泛。它不仅作为一种数学理论,可以用于经济学领域,而且还可能影响着某些方面。各国对博弈论的研究,促进了人类社会文明的发展。博弈论对人类最大的贡献就是博弈论的思维方式推动了人类思维方式的发展。
二、博弈论在生活中的应用
其实,生活中也存在博弈论的身影,如我国的“田忌赛马”的故事,说的是齐威王与大将田忌各出三匹马,一对一比赛三场,由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0:3告负。后来田忌的谋士孙胺给田忌出主意,让最差的马去与齐威王最快的马比,而让最优的马去赢齐威王次优的马,让次优的马去赢齐威王最差的马,这样便以2:0,取胜。还有一个关于博弈论很经典的例子就是囚徒困境。假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。对于囚徒A而言,不管囚徒B采取何种策略,他的最优策略都是交代,囚徒B也是如此。最后两人都会选择交代。因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。
在现实生活中,很多情况正如上面两个囚徒所遇情形一样,没能真正实现自身的最佳利益,甚至是损人不利己。从“纳什均衡”的普遍意义中,我们深刻地领悟到经济、社会、国防、管理和日常生活中的博弈现象。
三、博弈论在经济管理中的应用 自从将博弈论引入经济学以后,经济学改变了传统经济分析地那种以个人孤立决策,其他经济活动者的行为影响则被典型地简化为价格信号为基础的分析方法,而侧重于经济活动中多个利益主体的行为所产生的相互作用和影响的分析,从而使经济分析更能反应经济系统的本质。
现在我们经常会遇到各种各样的商品价格大战、家用电器大战、服装大战等等。按照纳什均衡博弈论的观点,各厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都不赚钱。因为博弈双方的利润正好是零。竞争的结果是稳定的,即一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。事实上,完全竞争状态下的均衡就是“纳什均衡”。在这种状态下,每一个厂商或消费者都是按照别人已定的价格来进行决策。在这种均衡中,企业要使利润最大化,消费者要使效用最大化, 结果就导致了零利润, 也就是说价格等于边际成本。在完全竞争的情况下, 非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格, 那么社会的经济效率就会遭到破坏。
还有,假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
四、博弈论的经济学发展方向
当拿来主义不再局限于学者的书房,而开始实践于具有中国特色社会主义市场经济的博弈问题时,经济博弈论的应用必将期待着未来的重大突破,博弈论将会出现在经济学的各个前沿领域中。
博弈论进入主流经济学,反映了经济学发展的以下几个趋势:
1.经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数及其投资函数,消费最大化等,一切从个人效用函数及其约束条件开始,约束条件下的效用最大化问题而导出行为及均衡结果。这正是博弈论的范式:给出个人的支付函数及战略空间,然后看当每个人都选择其最优战略以最大化个人支付函数时将发生什么。
2.经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用(冲突与一致、竞争与合作)。特别注意到个人理性行为可能导致的集体非理性。
3.经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。在70年代,当经济学家们开始将注意力集中于研究具有理性行为、但只拥有有限信息的个体时,信息就成了许多模型的焦点——形成完全信息与不完全信息博弈论。当个体行为受到重视之后,他们采取行动的时间顺序也开始被明确的结合了起来——形成由静态到动态的博弈论。
五、结束语
综上所述,博弈论对人类贡献很大,在现实中应用也很多,应用于社会的各个领域。博弈论凭借自身的理论优势及其独特的思维方式,已经发展为经济学的前沿知识。博弈论代表着一种全新的分析方法和全新的思想。相信在以后的时间里,博弈论将在社会发展的过程中起着更为巨大的作用,博弈论的发展会迈上一个新的台阶,对企业与经济的发展做出更大的贡献。
参考文献
【1】 张维迎著,《博弈论与信息经济学》上海人民出版社,2005年 【2】 王金炳.博弈论的发展历史和基本内容[J].时代贸易,2007,5.【3】 米立梅.浅谈博弈论在企业管理中的应用[J].经济论坛,2009,18.【4】 奥斯本#鲁宾斯坦.博弈论教程[M].北京:中国社会科学出版社.【5】 马辉.博弈论的发展及其在现实中的应用[J].中国校外教育·理论,2008.【6】 王金炳.博弈论的发展历史和基本内容[J].时代贸易,2007,5.
第二篇:浅谈博弈论的应用
运筹学课程论文
浅谈博弈论的应用
摘 要:博弈论又称对策论,是使用严谨的数学模型研究现实世界冲突对抗条件下最优决策问题的理论。博弈论应用广泛,目前已经深入到经济学、政治学、社会学和军事及人工智能等各个领域,被各门社会科学所应用。纳什均衡是博弈论的核心概念,它是博弈的一般均衡结果,是关于局中人最优策略的一致性预测。然而纳什均衡的多重性使得有些博弈存在多个一致性预测,博弈局中人仍然面临选择哪个均衡的不确定性问题,这限制了博弈论的应用和作用效果。
Game theory is also called countermeasure theory,and it focuses on the best decision-making at the condition of confliction of the real world with religious mathematics model.Game theory has a wide application,and it has penetrated into economics,politics,sociology,military and artificial intelligence.It is applied into nearly every study field.Nash equilibrium is the core conception of game theory.It is the general equilibrium of game result and it is the consistency prediction of the players’ best decision.But the multi—equilibriums cause the multi—consistency prediction,and lead the players into an uncertainty of Nash equilibrium selection. 关键词:博弈论 纳什均衡 应用 引言
博弈论又称对策论,是使用严谨的数学模型研究现实世界冲突对抗条件下最优决策问题的理论。两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽。随着时代的发展,博弈论在我们现实生活中的应用越来越广泛。博弈论与纳什均衡
从古到今,人类活动中一直广泛存在着凭借策略决以胜负的竞争性现象,例如,在我们日常生活中,下棋、打牌、球赛等各种体育竞赛和游戏;经济领域内的广告与销售活动、贸易谈判、生产管理;政党之问的政治斗争;国家之间的外交谈判以及战争等。这些现象都是冲突各方处于一种竞争或对抗中,并且由于参加的各方在竞争中采取不同策略而得到不同的结果。在这些具有竞争或对抗性质的行为中,参加的各方各自具有不同的利益和目标。为了达到各自的目标和利益,各方必须考虑对手的各种可能的方案,并力图选取对自己最为有利或最为合理的方案。研究这种竞争性现象的各方是否存在最合理的行为方案,以及如何找到这
运筹学课程论文
个合理的行动方案所形成的一门新的理论——博弈论。博弈论的出现给现实世界中合作对抗问题的解决提供了一种崭新的思路,带来了最优决策问题研究的新高潮。博弈论在各个领域的应用都取得了巨大的成就。
纳什均衡是博弈论的核心概念,它是指,在其他局中人的策略选择既定的前提下,每个局中人都会选择自己的最优策略,所有局中人的最优策略组合就是纳什均衡。它意味着,在给定别人策略的情况下,每个局中人都不能通过改变自己的策略得到更大的效用或收益,从而没有任何人有积极性打破这个均衡。换一种说法就是,其中每个局中人选择的策略是对其他局中人所选策略的最佳反应。博弈论的应用及其分析
博弈论被称为“社会科学的数学”,从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而从实际上讲,它正深入到经济学、政治学、社会学和军事及人工智能等领域,被各门社会科学所应用。就我们所知道的博弈论的运用包括“囚徒困境”博弈、“价格问题”博弈、“贸易交易”博弈、“企业环境污染”博弈等,其中广为人知的当属“囚徒困境”博弈。
3.1 “囚徒困境”博弈
囚徒困境讲的是两个犯罪嫌疑人作案后被警察抓住,分别关在不同的房子里审讯。警察告诉他们,如果两人都坦白,各判刑3年;如果两人都抵赖(或因证据不足),各判1年;如果一人坦白,一人抵赖,坦白的获释,抵赖的判刑5年。可见,对两个犯罪嫌疑人整体而言,(抵赖,抵赖)是两个犯罪嫌疑人最佳的策略组合,但在两犯罪嫌疑人被抓后分别关押且彼此不知道对方会采取什么策略时,每个犯罪嫌疑人就会在警察所给的策略下选择自己的最优策略“坦白”,于是“囚徒困境”中的纳什均衡解正好是策略组合(坦白,坦白),警察最终达到了预定的目的。
囚徒困境这个简单的博弈模型之所以经典,在于它颠覆了“个人理性的选择会自然而然的达到集体理性”这个结论,从而为主流经济学的建立打下了现实的基础。求解囚徒困境博弈的困难在于个人激励与群体目标并不一致,因而,要求参与人把个人目标放在第二位,而把集体目标放在第一位。当然个体理性与集体理性的矛盾,有时对参与人而言是坏事,对集体而言却可能是好事,两个犯罪嫌疑人由于都“坦白”受到更严厉的惩罚,至少在关押期间不会再去犯罪,这对整个社会无疑是件好事。“囚徒困境”博弈正巧验证了一句话:个人利益必须服从整体利益,当两者相矛盾时,必须首先考虑集体利益。
此外,纳什均衡是一个“僵局”,当别人不动时,自己也没有动的积极性。当博弈只有唯一的纳什均衡时,这个纳什均衡会实际上发生,且参与人会在没有
运筹学课程论文
任何压力时,自觉自愿的遵守它,这给了我们一个很大的启示,在设计规章制度时,应尽量达到纳什均衡,这样每个人都会做到自觉自愿地遵守它。
3.2 “价格问题”博弈
每逢节假日,我们经常会遇到各种各样的价格战,特别是大型商品的促销。厂家价格大战的结局是一个“纳什均衡”,结果是谁都没钱赚。因为博弈双方的利润正好是零,竞争的结果是稳定的,达到了一个“纳什均衡"。这个结果可能对消费者是有利的,但对厂商而言是灾难性的,它无疑是种自杀。
对于企业而言,若是降价销售,可能导致一个有效率的零利润结局。若不采取价格战,则必须考虑两种选择:采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所造成的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。由此可以看出,每个企业的战略都是建立在假定对手会按其最佳利益行动的基础上。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。
在这种均衡中,每一企业要使利润最大化,消费者要达到效用最大化,结果就导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。
3.3 “贸易交易”博弈
随着经济全球化的发展,每个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战而受到损害。X国试图对Y国进行进口贸易限制,比如反倾销,则Y国必然会进行反击,也对X国进行反倾销,结果谁也没有捞到好处。反之,若X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少限制,结果大家都能从贸易自由中获得最大利益,而且全球贸易的总收益也会增加。
3.4 “企业环境污染”博弈
假如企业周围的环境受到污染,而政府并未管制,那么企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从集体利益出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争
运筹学课程论文
机制”失败的例证。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将会更好。
除此之外,像法律、规则制定者可以利用博弈论制定出所有人都能自觉遵守的法律、规则和章程;企业可以利用博弈分析产量与价格的关系,建立博弈模型分析企业之间的竞争和合作,以获得最大的经济利益;在日常生活中,我们也会遇到各种形式的博弈,例如挤公交车等。个人心得
通过上面几个博弈事例我们可以看到,博弈论在我们现实生活中的应用极其广泛。虽然取得了辉煌的成就,但是博弈论本身仍存在一些问题,这些问题限制了博弈论更广泛的应用,也是博弈论未来的发展和完善方向。
在我看来,博弈论对信息的处理是理想化的,这在实际应用中存在严重缺陷。纳什均衡的多重性使得有些博弈存在多个一致性预测,博弈局中人仍然面临选择哪个均衡的不确定性问题,这限制了博弈论的应用和作用效果。运用博弈论时,我们还应充分考虑特征、境域的影响,以便对纳什均衡作出更深层次的分析。结论
博弈论的应用极其广泛。博弈理论已经渗透到我们社会的方方面面,小到生活的日常琐事,大到国际间的经济贸易和军事竞备。这些都使得博弈论的应用范围和作用效果越来越大。
参 考 文 献
[1] 张维迎.博弈论和信息经济学.上海:三联书社,1996.
[2] 向楠.网络安全投资与博弈策略研究.北京:北京邮电大学,2008. [3] 尚宇红.博弈论简史.西安:西北大学,2003.
[4] 侯定丕.博弈论导论.合肥:中国科学技术大学出版社,2003. [5] 谢政.对策论.长沙:国防科技大学出版社,2004.
[6] 张长青.纳什均衡的效率及选择.黑龙江大学学报,2007.24(6):1-4.
第三篇:博弈论的发展历程
博弈论的发展历程(下)(ZZ)
信息问题上的突破。古典经济模型几乎无一例外地假设,个人(或厂商)的资源与偏好情况不仅为自己,也为他们的竞争对手所知,即完全信息假设。这显然不符合实际。不过,这并非模型建立者本身所希望的,而只是因为缺乏解决不完全信息问题的工具而不得不做出的简化。博弈论的发展也遇到同样问题。由于对不完全信息问题一度苦无良策,博弈论曾受到严厉批评。因为局中人事实上不可能清楚关于对手决策的所有信息。由此导致博弈理论建模的应用范围也受到了限制。豪尔绍尼对这一问题的解决方法是将不完全信息建模为自然完成的一种抽彩。这种抽彩决定局中人的特征。而这些特征是局中人偏好与经验的总和,其中,每个局中人清楚自己的特征,但不知道别人的真实特征。即他对整个博弈局势只有不完全信息。据其特征,局中人可分为一些类型。每个局中人知道自己的类型,不知道别人的类型,但知道类型上的联合分布,从而能对其它局人的类型作出先验分布判断。不完全信息的这种博弈局势把实际中千变万化的不完全信息都№归结为局中人对他人的主观判断。这种方法成功地将不易建模的不完全信息转化为数学上可处理的不完善信息:即局中人根据经验与知识对对手的类型得出关于可能性大小的主观判断,即数学上的一种先验分布。不完全信息博弈的解是由纳什均衡概念推广而来的。其均衡点(贝叶斯均衡点)是一个n重策略,每个局中人每种类型的个人策略均是对其它局中人的(n-1)重策略的那种类型的最佳应对。以类型为基础的不完全信息博弈是豪尔绍尼(1967~1968年)提出的。他运用这种方法来克服将局中人的信息与偏好以及他对其它局中人信息与偏好的了解进行建模时所遇到的复杂性。这一思路极富创造性,使不完全信息博弈成为解决经济问题的一个有力工具。其次是关于混合战略的解释。混合战略概念的传统解释是,局中人应用一种随机方法来决定所选择的纯战略。这种解释在理论与实际上均不能令人满意。豪尔绍尼对此提出杰出的解释方法。他说明在每一真实的博弈形势中,总受一些微小的随机波动因素影响。在一标准型博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一策略均对应一个。这些随机变量的具体取值仅为相关局中人所知,这种知识即成为私有信息;而联合分布则是博弈者的共有信息。这称为变动收益博弈。变动收益博弈适用豪尔绍尼的不完全信息博弈理论,各随机变量的一种取值类型影响着一个博弈者的收益。在适当的技术条件下,变动收益博弈所形成的纯策略组合与对应无随机影响的标准型博弈的混合战略组合恰好一致。豪尔绍尼证明,当随机变量趋于零时,变动收益博弈的纯战略均衡点转化为对应无随机影响的标准型博弈的混合战略均衡点。豪尔绍尼的变动收益博弈理论提供了对混合战略均衡点具有说服力的解释。局中人只是表面上以混合战略博弈,实际上,他们是在各种略为不同的博弈情形中以纯战略博弈。这种重新解释是一个具有重大意义的概念创新,是豪尔绍尼对博弈论所采用的贝叶斯研究方法的一块基石。再次就是关于合作博弈的通解。豪尔绍尼关于博弈论的第一篇论文(1956)把纳什的合作理论与Zeuthen的议价模型结合,这是他建立n人合作博弈的通用议价模型(1959,1965)的第一步。绝大多数合作解概念基于具有或不具有旁支付(side payment)的特征方程型博弈。而他的通用议价模型是第一个适用于标准型博弈问题的几人合作理论。通过对均衡时效用权重与联盟对局中人分红具有独创性的构造,他成功地定义了一种议价解法,与非合作博弈的一种均衡点非常相似。直至现在,他的几人议价模型仍是合作博弈理论中最为重要的理论之一。最后是关于对合作的非合作形式建模。现在一种观点已被广泛接受,即有关一种博弈形势的充分详细的模型必为一个非合作博弈理论。而在1960年代以前,一般观点认为,合作理论比非合作理论更为重要。豪尔绍尼是促使产生这种观念变迁的博弈论研究者之一。他首先认识到合作机会以非合作博弈形式建模的必要性。由此观点,合作理论可视为一个简化形式,需要建立具有更多细节的非合作模型。以这种思路,豪尔绍尼(1974)为特征方程型博弈中一个重要的合作理论——冯•诺伊曼——摩根斯顿稳定集——进行了创造性的非合作形式重建。豪尔绍尼的议价模型中为一个具有可转移效用的零和特征方程型博弈设计了一个收益向量序列,以其序列递推过程描述联盟的选择过程。其理论利用非直接优势概念形成了修正的稳定集概念。豪尔绍尼对稳定集概念的非合作重建为考察联盟形成的非合作模型构造提供了方法上的突破。对不可置信威胁的研究引出了博弈论中一个很重要的概念,即承诺行动。承诺行动是博弈中的主体使自己的威胁战略变得可置信的行动。一种威胁是否可以置信,取决于当事人在不施行这种威胁时是否会遭受更大的损失。承诺行动意味着当事人要为自己的失信付出成本,尽管这种成本并不一定真的发生,但承诺行动给当事人带来很大的好
处,因为它会改变均衡结果。
随着现代经济的迅猛发展,博弈论日益为人们所认识,并应用于经济现象的分析与研究中。博弈论已成为博大精深的体系,广泛应用于经济学、政治学、军事决策、计算机科学、生物演化等研究。同时与数学、心理学、统计学以及认识论、伦理学等学科有重要联系。它与各学科之间相互影响、相互促进,一方面借鉴其它学科的思想成果,另一方面也促进了其它学科的发展。博弈论与经济学的关系尤为密切,其最直接的应用领域是在契约、合作及各种公共产品等领域,博弈论的影响广及市场理论、契约与合同、政府行为等诸多方面,为研究各
种经济现象开辟了全新视野。
博弈论思想也对经济学家的思维方式产生了深刻影响。人们越来越认识到,大多数经济问题可以作为博弈过程来分析。克雷普斯指出,仅就在经济学上的应用而言,博弈论的主旨是帮助经济学家理解和预测在经济环境中已经发生与将要发生的事情。博弈论工具的应用的确加深了对经济现象的理解。近年来,许多学者尝试运用博弈论研究微观和宏观经济理论问题,甚至想通过这条途径重新建构理论框架。这一趋势已逐渐深入到每一个经济学及相关的领域。博弈论的传统应用领域是产业组织或市场结构的研究以及对投票和公共物品供给的分析等。诸如重复囚犯困境、交错出价的议价模型、时间选择博弈和先买权博弈,都在产业组织理论分析中得到应用。而豪尔绍尼的贝叶斯纳什均衡解,作为许多博弈推理分析的基石,则应用于机制设计问题。其中包括非线性价格歧视、最佳拍卖、对公共物品偏好的显示以及信息不完备情况下的契约失效等。在对掠夺行为和就业市场信号的分析中所应用的一系列解的概念——完全贝叶斯均衡解、克雷普斯和威尔森序列均衡解、泽尔滕颤抖手完美点均衡解,体现着经扩展的不完全信息博弈中子博弈完美点的思想。近年来,博弈论被应用到对不同拍卖行为的分析、委托人——代理人的关系及激励机制问题,以及公共财政学领域等。我国学者近年来对博弈论在经济研究中的应用进行了有益尝试。如对经济调整中的社会博弈问题的研究、对中央政府与地方政府的博弈关系和规则的探讨等。博弈论作为一种有力的分析手段,在经济学中有着广泛的应用前景。博弈、合作与经济制度紧密相联,诺斯则认为对经济制度的研究实质上就是对合作的机制的研究。我们认为,近年来经济学的一系列突出成就和最新进展越来越集中地表现出人们对经济行为主体认识的深化。作为洞察主体行为规律和分析经济现象背后机制形成的认识工具,博弈论在研究变革社会的秩序演进与制度创新方面应用潜力巨大。
博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理
论指导,具有重要意义。
经济学在为现实经济提供理论指导的同时其自身也要不断发展,凯恩斯以后的西方经济学,在战后已发展起了一个新的体系,即以研究资本主义经济运行为对象的宏观经济学和微观经济学。在改革前,我国的经济研究原是以生产关系为研究对象的政治经济学,主要探讨社会主义经济制度不断完善的途径,并不研究经济运行的过程,在当时计划经济体制下人们对经济活动的关心也主要局限在对政府行为的理解和落实上,而忽视对企业和个人行为的分析、更不考虑各经济主体之间的相互影响和相互对立,忽视经济主体在资源配置问题上的矛盾和博弈。我国在确立社会主义市场经济目标以后,重塑经济主体、转变经济主体的职能、增强各经济主体的活力,是重要的任务。博弈论分析我国转型时期宏微观经济运行的重要工具,因为在我国社会主义市场经济中,经济主体存在着信息的不完全、信息不对称等现实情况,人(政府、企业中的决策者及社会个人)都有自己的效用函数,对信息的加工能力也是有限的,各经济主体之间的选择存在着许多相互依
赖关系。
博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理
论指导,具有重要意义。
我国市场经济经济运行中,政府制定什么政策会收到什么效果,可以通过构建博弈模型进行研究,考虑博弈中各主体的效用函数等,研究不同博弈规则下的均衡。在转型时期政府的许多政策并不能采取指令性规定强制实施,只能依靠宏观调控的手段进行,因此,政府在制定政策时必须考虑政策实施的效果,要研究博弈主体决策行为的相互依赖和相互影响,考虑经济主体的预期以及所获信息对博弈均衡的制约和影响。个人的各项经济决策,要考虑到社会经济活动中其他相关主体的影响。企业作为生产者,目标是利润极大。从这个目标出发,它对投入、产出的种类和数量进行选择,对自己的收入转化为积累与个人的收入分配比例进行选择,这个过程是一个重大的博弈决策过程。经济体制改革改变了政府控制整个经济活动的局面,企业和个人在经济活动中的独立性与能动性日益增强,研究各经济主体在经济活动中的博弈和均衡是研究经济运行机制和规律的重要内容,而专门研究相互依赖、相互影响的理性决策行为的博弈论方法,为政府利用经济理论分析政策问题提供了一种有效的手段。信息经济学是不对称信息博弈论在经济学上的应用,即研究在给定信息结构的条件下,进行最优的契约安排。我国经济转型时期的许多工作需要信息经济学的理论。信息经济学中信息的不对称包括不对称发生的时间和不对称信息的内容。从不对称发生的时间看,债转股的不对称可能发生在相关利益者签约之前,也可能发生在签约之后,分别称事前不对称和事后不对称。研究事前不对称信息博弈的模型称为逆向选择模型,研究事后不对称的模型称为道德风险模型。在信息经济学中,将博弈中拥有私人信息的参与人称为代理人,不拥有私人信息的参与人称为委托人。信息经济学的所有模型都可以在委托人一代理人的框架下分析。债转股政府、资产管理公司和债转股国有企业之间的关系就存在特殊的值得深入探讨的委托代理关系。博弈论理论的成熟,极大地促进了委托代理理论的发展,委托代理理论可以模型化如下一类的问题:委托人(如政府)想使代理人(如债转股国有企业的经营者)按照前者的利益选择行动(如使股权回购和国有资产保值增值),但委托人不能直接观测到代理人选择了什么行动,能观测到的只是另一些变量(如企业效益、产品的市场占有率等),这些变量由代理人的行动和其他的外生的随机因素共同决定,因而充其量只是代理人行动的不完全信息。委托人的问题是如何根据这些观测到的信息来奖惩代理人,以激励其选择对委托人最有利的行动。委托人在签约时要使自己期望效用极大化,而此时会面临来自代理人的两个约束:一个是参与约束,即代理人从接受合同中得到的期望效用不能小于不接受合同时能得到的最大期望效用;另一个是代理人的激励相容约束,即代理人总是选择使自己的期望效用最大化的行动,如果委托人希望的行动正好能使代理人的期望效用最大,那么代理人就会选择它。
第四篇:博弈论发展简述
博弈论发展简述
博弈论,又称为对策论,英文名称为Game Theory,是研究主体行为发生直接相互作用时的决策以及这种决策的均衡问题的理论。Game一词在英文中的基本意思时游戏、比赛,故而在博弈论刚被介绍到中国时,有的学者根据其英文名称,直译其为游戏理论。博弈的“博”字是竞争的意思,“弈”是对弈,是一种关于在竞争中选择策略,争取最好结果的技艺。
其实,博弈论是用严谨的数学模型来研究现实世界中冲突对抗条件下最优决策问题的理论,最初发源于数学。自20世纪40年代,博弈论从数学家之手产生之后,就很快被借用到经济学领域,并在几代经济学大师的研究和推动之下,广泛应用于经济学、社会科学、管理科学、国际政治、生态学工商业活动以及人们的日常的生活之中。
博弈论的创始者是匈牙利的天才数学家冯·诺依曼(1903~1957),他不仅是经济博弈论的创立者,同时也是计算机的发明者。20世纪初,冯·诺依曼、塞梅鲁(Zemelo)、鲍罗(Borel)就开始研究博弈的准确的数学表达。1939年,冯·诺依曼和经济学家奥斯卡·摩根斯坦(Oskar Morgenstem)合作,从而使博弈论进入经济学的广阔领域。1944年,二人共同出版了著作《博弈论与经济行为》,书中介绍了博弈的理论和方法,提出了标准型、扩展性和合作型博弈模型解的概念和分析方法,从而奠定了博弈学科的利率基础,标志着现代系统的博弈理论初步形成,也象征着博弈学科的正式建立。20世纪50年代,合作型博弈的研究和应用达到顶峰。但是,诺依曼的博弈论的局限性在于,由于过于抽象,大大限制了它的应用范围,在相当一段时间里,人们对博弈论的研究很少,只是少数数学家的专利,影响力有限。
正在此时,另一位博弈论大师纳什(Nash)博士于1950年11月在美国全国科学院的每月公报上刊登了两篇论文,将冯·诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,其理论比冯·诺依曼的合作博弈论更能反映现实的情况。非合作博弈思想,即“纳什均衡”理论的提出,标志这博弈理论新时代的开始。作为一位天才人物,纳什从上大学开始就从事纯数学的博弈论研究。后来,他在经济博弈论领域做出了划时代的贡献。他提出的纳什均衡的概念在非合作博弈理论中起着核心的作用,其后续的研究者对博弈论的贡献,几乎都是建立在这一概念之上的。由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
自20世纪50年代以来,由于纳什、泽尔腾(Selten)、海萨尼(Harsanyi)等人的努力,使博弈理论逐渐成熟并进入实用。尤其在经济学领域,博弈论引发了经济学的“博弈论革命”。博弈论的概念和方法改造了经济学的思维,也从而推进了经济学的研究。1994年诺贝尔经济学奖授予纳什、泽尔腾和海萨尼3位博弈论专家,有力地证明了博弈论在现代经济学研究中的地位,也进一步激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已经成为占据主流地位的基本分析工具。
博弈论在20世纪40年代产生时,最初是运筹学的一个分支,是较纯粹的数学方法,但是由于其理论的普遍性,被逐步推广应用到许多研究领域,尤其是在经济学领域,博弈论改变了经济学家的思维方式,至今引领着该领域的前沿。同时,对博弈论的研究也就方兴未艾,各种博弈理论分支更是层出不穷,演化博弈论就是一个时期以来在原有的理论基础上发展起来的博弈论家族中的热门和新兴分支。
博弈论的组成要素
博弈论由3个基本要素组成:一是决策主体(player),又可译为参与人、局中人或博弈方。指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可以成为一个博弈方,形成决策主体;二是给定的策略空间(strategy space),就是信息结构,又叫策略集,指参与人可选择的策略和行动空间,是可选择策略的集合。每一个策略都对应一个相应的结果,因此每个博弈方可选择的策略数量越多,博弈就越复杂;三是效用(Utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。上述参与人、策略空间和效用3个要素就构成了一个基本的博弈。
博弈理论认为,一个完整的博弈应当包括一下五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后顺序;第五,博弈方的收益,即博弈方做出决策选择后的所得所失。
常见的博弈类型
通过博弈论学者们的研究归纳,通俗地讲,常见的博弈类型有以下几种:第一种是合作博弈和非合作博弈。二者的主要区别在于参与者之间的博弈行为相互作用时,他们能否达成一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。合作博弈强调的是团体理性、效率、公正和诚信,非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的;第二种是重复博弈和非重复博弈。非重复博弈就是博弈的双方博弈之后各自走人,从此不会再来博弈。重复博弈则具有连续性的特点,同一博弈可以重复下去。非重复博弈由于是一次性的,所以容易出现欺诈等道德问题,而重复博弈由于是连续性的,所以道德和规则的约束力较强,参与者不仅要追求一次博弈的目标最大化,而且要追求多次博弈平均目标的最大化,这就会迫使参与者高度重视信誉,并由对抗走向合作;第三种是零和博弈和非零和博弈。零和博弈的特点是博弈双方的成本和所得会相互换位,也即:你的所失正是我的所得,反之一样。不具有这样特征的博弈就是非零和博弈。第四种是静态博弈和动态博弈。参与双方同时决策或同时行动的,叫静态博弈,决策或行动有先后顺序的叫动态博弈。显然,有没有先后顺序,博弈结果和采取的策略是不同的;第五种是完全信息博弈和不完全信息博弈。信息就是知识,但不是一般的知识,是指与决策目标和决策对象有关的特定信息,是参与人有关博弈的知识。按博弈双方拥有的程度分为:①完全信息:博弈双发对产生博弈的事情的知识都是共同知识;②对称信息:博弈双方有关信息的掌握程度是相等的;③不对称信息:博弈双方对实现某一个目标所掌握的信息及采取的策略掌握程度不同,信息在双方之间的分布是不均匀、不对称的。
博弈论的经典模型:囚徒困境
囚徒困境(Prisoner’s Dilemma)。“囚徒困境”至今仍然是博弈研究的重要课题。这个故事是说,两个罪犯犯罪后被抓,分别关押,不能见面,警察审问时分别对他们说,坦白吧,坦白你会被放走,你不坦白另一个人坦白了,你将被判10年。实际上两个囚徒面临的情况是:一个坦白,另一个不坦白,坦白的将被释放,不坦白的会判10年;如果两个人都坦白,各判5年;两个人都不坦白,都放。根据理性人的假设,甲乙两个罪犯都会寻找自己最优目标,那就是自己被释放。如果两个人都不坦白,都会被释放,但甲会想:如果我不坦白,乙坦白了,他会被释放,我要判10年。我坦白了,不管乙是否坦白,我最多判5年,也有可能乙不坦白,我被释放。罪犯乙其实也是这么想。结果他们都坦白了,分别判了5年。在坦白这一点上形成策略均衡,实现了目标最大化。实际上囚徒困境这个模型揭示了合作与竞争(或叫对抗)的关系道理。囚徒困境的情况在生活中最常见的就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤。其中的纳什均衡就是大家都挤,结果上车更慢了,每个人采取的都是最优战略,但是结果却是最劣,原因在于个人理性和集体理性之间存在着冲突。
博弈论的经典模型:智猪博弈
智猪博弈(Boxed Pigs)。有两头猪生活在同一猪舍里,一头大猪,一头小猪,共用一个长食槽。食槽的一头有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假定按一下会掉下10个包子,而跑去按开关的猪会耗费两个包子的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪会吃掉9各包子,小猪只能吃到1个;如果大猪先按开关,按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个。如果不去按开关,就会被一起饿死。这个模型的最优策略组合只有一个答案:在任何情况下,都要大猪按开关,小猪等待。因为这样,大猪会吃到6个包子,减掉耗费掉的2个,剩4个,与小猪一样。但让小猪按开关,它只能吃到1个包子,减掉耗费的2个,亏1个。智慧型的猪不会干赔本的买卖。但如果大猪也不动,只能双双饿死。这个模型也解释了在博弈过程中,多劳者不一定多得。
博弈论的经典模型:情侣博弈
情侣博弈。假定一对热恋中的情侣,每周末见一次,必须见,否则活不下去。男的喜欢看足球,女的喜欢看电影。见面后,面临选择,看足球还是看电影?热恋中的情侣因为爱,会牺牲自己的爱好去满足对方。如果去看足球,男的满足程度为四个单位,女的满足程度是两个单位;去看电影,女的满足程度是四个单位,男的满足程度是两个单位。在这个博弈中,有三个变量非常重要。一个变量是顺序,就是谁先提出来,比如男的先提出来,女方尽管更愿意看电影,但是男方已经提出来了,她不愿意违背他,只好同意,结果他们就去看足球。相反的情况也是一样。第二个是一次博弈还是多次博弈。如果是多次博弈,双方就会大体上形成一种默契,这一周看电影,下一周看足球。第三个取决于感情的深度。处于依赖程度比较高的一方,对对方更加顺从照顾一些。一般而言,情侣之间的博弈是一个动态过程,因为恋爱就是双方之间较长时期的磨合、了解过程。如果我们假定情侣博弈是一个动态博弈,而且总是男的先决策,女的后决策,那么就会出现一种非常有趣的决策情景。就女方来说,无论男的是选择足球,还是选择电影,她的决策均为四个:一个是追随决策,就是男的选择什么,她就选择什么;二是对抗策略,就是男的选择什么,她偏不选什么;三是偏好策略,就是无论男的选什么,她都选电影,因为这是她的偏好;四是成全策略,就是无论男的选什么,她都选足球,因为足球是男的偏好,她宁可牺牲自己的偏好,而成全男方。情侣博弈在现实生活中到处存在,它让人们思考如何人去关心别人、理解别人,处理好人际关系。
博弈论的经典模型:斗鸡模型
斗鸡博弈(Chicken Game).在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失败。现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰上了。这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。第二种是,双方都退下来,双方也都是丢面子,但是都掉不到水里去。第三种结果,甲方退下来,丢面子,乙过去。第四种结果,乙退下来,丢面子,甲顺利通过。在这四种结果中,第一种是两败俱伤;
三、四两种是一胜一败,第二种是两败不伤,这就是斗鸡博弈。在这个模型中,最优策略有两个,就是第三、第四两种选择,即甲退下来乙先过去,或者乙退下来甲先过去。因为两种选择对整个社会来说效益最大,损失最小。两虎相争勇者胜,如何处理竞争中的两虎关系呢?一般有四种办法:第一种是谈判,双方约定一个条件,其中一个先退下来;第二种是制度,建立一种制度,规定从南到北的先退,或者从北到南的先退,或者后上桥者先退;第三种是时间,双方僵持一段时间,谁先吃不住劲谁先退;第四种是妥协,妥协不一定是最优策略,但是至少可以保证取得次优结果。在工作生活中乃至处理国际关系时,得饶人处且饶人,退一步还扩天空,都是从斗鸡博弈可以总结出的道理。
博弈论的经典模型:威慑模型
威慑博弈的完整名称是进入威慑博弈,是研究参与者想进入某领域,而与该领域已有竞争者的博弈模型。假定有两个参与人,一个想进入某行业,称之为进入者,另一个已在同一行业占有一席之地,称之为先入者。对进入者来说,不管先入者是否设置壁垒,其最优目标都是进入。而对先入者来说,要设置壁垒,必须付出巨大成本,否则不如默许。进入威慑博弈模型的启示是:要做一件事情,必须确定一个可行的目标,不怕困难,全力以赴向目标努力,目标就会实现。另外,不是所有的威慑都没有用处,付出巨大成本的威慑是起作用的,而要想使威慑起作用的,必须付出巨大成本。同时,进入威慑博弈也提出了一个问题,就是威胁和承诺的可信度问题,威胁实际上也是一种承诺。威胁和承诺是否可行,取决于其成本的大小,取决于其成本和收益的比较。一般而言,成本巨大的,或者成本高于收益的威胁和承诺,可信度就比较高,反之则低。实际生活中有些制度见效甚微,就是因为惩罚力度太小,使得违规者的违规收益高于违规成本。
第五篇:博弈论的发展历程.
博弈论的发展历程
虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈。这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。
1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。
接下来的一段时期对合作博弈的研究有了长足进步。按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。如意愿表示不可强制执行,则为非合作博弈。非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。事实上,合作博弈可视为非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。为了解决合作博弈中所遇到的问题,这一期间提出了联盟博弈、稳定集、解概念、可转移效用、核心等重要概念与思想。1950年代是博弈论的成长期,纳什为非合作博弈的一般理论奠定了基础,提出了博弈论中最为重要的概念——纳什均衡,开辟了一个全新的研究领域。非合作理论发展起来,如阿尔·塔克的囚徒困境、重复博弈概念等。合作博弈理论在这个阶段得到进一步发展,如沙普利值概念、核概念等。博弈论的研究队伍开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为博弈论的研究中心。此经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论的成熟期。不完全信息与非转移效用联盟博弈那样的扩充使理论变得更具广泛应用性。常识性的基本概念得到了系统阐述与澄清。博弈论成了完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重
要解概念之间的对应关系。豪尔绍尼与泽尔滕正是在这一时期开始他们的工作,豪尔绍尼提出了不完全信息理论,泽尔滕开始其均衡选择问题的研究。1970年代至今是博弈论的丰富壮大期。博弈论在所有研究领域都得到重大突破。博弈论开始对其它学科的研究产生强有力的影响,计算机技术的飞速发展使得研究复杂与涉及大规模计算的博弈模型发展起来。在理论上,博弈论从基本概念到理论推演均形成了一个完整与内容丰富的体系。在应用上,政治与经济模型有了深入研究,非合作博弈理论应用到大批特殊的经济模型。同时博弈论应用到生物学、计算机科学、道德哲学等领域,如随机策略这样的概念得到了重新解释。渐渐地,博弈论变得大众化起来。不再是仅为少数研究者所知。要对每年所发表的有关博弈论数以千计的文献进行了解已不是件容易的事。至今,博弈论仍在不断发展与深化,预测其可能出现的创新与成就是很困难的。
在博弈论的发展过程中,纳什奠定了非合作博弈的理论框架与概念基础,他的名字与博弈论的中心概念——纳什均衡联在一起;豪尔绍尼与泽尔滕则致力于博弈论的进一步发展与应用。
在非合作博弈论和经济分析里所应用的博弈论思想中,纳什均衡都处于核心地位。克雷普斯(D.Kreps)教授认为,如今在每一个经济学领域及与其相关的金融、会计、市场学甚至政治学等领域,在消化其近期研究成果过程中,对纳什均衡概念的理解均起着重要作用。虽然作为先驱者的古诺(Cournot)已在其研究中开创这一思想的先河,但其目前的形式则是纳什独立完成得出的卓越成就。美国普林斯顿大学的数学家和统计学家纳什。从1950年至1954年,他发表了多篇论述博弈论的文章,为非合作的一般理论和合作博弈的谈判理论奠定了基础。他规定了非合作博弈的形式,并定义了著名的“纳什均衡点”。纳什最先对合作与非合作进行了区别。纳什认为以前的理论包含着某种被称为合作类型的n人博弈思想,它以一种对能由局中人形成的不同合作之间相互关系的分析为基础;与此相反,纳什认为他自己的理论则“以缺乏合作为基础,在其中假定每个参与者都各行其是,与其他人之间没有合作与沟通”。该思想拓展了博弈论的研究范围,并增强了其应用性。在阐明了合作与非合作之间区别的基础上,纳什定义了著名的“纳什均衡点”,并对它的存在进行了证明。纳什均衡的定义一般是通过简单确定一个正常形式的有限局中人和行动的博弈来给出的。在纯策略中,它是指这样一种策略分布:假使其他局中人不变换其策略,则任何一个局中人都不能以单方面变换自己的策略来增加其效用。纳什还证明,在一个有限局中人和行动的博弈中,至少总存在一个纳什均衡,虽然当我们考察混合策略时才能完全保证其存在,因为有例子表明,存在着没有纯策略均衡的对策。这一定义实际上包含着一个前提假定,即局中人对游戏结构有充分的了解,也就是说拥有完全信息,以便能够导出他们自己的预测。纳什均衡的意义直到现在仍是探讨与争论的题目。一般认为,它是随不同情况而变化的一种过程。例如,假设在某种博弈中,局中人通过某些非强制手段就局中人的策略选择达成协议,这项协议具体确定了每个局中人选择的策略。由于协议无强制力量,局中人如果能通过违背协议而获得利益,则该协议无效。所以,为了保证协议有效,必须有一种局中人不可能因单方面违背协议而获益的机制,即形成一种纳什均衡。即,纳什均衡使得协议能够自我约束,无外力作用下也能保证协议的生效。这里纳
什均衡的意义在于保证协议的自我强制执行。但这并不是说每个纳什均衡都具有自我强制性,就多个局中人背信问题而言可能得出不同的结论。此外,这里并未讨论协议如何实施及无协议时的情况。纳什均衡在上述情况中的含义是有差别的。纳什均衡刻画了人们理性选择的结果:利益冲突达到一种稳态以至无人会单方面加以改变。纳什均衡并未对这一结果做出福利上即总体上优与劣的判断。这就允许存在一种情形:由于人们的不合作使得每个人都达不到可能的最大收益。在囚徒困境中表现得十分明显,其中唯一的纳什均衡是双方均交待,因为在其它策略组合下均有一方能因改变策略而获益。但是这一局势中的帕累托最优是双方均不交待。这表明,帕累托最优并不一定能在纳什均衡点上实现。也即,在存在利益冲突的情况下,利己主义个人理性选择的结果在总体上可能并不是最有效的。进而,西方经济学中在经济人假设下,市场经济会达到或者趋向帕累托最优这一结论在引入利益冲突后有可能无法成立。在囚徒困境中,双方虽可在均不交待的情况下达到帕累托最优,却难以实现这一结果。这是由于缺乏对对方的信任。因对方可把策略改为交待而使自己获释得利,故无法信任对方会信守承诺。每个人追求自身利益最大化这个理性人假设更使这种信任失去基础。这说明,个人利己的理性选择并不能保证人们的处境都得到改善,结果可能对大家都不利。就此而言,纳什均衡揭示了利己理性的弱点。在人人求得自利的同时,如何防止对一切人均不利的结果出现,这已成为今天博弈论和经济学中研究的热点问题。
实际上,纳什的研究是基于“一个时期的模式”而做出的,是静态的,即在稳定的环境条件下,双方在不改变策略的情况下进行。但现实却在不断变化,并常有重复。后来人们在利用策略均衡分析特定的经济模型时,发现扩展形式的每一步在给定一局中人信息的情况下,纳什定义忽视了“离开均衡路线”的偶然性。为弥补这一不现实假设的缺陷,泽尔滕发展了动态的适应于每个不同时期的博弈,从而以此为开端,促进对策略均衡的各种精细改进的定义的出现。并且,在纳什均衡中还有一个完全信息的重要假设,即局中人都了解其对手要采取的策略。这种假设在以下一些情况中看来特别不可信:某些局中人起初拥有其他人所缺乏的关于他们自己的爱好、能力甚至博弈规则方面的知识。如在经济学的应用中,这种不确定性可能反映为一个厂商起初对其竞争者的财务或人力资本资源等信息的不确定性。因此,要把纳什均衡分析运用于那种情景就不明智了。为此,豪尔绍尼建立了所谓不完全信息博弈,从而扩展了纳什分析的应用范围。
泽尔滕的研究成果使纳什均衡概念进一步精致化与详细化,并推动了博弈论在各学科中的应用。针对纳什均衡概念的不完善性,纳什以后的不少研究者试图精化原来的概念,附加条件以便排除无说服力的纳什均衡点。泽尔滕在这方面提出了两个著名的新概念:子博弈完美均衡点(或简称子博弈完美点)和颤抖手完美均衡点(或简称“颤抖手完美点)。子博弈完美点是泽尔滕1965年提出的。他认为在局中人选择应变计划的博弈中,并非所有纳什均衡点都是同样合理的,因为某些均衡解要求局中人具有实施“空洞威胁”(empty threat)的能力,即采用事实上无法实施的应变计划,从而这类均衡解失去实际意义。泽尔滕提出子博弈完美点的概念,是要把依赖于这类威胁的均衡点排除在考虑之外,即在原则上排除直观不合理的纳什均衡。在扩展型模式中,其思想表明了先行者利用其先行地位及后行者必然
理性地反应的事实,来达到对其最有利的纳什均衡点。求解子博弈完美点的方法是逆向归纳法(倒推法)。这一概念可以推广到动态多时段博弈的情况。泽尔滕的子博弈完美点概念简单、直观,且与经济学中许多实际情况如寡头市场等相符合。在许多情景中,由于局中人的策略选择会引起一系列层次的连锁反应,在策略选择时就应对此加以考虑。但子博弈均衡点集合取决于扩展型博弈的细节,同时不能完全排除所有不直观不合理的纳什均衡点。为弥补不足,泽尔滕(1975)提出了“颤抖手完美点”的概念。“颤抖手完美点”概念的意蕴是:在博弈中每个局中人按纳什均衡点进行策略选择时难免会犯错误,即偶尔会偏离均衡策略(形象地说,可能手会颤抖)。这样局中人应该选择那样的纳什均衡点,使得自己犯错误时,其它人按照他们的最佳反应策略,仍如同自己未发生错误一样做出同样的策略选择。事实上,这意味着局中人在策略选择时应考虑到自己有可能做出错误选择,从而会力图避免因自己的偶然错误而蒙受其它局中人改变相应策略给自己带来的损失。当然这一概念假定对任一方的颤抖概率都是一样的。其实,在博弈中人们会更小心地避免在损失大的方向上犯错误,这样向不同方向的颤抖概率就会不同。由此麦逊(R.Myerson)提出了“适当均衡点”的概念,进一步完善了颤抖手均衡点。在颤抖手均衡点概念中,泽尔滕利用人类行为包含非理性因素(局中人会犯错)这一特点,形成对理性概念的一种新理解。这种方法无疑是博弈理论的一个重大突破。此外,泽尔滕在把博弈论应用于具体经济分析方面做出了卓越成就,如对非合作博弈中的联盟形成和议价模型等的深入研究。他在把博弈论应用于实验研究和生物学等方面也有突出贡献。总之,泽尔滕在纳什均衡概念的扩展与深化及博弈论在各学科的应用上都做出突出贡献,从而与豪尔绍尼一起推动了博弈论理论体系的丰富与完善。
在纳什博弈中,博弈双方的信息是完全的,即假定博弈双方都能认清对方每次对局的情况。而在现实生活中,博弈各方要想获得完全的信息可能性极小,而且即使可能获得完全信息也要付出高昂成本。因此,豪尔绍尼就以纳什均衡的出发点和以现实的不完全信息为条件,证明了如何分析不完全信息下的博弈,从而为研究信息经济学奠定了理论基础。他是在纳什均衡的基础上,吸取了贝叶斯的研究成果,以贝叶斯理性原则为出发点,对纳什均衡做了全面广泛的展开。首先是不完全信息理论。豪尔绍尼对博弈论最大的贡献在于他在不完全信息问题上的突破。古典经济模型几乎无一例外地假设,个人(或厂商)的资源与偏好情况不仅为自己,也为他们的竞争对手所知,即完全信息假设。这显然不符合实际。不过,这并非模型建立者本身所希望的,而只是因为缺乏解决不完全信息问题的工具而不得不做出的简化。博弈论的发展也遇到同样问题。由于对不完全信息问题一度苦无良策,博弈论曾受到严厉批评。因为局中人事实上不可能清楚关于对手决策的所有信息。由此导致博弈理论建模的应用范围也受到了限制。豪尔绍尼对这一问题的解决方法是将不完全信息建模为自然完成的一种抽彩。这种抽彩决定局中人的特征。而这些特征是局中人偏好与经验的总和,其中,每个局中人清楚自己的特征,但不知道别人的真实特征。即他对整个博弈局势只有不完全信息。据其特征,局中人可分为一些类型。每个局中人知道自己的类型,不知道别人的类型,但知道类型上的联合分布,从而能对其它局人的类型作出先验分布判断。不完全信息的这种博弈局势把实际中
千变万化的不完全信息都№归结为局中人对他人的主观判断。这种方法成功地将不易建模的不完全信息转化为数学上可处理的不完善信息:即局中人根据经验与知识对对手的类型得出关于可能性大小的主观判断,即数学上的一种先验分布。不完全信息博弈的解是由纳什均衡概念推广而来的。其均衡点(贝叶斯均衡点)是一个n重策略,每个局中人每种类型的个人策略均是对其它局中人的(n-1)重策略的那种类型的最佳应对。以类型为基础的不完全信息博弈是豪尔绍尼(1967~1968年)提出的。他运用这种方法来克服将局中人的信息与偏好以及他对其它局中人信息与偏好的了解进行建模时所遇到的复杂性。这一思路极富创造性,使不完全信息博弈成为解决经济问题的一个有力工具。其次是关于混合战略的解释。混合战略概念的传统解释是,局中人应用一种随机方法来决定所选择的纯战略。这种解释在理论与实际上均不能令人满意。豪尔绍尼对此提出杰出的解释方法。他说明在每一真实的博弈形势中,总受一些微小的随机波动因素影响。在一标准型博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一策略均对应一个。这些随机变量的具体取值仅为相关局中人所知,这种知识即成为私有信息;而联合分布则是博弈者的共有信息。这称为变动收益博弈。变动收益博弈适用豪尔绍尼的不完全信息博弈理论,各随机变量的一种取值类型影响着一个博弈者的收益。在适当的技术条件下,变动收益博弈所形成的纯策略组合与对应无随机影响的标准型博弈的混合战略组合恰好一致。豪尔绍尼证明,当随机变量趋于零时,变动收益博弈的纯战略均衡点转化为对应无随机影响的标准型博弈的混合战略均衡点。豪尔绍尼的变动收益博弈理论提供了对混合战略均衡点具有说服力的解释。局中人只是表面上以混合战略博弈,实际上,他们是在各种略为不同的博弈情形中以纯战略博弈。这种重新解释是一个具有重大意义的概念创新,是豪尔绍尼对博弈论所采用的贝叶斯研究方法的一块基石。再次就是关于合作博弈的通解。豪尔绍尼关于博弈论的第一篇论文(1956)把纳什的合作理论与Zeuthen的议价模型结合,这是他建立n人合作博弈的通用议价模型(1959,1965)的第一步。绝大多数合作解概念基于具有或不具有旁支付(side payment)的特征方程型博弈。而他的通用议价模型是第一个适用于标准型博弈问题的几人合作理论。通过对均衡时效用权重与联盟对局中人分红具有独创性的构造,他成功地定义了一种议价解法,与非合作博弈的一种均衡点非常相似。直至现在,他的几人议价模型仍是合作博弈理论中最为重要的理论之一。最后是关于对合作的非合作形式建模。现在一种观点已被广泛接受,即有关一种博弈形势的充分详细的模型必为一个非合作博弈理论。而在1960年代以前,一般观点认为,合作理论比非合作理论更为重要。豪尔绍尼是促使产生这种观念变迁的博弈论研究者之一。他首先认识到合作机会以非合作博弈形式建模的必要性。由此观点,合作理论可视为一个简化形式,需要建立具有更多细节的非合作模型。以这种思路,豪尔绍尼(1974)为特征方程型博弈中一个重要的合作理论——冯·诺伊曼——摩根斯顿稳定集——进行了创造性的非合作形式重建。豪尔绍尼的议价模型中为一个具有可转移效用的零和特征方程型博弈设计了一个收益向量序列,以其序列递推过程描述联盟的选择过程。其理论利用非直接优势概念形成了修正的稳定集概念。豪尔绍尼对稳定集概念的非合作重建为考察联盟形成的非合作模型构造提供了方法上的突破。
对不可置信威胁的研究引出了博弈论中一个很重要的概念,即承诺行动。承诺行动是博弈中的主体使自己的威胁战略变得可置信的行动。一种威胁是否可以置信,取决于当事人在不施行这种威胁时是否会遭受更大的损失。承诺行动意味着当事人要为自己的失信付出成本,尽管这种成本并不一定真的发生,但承诺行动给当事人带来很大的好处,因为它会改变均衡结果。
随着现代经济的迅猛发展,博弈论日益为人们所认识,并应用于经济现象的分析与研究中。博弈论已成为博大精深的体系,广泛应用于经济学、政治学、军事决策、计算机科学、生物演化等研究。同时与数学、心理学、统计学以及认识论、伦理学等学科有重要联系。它与各学科之间相互影响、相互促进,一方面借鉴其它学科的思想成果,另一方面也促进了其它学科的发展。博弈论与经济学的关系尤为密切,其最直接的应用领域是在契约、合作及各种公共产品等领域,博弈论的影响广及市场理论、契约与合同、政府行为等诸多方面,为研究各种经济现象开辟了全新视野。
博弈论思想也对经济学家的思维方式产生了深刻影响。人们越来越认识到,大多数经济问题可以作为博弈过程来分析。克雷普斯指出,仅就在经济学上的应用而言,博弈论的主旨是帮助经济学家理解和预测在经济环境中已经发生与将要发生的事情。博弈论工具的应用的确加深了对经济现象的理解。近年来,许多学者尝试运用博弈论研究微观和宏观经济理论问题,甚至想通过这条途径重新建构理论框架。这一趋势已逐渐深入到每一个经济学及相关的领域。博弈论的传统应用领域是产业组织或市场结构的研究以及对投票和公共物品供给的分析等。诸如重复囚犯困境、交错出价的议价模型、时间选择博弈和先买权博弈,都在产业组织理论分析中得到应用。而豪尔绍尼的贝叶斯纳什均衡解,作为许多博弈推理分析的基石,则应用于机制设计问题。其中包括非线性价格歧视、最佳拍卖、对公共物品偏好的显示以及信息不完备情况下的契约失效等。在对掠夺行为和就业市场信号的分析中所应用的一系列解的概念——完全贝叶斯均衡解、克雷普斯和威尔森序列均衡解、泽尔滕颤抖手完美点均衡解,体现着经扩展的不完全信息博弈中子博弈完美点的思想。近年来,博弈论被应用到对不同拍卖行为的分析、委托人——代理人的关系及激励机制问题,以及公共财政学领域等。我国学者近年来对博弈论在经济研究中的应用进行了有益尝试。如对经济调整中的社会博弈问题的研究、对中央政府与地方政府的博弈关系和规则的探讨等。博弈论作为一种有力的分析手段,在经济学中有着广泛的应用前景。博弈、合作与经济制度紧密相联,诺斯则认为对经济制度的研究实质上就是对合作的机制的研究。我们认为,近年来经济学的一系列突出成就和最新进展越来越集中地表现出人们对经济行为主体认识的深化。作为洞察主体行为规律和分析经济现象背后机制形成的认识工具,博弈论在研究变革社会的秩序演进与制度创新方面应用潜力巨大。
博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理论指导,具有重要意义。
经济学在为现实经济提供理论指导的同时其自身也要不断发展,凯恩斯以后的西方经济学,在战后已发展起了一个新的体系,即以研究资本主义经济运行为对象的宏观经济学和微观经济学。在改革前,我国的经济研究原是以生产关系为研究对象的政治经济学,主要探讨社会主义经济制度不断完善的途径,并不研究经济运行的过程,在当时计划经济体制下人们对经济活动的关心也主要局限在对政府行为的理解和落实上,而忽视对企业和个人行为的分析、更不考虑各经济主体之间的相互影响和相互对立,忽视经济主体在资源配置问题上的矛盾和博弈。我国在确立社会主义市场经济目标以后,重塑经济主体、转变经济主体的职能、增强各经济主体的活力,是重要的任务。博弈论分析我国转型时期宏微观经济运行的重要工具,因为在我国社会主义市场经济中,经济主体存在着信息的不完全、信息不对称等现实情况,人(政府、企业中的决策者及社会个人)都有自己的效用函数,对信息的加工能力也是有限的,各经济主体之间的选择存在着许多相互依赖关系。
博弈论在西方经济学及经济实践中已得到广泛应用,显然我国经济理论研究引入博弈论理论和研究方法,对于利用新的科学方法和科学成果推动我国经济学的发展,为我国经济建设和经济改革提供必要的理论指导,具有重要意义。我国市场经济经济运行中,政府制定什么政策会收到什么效果,可以通过构建博弈模型进行研究,考虑博弈中各主体的效用函数等,研究不同博弈规则下的均衡。在转型时期政府的许多政策并不能采取指令性规定强制实施,只能依靠宏观调控的手段进行,因此,政府在制定政策时必须考虑政策实施的效果,要研究博弈主体决策行为的相互依赖和相互影响,考虑经济主体的预期以及所获信息对博弈均衡的制约和影响。个人的各项经济决策,要考虑到社会经济活动中其他相关主体的影响。企业作为生产者,目标是利润极大。从这个目标出发,它对投入、产出的种类和数量进行选择,对自己的收入转化为积累与个人的收入分配比例进行选择,这个过程是一个重大的博弈决策过程。经济体制改革改变了政府控制整个经济活动的局面,企业和个人在经济活动中的独立性与能动性日益增强,研究各经济主体在经济活动中的博弈和均衡是研究经济运行机制和规律的重要内容,而专门研究相互依赖、相互影响的理性决策行为的博弈论方法,为政府利用经济理论分析政策问题提供了一种有效的手段。信息经济学是不对称信息博弈论在经济学上的应用,即研究在给定信息结构的条件下,进行最优的契约安排。我国经济转型时期的许多工作需要信息经济学的理论。信息经济学中信息的不对称包括不对称发生的时间和不对称信息的内容。从不对称发生的时间看,债转股的不对称可能发生在相关利益者签约之前,也可能发生在签约之后,分别称事前不对称和事后不对称。研究事前不对称信息博弈的模型称为逆向选择模型,研究事后不对称的模型称为道德风险模型。在信息经济学中,将博弈中拥有私人信息的参与人称为代理人,不拥有私人信息的参与人称为委托人。信息经济学的所有模型都可以在委托人一代理人的框架下分析。债转股政府、资产管理公司和债转股国有企业之间的关系就存在特殊的值得深入探讨的委托代理关系。博弈论理论的成熟,极大地促进了委托代理理论的发展,委托代理理论可以模型化如下一类的问题:委托人(如政府)想使代理人(如债转股国有企业的经营者)按照前者的利益选择行动(如使股权回购和国有资产保值增值),但委托人不能直接观测到代理人选择了什么行动,能观测到的只是另一些变
量(如企业效益、产品的市场占有率等),这些变量由代理人的行动和其他的外生的随机因素共同决定,因而充其量只是代理人行动的不完全信息。委托人的问题是如何根据这些观测到的信息来奖惩代理人,以激励其选择对委托人最有利的行动。委托人在签约时要使自己期望效用极大化,而此时会面临来自代理人的两个约束:一个是参与约束,即代理人从接受合同中得到的期望效用不能小于不接受合同时能得到的最大期望效用;另一个是代理人的激励相容约束,即代理人总是选择使自己的期望效用最大化的行动,如果委托人希望的行动正好能使代理人的期望效用最大,那么代理人就会选择它。