哲学史

哲学史  >  分支学科  >  经济哲学  >  正文

【王小锡】经济道德观视阈中的“囚徒困境”博弈论批判

“囚徒困境”,其原文为the Prisoner's Dilemma,又译为囚犯的两难困难,囚犯难题等。这是大约在1950年由社会心理学家梅里尔·M·弗勒德(Merril M. Flood)和经济学家梅尔文·德雷希尔(Melvin Dresher)首先提出来的,后来由诺贝尔经济学奖获得者的导师艾伯特·W·塔克(Albert W. Tucker)明确地叙述了这种“困境”。之后纳什有两篇关于非合作博弈的重要文章分别发表于1950年和1951年。塔克的这项工作同纳什的文章一起被认为基本上奠定了现代非合作博弈论的基石。因此,“囚徒困境”的重要性自然不言而喻①。

“囚徒困境”作为博弈论中的一个经典范例,其博弈理论渐渐为经济学、哲学、伦理学和管理学等诸多学科的研究所重视,一些学者把“囚徒困境”之博弈理论视作理解和指导当代经济活动的重要理论依据,更有甚者把它作为企业竞争中必须考量和选择的博弈“圣典”和道德理路。辩证地看待这一研究现象,其基本研究理路无可非议,因为这至少是促进人们深入研究相关社会现象的一种特殊的思维路径和方法。但经济领域近年热衷于“囚徒困境”的博弈理论的研究,似乎唯有“囚徒困境”之博弈理论才能说明经济领域的竞争之态势和竞争之激烈。有人搞经济理论研究言必称“囚徒困境”,甚至认为,经济伦理研究如果不涉及此一理论,就无异于徘徊在真正的学术殿堂大门之外,无法进行真正的、高水平的学术对话。这一现象让人不禁疑惑:果真“囚徒困境”的博弈理论有如此神奇,甚或可以统揽经济理论研究或统领经济活动?果真“囚徒困境”的博弈理论能够厘清当今各种经济利益关系和经济道德关系?实际上,把“囚徒困境”的博弈理论套用于当今经济活动领域,是市场经济条件下极具功利色彩的、信息极不对称的、非合作性的处于“生人圈”之中的经济竞争理论。因此,对其局限性加以揭示,并厘清其适用范围,还“囚徒困境”的博弈理论以本来面目,这不仅无损于我们利用“囚徒困境”的博弈理论来进行经济理论及其相关理论研究,而且可以开辟“囚徒困境”的博弈理论所未涉足的理论“空场”,推进经济理论研究和其他相关理论研究不断走向深入。基于此,本文试从经济伦理的语境对“囚徒困境”进行深度检讨,以期为走出“囚徒困境”的“漩涡”指明路径。

一、“囚徒困境”之德性假设

“囚徒困境”的故事讲的是两个具有犯罪嫌疑的囚犯甲、乙,被警察分别关在了两个隔离的房间中,警察对这两个囚犯进行分别的审讯。在审讯中,警察向他们分别提供了三个选项,并让他们做出选择:第一、若他们中的一个坦白了事实真相,那么坦白的将只判3个月监禁,而没坦白的将被判10年刑;第二、若他们都坦白了,那么他们都将被判5年的刑;第三、若他们都不坦白,那么他们都将判1年的刑。假设充分保障囚犯的决策权,让他们选择对自己最有利的行为方式,结果发现他们都坦白了事实的真相,于是都被判了5年的刑。

很显然,这对两个囚犯来说并不是最佳的选择,于是构成了所谓的“囚徒困境”:即两个囚犯都试图选择对自己最有利的行为方式,结果却发现陷入了对双方不利的境遇。为什么会导致如此的结果呢?这是因为两个囚犯本性是利己的,他们的选择都会把个人利益的最大化作为目标,都会通过严密的逻辑推理去追求一个对己最佳点,即“纳什均衡点”②。

作为囚徒甲,他的推理如下:假如我选择坦白,那么乙要是不坦白,我将只判3个月监禁,即使他坦白,我也只会被判5年刑;假如我选择不坦白,那么乙要是坦白,我将被判10年刑,即使乙不坦白,我还是要判1年刑。因此,我不会去冒被判10年刑的风险而去选择不坦白。也就是说选择坦白对“我”是最佳的。同理,囚徒乙也会做出同样的推理。

由此不难看出,囚徒甲、乙的推理就个人而言是合理的,且是他们各自的最佳选择,这样的选择使两个囚犯陷入了困境。

尽管人们对“囚徒困境”故事耳熟能详,尽管“囚徒困境”故事在经济学等相关学科理论中都被引为经典性的事例,但是,熟知非真知。其实很多人并未意识到“囚徒困境”的理论悬设。如果仔细加以考量的话,不难看出,“囚徒困境”故事是某种虚构的情节,它存在明显的“漏洞”,而这些“漏洞”恰恰是“囚徒困境”的局限性之所在。

造成“囚徒困境”的预设有三:一是每个囚徒必须知道博弈规则及其后果;二是每个囚徒必须是理性的,即总可做出对自己最有利的判断,譬如一个不那么理性的囚徒就很可能径直选择不坦白,这是最重要的;三是囚徒之间必须相互隔离,不可订立攻守同盟,亦无法获悉对方的选择倾向。正如有论者指出,“囚徒的苦恼在于他们不能商量沟通。”③但后来的研究表明,弱化这些预设困境仍然成立。

其实,首先应该讲明的一点是,困境绝不限于“囚徒”,任何谋求对自己有利的理性双方(可用“经济人”或理性人代之)都可能陷入其中,“囚徒”也不限于两个,涉及多方的博弈可能更为复杂一些,但那不过是大规模的“囚徒困境”问题。关于囚徒之间是否订立攻守同盟问题,当然是应该考察的层面,但这并不具有根本性的意义,因为这些协议约束力实际上很难保证,谁也无法保证对方信守诺言而不背信弃义。“因为,这一博弈模型预设博弈者是来自霍布斯世界中的‘豺狼人’,即每个人都是他人财物的可能掠夺者。在这种博弈中,既然人人都无道德感,就无所谓守信、履约和恪守承诺问题。”④概要说来,“囚徒困境”的德性假设主要有三:

其一、其主旨思想是宣传功利主义⑤,一切以可能的结果作为犯罪嫌疑人坦白与否的依据。按理,故事情节应该从法律和道德角度支持和鼓励坦白,然而,故事始终没有涉及该不该坦白的问题,虽然故事表面上是主张犯罪嫌疑人坦白,但其情节构思是想要说明坦白与否是一场博弈,犯罪嫌疑人在博弈中选择了坦白。

其二、警察对嫌疑人的审讯缺乏法律依据和法律支持。该情节不管在哪个国度和地区,都会认为分开审讯嫌疑人是对的,这是审讯中技术层面的内容。但是,在没有弄清楚案情时就确定某种态度下的刑期,显然是不合法律程序的。同时,按故事情节来看,警察是掌握了嫌疑人的犯罪事实的,因为不管嫌疑人交代态度如何都得判刑,然而,嫌疑人都坦白各判服刑五年,都抵赖各判服刑一年,其中一个坦白而另一个抵赖,坦白的可轻判3个月监禁,抵赖的判服刑十年。这一推理也没有法律依据,甚至存在着严重的逻辑错误,两者都坦白和两者都抵赖服刑年限倒错,一个坦白而另一个抵赖的服刑年限与两者都坦白或都抵赖有严重不一致。因此,故事情节中的博弈不是理性意义上的博弈,实际上非常近似于冒险性的赌博。

其三、故事情节主张一切从自身的利益出发来思考问题,而且把对方看成是同样的自私自利者,所以,谁也不愿意承担责任或冒险抵赖。在这个故事里,且不说警察行为有诱导人们趋功利之意味,两个嫌疑人的举动没有体现博弈中有道德和博弈中应该讲道德的理念。所以,“囚徒困境”故事除了主张赌博式的盲目博弈之外,实在缺乏更深刻的哲理来启发人们的理性行动。基于这些判断,我们可以得出结论,“囚徒困境”的德性假设本身存在显见的矛盾和问题。

二、“囚徒困境”的经济道德审视

尽管“囚徒困境”对于经济博弈有一定启示和价值,但若将“囚徒困境”作为一个经典的经济博弈范例加以普世化,除了存在违背基本的哲学逻辑——以特殊代替一般的错误之外,还存在其他一些难以规避之问题。我们不应该就博弈谈博弈,尤其是就功利性博弈谈功利性博弈,因为纯粹的功利主义博弈论有它自身难以克服的缺陷,而且会带来严重的社会伦理问题。而如果换一个视角来考察的话,对“囚徒困境”作经济道德考量,一个全新的视阈就会呈现在我们面前。概要说来,在经济道德的视阈中,“囚徒困境”是建立在三大基本假定的基础上:一是信息不对称;二是竞争中的非合作性;三是“生人圈”的背景。

1.信息不对称的博弈

“囚徒困境”是在信息不对称情况下的博弈,博弈者只关注自己的利益,所谓惟利是图,惟我独尊。他不仅不相信任何利益相关者,甚至完全把竞争者当成敌人,这会使任何一方博弈者失去在愿意合作情况下的许多经济建设的资源。

应该说,“囚徒困境”所讲的信息不对称,在市场经济领域,在企业之间的竞争中也有类似之处。比如,在信息不对称的情况下,如果公开信息就怕被人利用,使自己上当吃亏。尽管此举并非万能之策,尽管不公开信息会出现互相打压或互相挤压的情况,由于完全有可能在自己的信息不公开的情况下获得更多的利益,因此企业往往选择封锁信息,即信息不合作态度。这是经济领域中所存在的一种不争的事实。然而,必须清醒的认识到,所谓“囚徒困境”中的信息不对称所带来的问题,很可能导致没有经济信息交换的竞争摩擦,造成无谓的资源消耗和浪费。这不仅影响经济活动的良性有序的运转,损害企业的经济效益,更可能影响人的情绪,伤害人们的感情。

2.竞争中的非合作性

在市场经济条件下,竞争不可避免。但是,竞争却有着性质的差别,一种是恶性的竞争,另一种是良性的有序的竞争。而所谓良性竞争是建立在合作基础之上的,尊重他人和团体利益的竞争行为。这里就引出了竞争与合作的关系问题。从哲学上讲,竞争与合作的关系是既相互区别又相互依赖、相互促进、相互统一的辩证关系。这里我们引用西方经济学中有一个经典的例子来诠释竞争和合作的关联。例子说,在地狱里,人们吃稀饭,因为只有长勺(自己吃是没法把稀饭送入口中的),自己争先恐后地抢着吃,只能用手来抓,结果只能被烫得皮开肉绽;相反,在天堂里,人们非常注意相互合作,相互舀着来给对方吃,结果大家吃得既饱又好。这个例子生动而形象地表明了“理性合作即天堂,恶性竞争即地狱”的道理,表明了竞争与合作的内在关联,如果人为地把某一方面推向极端,必然会滑向另一极,正所谓“两极相通”。

正是在此意义上,无合作的绝对的竞争或无竞争的绝对的合作,无论在哪个时代都是少之又少的。因此,需要保持两者之间的必要张力。可见,“囚徒困境”实际上是建立在非合作性基础上的恶性竞争,即只要对我有利,最好是实现帕累托最优,不管别人的利益甚或死活,这是对社会生活中某些极端行为的一种抽象,而不代表一种积极健康社会的主流,因而将其“泛化”成一种普适性的逻辑就是非理智之举。

3.“生人圈”的背景

“囚徒困境”是在生人圈中进行的,且博弈者之所以只关注自己的利益,不相信任何利益相关者,主要是缺乏熟人圈的伦理道德的钳制。熟人圈伦理的运作机制和生人圈有着明显的异质性。熟人圈人们在竞争时容易按照伦理规范去进行,一般不会做出过分出格的行为,因为一旦如此,其可能的后果是失信于人,声誉扫地。而在生人圈,人们在竞争时往往更容易按照利益逻辑去进行,一般很容易做出出格的行为,因为即便如此,他也不会遭到周围生活圈人们的评价和谴责,依然可以“怡然自得”,而不会失信于人,声誉扫地。

如果联系到中国传统社会的背景,我们恐怕就会更容易地看到上述这点。中国的传统社会是一个熟人的社会,即,“这是一个‘熟悉’的社会,没有陌生人的社会。”⑥乡土社会的信任是一种人格信任,这种信任不是奠立在法律和契约的规定之上的,而是“发生于对一种行为的规矩熟悉到不假思索的可靠性”⑦。在传统社会的人际交往中发挥作用的,是“特殊主义”而非“普遍主义”的原则⑧。在此原则之下,信任度随不同熟悉程度的交往对象而有所不同。

尽管当前中国已经初步建立起了社会主义市场经济体制,但是,传统社会的伦理秩序依然有力地影响着现实经济生活,“囚徒困境”因是建立在基本的不信任基础上的,可以确定其属于一种在“生人圈”背景中进行博弈的情况,因而,在当代中国社会其普遍性也受到置疑。尽管我们承认,现代经济的发展越来越从“熟人圈”走向“生人圈”,但是对于当下中国来讲,靠“熟人圈”来发展企业,进行商务活动仍然是经济活动的一个重要层面。就个体来讲,“熟人圈”则是经常遭遇的一种现象。因而,单就此点来说,如果拿“囚徒困境”这个建立在“生人圈”的背景之上的博弈理论来进行普世化的推理和运用,必然会遭遇与现实的巨大裂口。

总之,“囚徒困境”理论的确有其存在的合法性悬设。现实是,尽管“囚徒困境”的博弈论并非我们想象的那样简单,尽管可以进行多重博弈,尽管并非所有的经济学家都将“囚徒困境”博弈论奉为“经典”,甚至于某些经济学家已经意识到在“囚徒困境”中楔入道德的因素,但是他们似乎并未真正的解决问题。在此层面上可以说,楔入道德维度对于全新视阈的获得是十分必要的。否则,我们就只能在“囚徒困境”所预设的旧靴子里打转。因此很有必要颠覆“囚徒困境”之传统思想范式,为改正其逻辑错误并走出其逻辑束缚铺平道路。

三、走出“囚徒困境”的可能路径

尽管我不主张把“囚徒困境”故事作为社会各领域竞争的经典范例,但至少目前在社会科学各学科领域它可以被广泛引用和观照,而且可以用“囚徒困境”故事作延伸,为经济竞争服务。实际上,如果将“囚徒困境”普世化,就显然地至少违背了特殊不能代替一般的哲学基本逻辑。因为在我们看来,经济领域中不仅存在利己主义而且存在利他主义⑨,不仅存在信息极不对称的个人理性,而且存在信息共享的集体理性,不仅存在竞争而且存在合作,不仅存在恶性竞争导致的尔虞我诈而且存在良性竞争带来的互惠共赢。

因而,走出“囚徒困境”的可能路径是,经济活动的参与者(即所谓“囚徒”)超越个人功利的计算理性,而达到谋求群体功利的集体理性,以一种参与式的合作精神介入竞争过程,从而摆脱“囚徒困境”所预设的僵局。下面择要阐述走出“囚徒困境”的三大可能路径:一是以集体理性代替功利的计算的个人理性;二是以合作精神介入理性竞争;三是坚持道德人与经济人的统一。

“囚徒困境”故事把人当作不讲道义的利己主义者,假如设想两个嫌疑人很友好,又都敢于承担责任,其结果会更理想。当然,这样就可能形成“困境”不严重或不存在“困境”的局面,博弈的程度就会减弱。不过,“囚徒困境”作道德性情节修改,应该更适合当代经济社会中的博弈,也更适合作为“道德经济”的社会主义市场经济条件下的经济博弈。为此,我们理解的博弈应该是道德博弈、经济博弈应该是道德经济博弈。需要指出,我们把伦理道德引入博弈论,不仅重视道德的工具价值而且注重其内在价值。

首先,从走出“囚徒困境”的三大可能路径之一的以集体理性代替功利计算的个人理性说起。“囚徒困境”反映了一个深刻的问题,这就是个人理性与集体理性的矛盾。有论者指出,“囚犯难题具有极深刻的含义,它解释了何以短视地以利益为目标将导致对大家都不利的结局。”⑩谁都想占便宜,但是谁都占不到便宜,这就是所谓“理性的无知”(rational ignorance),它表明了“利己之心是如何导致不合作的、污染的和扩军备战的世界——一种恶劣、野蛮和使生命短促的生活方式”(11)。早在200多年以前,市场经济的鼻祖亚当·斯密提出了著名的“无形手”理论:本性利己的“经济人”为追求个人利益最大化目标而理性行动时,会在一只看不见的手的操纵下,达到社会资源最优配置和增进社会福利,实现整个社会的繁荣。但现实的市场经济中“无形手”的理论在很多领域出现失灵现象,且大多数情况下不能导致资源的最优配置,增进社会福利。原因何在呢?现代经济学认为,造成市场失灵的原因在于市场机制本身,即市场无法解决公共物品供给、外部效应、信息不对称、垄断等问题。细心考察不难发现,其中深层的原因是由于个人理性的简单相加并不等于集体理性,换言之,每一个人都是理性的,想做出对自己有利的选择,而这种选择所得来的结果却是“集体的非理性”、“理性本身的非理性”。由此可见,走出“囚徒困境”的可能路径就是要以集体理性代替功利计算的个人理性,否则,所谓走出只能是某种“画饼充饥”的幻想而已。

其次,从走出“囚徒困境”的三大可能路径之二理性竞争、加强合作说起。保证以集体理性代替个人理性,还须加强竞争中的必要合作才能走出“囚徒困境”。正如有论者指出:“囚徒只有共同合作才是他们最佳的选择,这样的选择会使他们达到‘帕累托最优’状态,这种状态下,囚徒双方的利益都会实现最大化,也就是说对双方都会有利,所以,合作才是他们摆脱困境的唯一出路。”(12)

从不同的社会制度层面上看,不同制度对于竞争机制的影响很大。在社会主义市场经济条件下,企业完全可以合作双赢或多赢。退一步说,即便是在资本主义条件下,恶性的竞争也是不受欢迎的。不可否认,企业在经营过程中一定会有商业机密需要保护,就保护知识产权角度来说,法律支持,道德也是允许的。而且,保护商业机密,有利于促进企业的创新、改革等良性竞争。当然,在社会主义市场经济条件下的企业,更多地强调合作,因为,一是适当地公开一些信息有利于减少交易成本,一味地互相打压或互相挤压,只会增加摩擦成本,甚至由于信息不对称的互相打压或互相挤压会造成收不回应该收回的成本的局面。这不仅影响企业扩大再生产,也影响社会的经济效益,最终影响的还是全社会的利益。二是加强企业之间的合作,有利于充分利用信息、社会和物质资源。尽管企业之间的竞争在任何情况下是激烈的,但是社会化的大生产及其企业之间的生产经营链使得任何企业都离不开社会和其他企业的帮助,与其因为互相之间的不合作带来了许多企业经营困难,还不如尽可能做到信息共享,必要时联合行动,在政策和道义允许的范围内,将资源利用到及至,将摩擦减少到最小,将效益提到最高。否则,就很难走出恶性竞争的泥潭(13)

最后,从走出“囚徒困境”的三大可能路径之三坚持“道德人”与“经济人”的统一说起。由于“囚徒困境”式的经济或企业博弈理论是建立在“经济人”假设和建立在企业利己主义道德观基础上的,要保证信息对称和以合作精神介入竞争过程,还必须要从人性上着眼,不然,就很难保证“囚徒”最终不滑向自利主义的泥潭。亚当·斯密在其著作《国富论》和《道德情操论》中分别提出“经济人”和“道德人”的概念,“经济人”自利,“道德人”利他,“道德人”中蕴含着“仁爱”因素。可见,这点对于重构“囚徒困境”的人性基础十分必要。“道德人”可以克服狭隘“经济人”的自利观,“道德人”和“经济人”的统一,由原来竞争中的“我赢你输”对抗性排斥性的思维方式而变为“我赢你也赢”的合作性的思维范式,这种利他与利己的思维范式引入,不仅会为最终走出“囚徒困境”敷设人性底线,而且会带来现实层面的巨大效益。正如约翰·沃特金斯所说:“假如在社会中道德主义者占一个很大的多数,比如说95%或更多,那么,对一个人转向道德主义的激励就会相当强。”“将会出现一种带头羊式的效果(bandwagon effect):如果道德主义已经在这个社会传播得相当广的话,则可望它的传播会更广。”(14)在这样的社会中,具有道德维度的互惠博弈模型在人类生活世界中就有了现实性,正如韦森所说:“即使在任何制度化的现代市场经济中,尽管法律规则的体系化的程度之高以至于制度性规则已渗透并规制着社会生活的方方面面,但在人们的日常生活和商业活动中,道德感、道德心、良知、诚信和常理(common sense)仍在很大范围和很大程度上支配着人们的行动和选择。”(15)

综上所述,现代经济学中的“囚徒困境”博弈理论尽管有其价值,但是,由于在此语境中的“囚徒困境”及“纳什均衡”是伦理无涉的(nonethical),实际上很难契合于现实生活的实践场。换言之,置换“囚徒困境”的语境,把它从“道德虚无特区”(韦森语)拉回到经济道德语境中来,不仅是走出“囚徒困境”的必要途径,而且是合理诊断和把握现实经济世界的正确理路。

【注释】
①参见:李伯聪、李军:《关于囚徒困境的几个问题》,〔北京〕《自然辩证法通讯》1996年第4期。
②故事中两个囚犯由于无法串供,因此,他们都只是选择对自己最有利的坦白的策略,并因此被判5年,这样的情节和结局被称为“纳什均衡”,也称作“非合作博弈均衡”。
③郑也夫:《走出囚徒困境》,〔北京〕光明日报出版社1995年版,第201页。
(15)韦森:《经济学与伦理学——探寻市场经济的伦理维度与道德基础》,上海人民出版社2002年版,第96-97页,第103页。
⑤阿玛蒂亚·森的观点对此的批判是有力的,他认为:“真正的问题应该在于,是否存在着动机的多元性,或者说,自利是否能成为人类行为的惟一动机。”(参见阿玛蒂亚·森《伦理学与经济学》,商务印书馆2000年版,第24-25页。)
⑥⑦费孝通:《乡土中国生育制度》,北京大学出版社1998年版,第9页,第10页。
⑧“特殊主义”和“普遍主义”是T.帕森斯和E.A.希尔斯提出的概念。他们认为,特殊主义是凭借与行为之属性的特殊关系而认定对象的价值的至上性,而普遍主义则独立于行为者与对象在身份上的特殊关系。参见Parsons, T. and Shils, E. A., Toward a General Theory of Action, Cambridge: Harvard Universy Press,1951,p.82.
⑨关于利他主义,它可分为绝对(无条件)利他主义和相对(有条件)利他主义,相较而言,后者更为普遍。威尔逊在《D·T·坎贝尔的〈论生物进化与社会进化及心理学与伦理传统之间的冲突〉》一文中指出,他赞同坎贝尔教授的观点,认为人和社会的利他主义分为两种基本形式:一是无条件利他主义,二是有条件利他主义。
⑩茅于轼:《生活中的经济学》,上海人民出版社1993年版,第254页。
(11)保罗·A·萨缪尔森、威廉·D·诺德豪斯:《经济学》,〔北京〕中国发展出版社1992年版,第926页。
(12)李刚、黄正华:《“经济人”与“道德人”——从囚徒困境谈起》,〔呼和浩特〕《内蒙古农业大学学报》(社科版)2004年第2期。
(13)参阅王立刚:《冲出恶性竞争的囚徒困境》,〔济南〕《青年记者》2005年第9期。
(14)转引自:R. Campbel and L. Sowden(ed.), Paradoxes of Rationality and Cooperation, Prisoner's Dilemma and Newcomb's Problem, Vancouver, The University of British Columbia Press, 1995,p.74.

 

(原载《江苏社会科学》20091期。录入编辑:乾乾)