哲学史

哲学史  >  分支学科  >  逻辑学  >  正文

【吴新民】从次协调逻辑看决策中的合作博弈

20世纪50年代之后,经典逻辑处于相对停滞状态,而非经典逻辑的发展势头却越来越猛。克里普克(SKripke1943—)在20世纪50年代末创建的可能世界语义学开创了非经典逻辑的一个里程碑,由于它的直观性和移植性强,因而极大地推动了非经典逻辑的发展。非经典逻辑又分为两大类:一是扩展逻辑;一是异常逻辑。异常逻辑开阔了我们观察世界的眼界,打破了逻辑一元论的成见。异常逻辑包括次协调逻辑、直觉主义逻辑、多值逻辑等。次协调逻辑的创始人科斯塔,1958年开始构造一系列次协调逻辑系统,有命题层次的,也有谓词层次的(包含带等词和带摹状词的),以及对集合论的某些应用。除此,科斯塔还与人合作,共同研究了对立统一原理,并建立一个系统,在这个系统中,对立统一原理可以被形式化。另外,澳大利亚的普里斯特和卢特利,南美洲的何鲁黛等,对次协调逻辑的研究也有重要贡献。次(弗)协调逻辑的名称是秘鲁哲学家奎萨达(Quesade),在1976年国际逻辑会议上首次提出,它表示在这种逻辑里,当矛盾律不再普遍有效后,仍能保持一种稍弱的协调性。由于“次协调逻辑”恰当地表达了科斯塔创立的非协调形式系统的本质特征,所以很快被大家认可。然而,虽“逻辑是建立在某一特殊语言上的关于认知模式和推理系统的理论体系”[1],但与经典逻辑相比,次协调逻辑有两个特点:第一,矛盾律在其中不普遍有效;第二,在其中从相互矛盾的两个前提推不出一切公式。次协调逻辑严格表述为:“一个理论T,如果含有两个互相否定的定理A和┐A,则称之为不协调的;否则,称之为协调的。令S表示T的语言中的全体语句所形成的集合。如果S中的语句都是T的定理,则称T为不足道的或平庸的(Trivial);否则称T为足道的或不平庸的(Nontrivial),如果理论T是不协调的且又是不平庸的,则称之为弗(次)协调的,可用作(次)协调(不协调且又不平庸的)理论的基础的逻辑就是弗(次)协调逻辑”[2]。因此次协调逻辑具有了这样一种特异的功能,它可以在系统中容忍特定的矛盾,同时又限制这种矛盾使之不会在系统中扩散,从而使得“矛盾可以推出一切的”后果,不会在系统内发生。在异常逻辑里,我们如果说直觉主义逻辑是从反面来容忍逻辑矛盾的逻辑,那么次协调逻辑则是把逻辑矛盾局限起来使之不扩散的逻辑。

博弈论是研究决策主体如何在相互作出自己的行为决策以及这种决策的均衡问题,它是研究“理性人的互动行为”。博弈结构是不同策略组合下的支付函数或者得益函数。这就意味着两个前提:其一,博弈的结果是由所有人的行动共同决定的;其二,既然每个人都是理性的,会运用他所掌握的所有知识和信息选择效用最大化的行为,那么他选择行动时,必须考虑别人同样是理性的。因此,博弈又有两个假定:第一,博弈参与人是理性的。第二,博弈参与人的得益不仅取决于自己的行动,同时也取决于其他人的行动。最早出现在1950年代的“佚名定理”(the Fdktkeerer)认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致;这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。只要行为人有足够的耐心,任何满足个体理性的可行支付都可以通过一个特定的子博弈精炼均衡达到。然而,对于对象有比较完备的解剖知识,是运用结构性认识方式的基本要求,这也只有与对象完全在主体的实证把握中才有可能。但人们对对象的这种把握受着两方面因素的限制:一是人们对具体对象认识的有效性;另一是人类对一些对象的认识在认识能力本身上的局限性。而遇此情况,人们只能借助整体领悟的功能性认识方式。美国系统论学者拉兹洛说:“凡是前进方向是要达到某种目的的任何活动,都是价值定向行动。”[3]P95)在这种意义上,博弈的结果是一种价值选择。因为社会世界主要地不是一个事实世界,而是一个价值世界或意义世界。这是由于社会总和与人处于一种不可分割的关系来决定的。社会与人的这种不可分割的关系就是前进的价值关系或意义关系。人的本质是由人的需要决定的。在社会活动中,人们虽然都有目的、有意识地进行活动,但人们预期的目的是彼此冲突、互相矛盾的。这样无数的个别愿望和个别行动的冲突,在历史领域内造成了一种同没有意识的自然界中占统治地位的状况完全相似的状况。这就是说,行动的目的是预期的,但行动实际产生的效果并不是预期的,而是受社会生活内部的规律支配的。俗语说“人算不如天算”就是这个意思,社会规律是“合作用的结果”。但社会事实的特殊性在于有内在的价值,自然事实本身未必有独立自足的价值,它的价值是相对于人类而言的,是相对于人的要求而成立的。

众所周知,人们的多数行为是在自身利益的驱动下产生的,而利益主体又有着不同的表现形式,如个人、集团、阶级、民族和国家等。不同的利益主体又有着不同的利益需求,表现出不同的愿望和行动,这便造成利益主体之间的利益矛盾。但是,这种矛盾并不一定是不可调和的极端冲突,只要矛盾是非零和的,也就存在着大量的合作空间,存在着建立和谐社会的可能,人与人之间之所以能够合作,是因为能够互惠双赢,而互惠双赢的实现是公平回报的结果。科斯塔在《次协调逻辑研究之一:对立统一的辩证原则》中,对经典逻辑的否定词进行了辩证解释,构建起次协调否定的辩证否定观。其中共有六种解释:第五种解释是,在任何具体的连续体中,无论是历史性的还是共时性的,两个邻近的对立的性质A与非A之间,必有一个中间地带,即说连续体有一处,在该处并非一切事情要么A,要么非A。而第六种解释是,在任何具体的连续体中,都有这样一处,在该处某物既是A,又是非A。第五种解释告诉人们并非“非此即彼”;第六种解释告诉人们“亦此亦彼”。事物的“亦此亦彼”表明事物处在绝对运动状态时的变化性,应当属于流动的范畴。而“非此即彼”则表明事物处在相对静止状态时的确定性,当属于固定的范畴。这种“非此即彼”的否定模式,对于处理那些清晰概念的命题的领域是合适的,但是把它看成适用于一切领域,特别是处理模糊概念和命题时,理论上将导致逻辑悖论,使精确方法失效,著名的秃头悖论即是一例。

然而,立足于次协调理论的非零和博弈,其中完全合作型对局的局中人,利益是相互一致的,如让路对局。而混合动机型对局,则是达到“双赢”与“多赢”的策略对局,并且这种对局为种种矛盾心理现象,如合作与对抗、冒险与谨慎、信任与怀疑、利他与利己、仇恨与宽容、恐吓与许诺等提供了尽可能精致的形式处理与结构模型。可以说,“关于博弈中的均衡理性等概念的逻辑探讨,对于博弈理论本身的发展也有很大的启发”[4]。法国博弈论专家波利认为,发展逻辑的工具证明社会软件的正确性和有效性很有意义,它为计算机科学、博弈论和社会选择理论之间搭起桥梁。为此波利研究了联盟逻辑和博弈逻辑,研究了同时行动和非同时行动的扩展博弈的公理化体系,探讨了模型检查和可满足性问题的复杂性。在联盟逻辑中,波利研究多主体(multi-agent)合作博弈中的推理:用公式[C]表示在目前的博弈状态下,主体群C有共同策略使得Ψ在下一个状态成立等。

的确,非零和博弈中的人的利己和利他是互为前提的,一方面利他动机的产生是个体利己动机和社会环境相互作用的结果,而不是与当事人的利己动机无关的外在规范强制灌输的结果。人的利己动机源于人的生物本能,趋利避害是人的天性。有人研究后表明,人们利他精神的多数表现形式,最终都含有自利的性质。博弈中的每一个理性的博弈方要考虑自己的策略选择对自己有利,同时也要考虑其他博弈方的策略选择,因为他们的策略互相影响。如果施恩者在今后与受惠者相遇能得到回报,合作便会在混合博弈的理性个体之间产生,或者说,社会交往使合作的产生变为可能。一个非零和博弈是有效的,不仅取决于一个特定博弈的特征,而且取决于它所要遇到的其他策略的特征性,也就是说,它必须在任何时候都能考虑到相互作用的历史。有时,游戏不只限于两个对手,合作博弈不是“非此即彼”的你赢即我输或我赢即你输的零和游戏,而是“多赢”或“共赢”的对局,不仅参与者的利益无明显的冲突,甚至有一部分利益是一致的。博弈双方可以通过相互合作都做得很好,也可以因为相互背叛都做得很差。与其两败俱伤,或一方所失,并非另一方所得,还不如建立一种双方都能获得好处的合作关系,互惠双赢。因为,相互作用的交往行为是以达成理解和一致为目的的行为,它是以主体之间通过符号协调的相互通约和社会一致性为基础,致力于达成的理解所形成非强迫性的共识。如果凡事不仅要对自己有利,也希望完全不对他人有利;即便是所谓的“双赢”的局面,也不愿接受,结果只能是自己吃亏,利了他人,这中间的互动关系相当微妙细致。因为,人既是生物意义上的,也是社会意义上的,经历了社会化过程的人不只具有先天利己动机,还具有经过后天价值内化而形成的利他动机。一般而言,后天形成的利他动机不仅约束和重塑先天利己动机,而且影响着理性个体追求利益的方式和手段。另外,由于未来是重要的,聪明的博弈者不会只急功近利地看待眼前的直接利益,而会关心自己的长远利益,并担心自己采取的策略所造成的未来后果。次协调理论认为,世界不仅仅有协调的事物,有意义的矛盾事物也是大量存在于客观世界。我们不仅要看到各种社会矛盾、对立、对抗的历史必然性,而且也要进一步看到对抗的历史进步性,看到进步的对抗性和对抗的进步性在历史进程中的辩证关系。在博弈次数增加的情况下,多种多样的策略手段会随之出现:有每一步双方都合作的“全合作策略”;有每一步双方都背叛的“全背叛策略”;有导致合作和背叛的机会各占一半的次数随机选择合作或背叛的“交替策略”;除此还有“一报还一报”、“两报还一报”等策略。

当然,博弈是一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动,一个博弈当中的参与者的利益,有可能严格对立,这种零和博弈中的一个人的所得,就永远是另一个人的所失。然而,更为常见的博弈情况却是既有共同利益,也有利益冲突,从而可能导致共同受益或共同受损的策略组合。在多人参加的博弈对局中,如果后果要由许多人来共同承担,那么整个策略选择过程将会更加困难,因为决策者将面临不同成员与不同目标的排列组合。或者说,决策会出现许许多多的形态。如:有时虽然参与者和决策者人数众多,但只有一种意见,这是较为理想的。有些是由两人共同参与并决策,但却又具有零和性对立的状态。如:角力、下棋、击剑、网球单打等。有些是多人多意见的状态,如:国会、联合国、扑克牌局、政治党派等等。然而,虽然有许多极重要的决策有待确定,并付诸实施,但目前人们还没有一套理性的做法完全避免“三个和尚没水喝”之类的困境。因为每个决策者与选择方案的组合都自成一个系统,成就决策的好坏不一。因此,决策者在考虑自己利益最大化的策略选择时,同样要推及他人。古希腊唯物主义哲学家赫拉克利特说:结合物既完整又不完整,既协调又不协调,既和谐又不和谐,从一切产生出一,从一产生出一切。非零和博弈的和谐,不是形而上学的和谐,而是辩证法的积极和谐观。从思维方式上看,辩证法的积极和谐观,辩证地看待和谐与矛盾的关系,它认为和谐并不是没有矛盾,也不是排斥矛盾,而是包含了矛盾于自身又对之进行了限制或限定,是创造出一种使矛盾双方不至于发展为冲突的社会运行机制和社会正常生活局面。2005年诺贝尔经济奖获得者谢林认为,博弈对局的所谓对立只是一种逻辑上的可能性,在效率曲线上,存在着一点,使得博弈当事人的利益是一致的。或曰“在所谓的文明的冲突中,其实常有相当大的合作空间。那些看起来是零和的抗争,可以在一些存在的善意中,被转化为‘互利的非零和游戏’”[5]P276)。维特根斯坦指出:通过寻求相对一致之处,可以削弱矛盾,从而促进矛盾的次协调解决。当博弈双方都希望避免两败俱伤时,那种“双赢”的共同想法就体现为在效率曲线上找到一个合适的点,这就是博弈均衡,一个稳定的可以预测的博弈结果,即纳什均衡。通俗地说,纳什均衡就是给定你的策略,我的策略是最好的策略,给定我的策略,你的策略是最好的策略,即双方在给定策略的情况下,谁也不愿意调整自己的策略。在一个策略组合中,它使所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。或者说,此时如果他改变策略,他的支付将会降低。纳什均衡点包含在假定的理性的公共知识里,行动者根据这个公共知识能推出其他行动者的数值,以利自己的最佳行为。如此,这个公共知识是一个精确的纳什均衡点。或者说,行动者的最佳行为选择。在纳什均衡点上,每一个理性参与者都不会有单独改变策略的冲动。

综上所论,次协调理论告诉我们:现实社会存在着大量的非零和性矛盾,这也就存在着“合作博弈”的空间,或者说,存在博弈理性参与者合作“双赢”的可能。社会交往的均衡互动是合作“双赢”的状态,也是“合作博弈”成为可能的领域。而在多次或重复博弈对局中,也有使合作空间加大的可能,使“合作博弈”变为现实。除此,博弈的眼前利益与未来的回报等因素,也能使大量的非必然的“零和博弈”转化为“合作博弈”。当下,无论是经济领域,还是国家政治决策越来越显现出“合作双赢”的趋势,也证明了立足于次协调理论的“合作博弈”,有着广阔的运用前景。

 

【参考文献】

[1]吴新民. 汉语关系句语义特征和语言逻辑研究[J]. 上海师范大学学报,2005,(8.

[2]李娜,赫旭东. 次协调逻辑及其带来的逻辑哲学问题[J]. 学术论坛,2005,(10.

[3]拉兹洛. 用系统论的观点看世界[M]. 北京:中国社会科学出版社,1985.

[4]J. Van Benthem, Rational Dynamics[R]. Tech Report. ILLC Ansterdam. 2003.

[5]理查德·道金斯. 自私的基因[M]. 长春:吉林人民出版社,1998.

(原载《学术论坛》20078期。录入编辑:乾乾)