哲学史

哲学史  >  分支学科  >  逻辑学  >  正文

【章澹】参照类问题与概率的相对性

参照类问题是概率理论中的一个重要问题。如果生活中充满不确定性,而概率理论是对这种不确定性的把握,那么参照类问题就是此类不确定性中的一个重要因素。在某种意义上,存在着一个参照类,就存在着一种与之相对应的不确定性。对参照类问题的实质的探讨就是本文的主要内容。

一、参照类问题简介

通常认为,参照类问题始现于韦恩(Venn)1876年提出的韦恩图的构架中。参照类问题可以简单地表述为:任何一个特殊的事件都属于不同的集合;或者说,任何事物都有无限多的性质,每一性质都可以归为一类,那么这个事物就可以被归为无限多个类。对应不同的类,就存在着相应的不同的概率值。比如被人工智能研究者称为尼克松菱形”(Nixon Diamond)的问题:教友派通常是和平主义者,且尼克松是一个教友派信徒。共和党成员通常不是和平主义者,且尼克松是一个共和党成员,全部证据表明,尼克松既是属于教友派的又是共和党的成员,那么我们应该如何认为尼克松是一个和平主义者?”([1]p.12)

诸如此类问题也就是概率解释中的参照类问题。对于参照类问题,赖兴巴赫(H.Reichenbach)有个比较经典的表述:

如果我们要给单个的(individual)未来事件找到一个概率,首先我们必须要把这事件放置到一个合适的参照类中。而单个事情或者事件(individual thing or event)可能属于许多参照类,其中会导致不同的概率值。这种含糊性就被称为参照类问题。”([2]p.2)

而后哈耶克给出了不同版本的参照类问题,他认为现有的所有概率解释的理论,只要有建设性作用,都会碰到自己的参照类问题。这样,参照类问题的外延变得颇为宽泛——对于什么是参照类问题的理解已经不在通常的(如上文赖兴巴赫给出的)界定范围之内。

实际上,哈耶克是把依照不同的条件、前提、甚至语言选择等等,从而导致不同概率值的问题都归结为参照类问题。但是如此一来,参照类问题的内涵已经发生变化。于是,问题的关键就成了到底什么是参照类问题;不同版本的参照类问题是否有实质上的共同之处。

二、参照类问题的几种版本与问题实质

参照类问题最先发难的是针对概率的频率解释。频率解释是目前所用的一个流行版本。其不足之处是不能对单一事件的发生概率给出合理解释,而对类事件给出了很好的解释。参照类问题,主要针对的也就是单一事件的概率问题。其造成的困难上文中所引的赖兴巴赫的表述已经说明。对于该问题,卡尔纳普(R.Carnap),赖兴巴赫和萨尔蒙(W.C.Salmon)等人给出了不同的解决途径。卡尔纳普等提出的最窄参照类理论,萨尔蒙则提出了最大同质(homogeneous)参照类原则——所谓特征B的同质参照类A是这样一种类:没有任何一种性质C能使B相对于A的概率受到影响。具体地说,根据是否存在性质C把参照类A分为两个子类,即ACA且非C。如果性质B相对于AC的概率不同于它相对于A且非C的概率,那么,A不是B的同质参照类。反之,如果二者没区别,则AB的同质参照类。但是,在具体问题中,该方法很难应用。例如,诗人就不是死于心脏病的同质参照类,因为相对酗酒的诗人和不酗酒的诗人,死于心脏病的概率是不同的。萨尔蒙认为,掷一颗均匀的硬币是此硬币正面朝上的同质参照类,因为相对于这一参照类没有一种性质能改变硬币正面朝上的概率即1/2。这是一类理想情形。而具体事物之间的联系颇为复杂,比如,给定一台验钞机,只要正常工作,其假币识别率为100%,但是,后来随着纸币造假技术的提高,其识别率跟着变化。尤其是对于单个事件,在确定单个事件的概率时,满足以最大同质参照类为依据的要求在实际操作中很难实现。类事件仍旧可以从科学理论或技术中,找到一些最大的参照类,比如,伽利略理想斜面实验,给定理想斜面,给定一个均匀的小球,那么小球的速度就不会改变。而具体事件,则有无限多的参数,尽管我们可以找到其中的主要几个,但是有一天还是会发现另外一个没注意到的参数也会改变事件发生。通过上述的分析可以得出,参照类问题似乎在某种程度上可以理解为相关性问题,如果哪些因素和此事件相关,那么就会影响该事件的发生概率。单个事件由于具有无限多的影响因素,使得其参照类的选取更为困难。但是,其它版本的参照类问题却不尽如此。

接下来,本文将要阐述和无差别原理相关的一类参照类问题。根据哈耶克的观点,此类问题亦属于参照类问题。一个口袋里装有诸多黑球和白球,如果随机抽出两个,那么抽到都是白球的概率是多大?答案可以是1/4;也可以是1/3。前者的依据是:在不知道黑白球比例的情况下,每抽出一个球要么是白球要么是黑球,如果要求两个都是白球,那么答案就是1/4。后者的依据是:抽出的两个球中,可能没有白球,可能有一个白球,也可能有两个白球,根据无差别原理”(the principle of indifference),三者等概(等概的根据是:在一些选项中,如果没有所知的理由去预测一个对象而不是另一个对象,那么,相对于这种知识而言,对每个选项的断言都是等可能的。”)([3]p.47)如此,答案就是1/3。于是,答案依据于算法。而不同的算法与参照类有何关系?

根据哈耶克所言,我们看似可以得出如下结论:以上两种算法分别是根据不同的参照类得出的。一个参照类是颜色,一个参照类是数量”——我们姑且冠以如此这般的名称。如果根据颜色来计算,那么每种颜色的比率可以根据无差别原理被认为等概。如果根据数量,那么在0”1”2”这三种情况之间,白球数量成等概分布。而在口袋中,没有摸出的球的数量比例在“(01)”之间可以是任意取值的。两个答案都用到了无差别原理。可以认为是这个原理本身的问题,但事实上,存在着这两种划分依据。有了这两种划分依据,无差别原理用与不用都无关紧要,因为至少还是存在对这个问题的两种解法。而根据哈耶克的立场,这是无差别原理在两个参照类上的应用。或者说,不同颜色的球的数量可以是相等的也可以是不相等的。如果相等,那么答案就倾向于以数量参照类;如果不相等,那么就是以颜色参照类。而其中的一个并不比另一个更为根本。而在通常情形下,人们给出的答案倾向于以颜色参照类,也就是倾向于得出1/4这个答案。比如,凯恩斯倾向于这个答案。

为了与上述问题进行比较,我们再来分析赖兴巴赫的经典表述:如果我们要给单个的未来事件找到一个概率,首先我们必须要把这事件放置到一个合适的参照类中。而单个事情或者事件可能属于许多参照类,其中会导致不同的概率值。这种含糊性就被称为参照类问题。”([2]p.2)

根据以上表述,参照类问题是针对单个事件而言的。如果不是单个事件的情形那么又该如何?如上文所述和无差别原理相关的困难是否如哈耶克所言——它们都属于参照类问题?哈耶克认为这些显然是参照类问题。他给出的一个例子是边长和面积问题:假定有一个正方形,边长在(01)之间任意取值,那么其边长在(01/2)之间的概率是多大?根据边长和面积分别作等概的假设,我们就能得到两个不同答案。对于一列选项中的一个,我们得到一个命题的概率值,对于一列选项中的另一个,我们得到另一个。”([2]p.16)由此,该类问题也被归结为参照类问题。显然,这些问题都不是单一事件问题。也很难论证它们和单一事件有何关系。而且在上述的黑白两色球的例子中,我们根据哈耶克的论证方法得到颜色数量这两种参照类。事实上,把颜色或者数量称为参照类显得甚为牵强。颜色或者数量虽然被冠以参照类的头衔,而实际上毫无内涵。只不过是赋予了两个不同概率值以相应的名称罢了。

退一步,即使无差别原理造成的问题属于参照类问题,那后来陆续出现的对无差别原理带来的各种问题的各种解决办法几乎都能表明:对于一些问题确实存在着一些参照类,它们在各种貌似可行的参照类中最为优越。比如酒水悖论的解决——杰弗里(M.Mikkelson Jeffrey)将酒和水的数量关系置于优先于比率关系的位置([3]pp.137-145),使得该问题得到澄清;吉恩斯(E.T.Jaynes)对圆内接三角形的边长和任意一条弦的长度的概率关系的解决——从庞加莱的不变性要求出发,而不是从单纯的直觉判断出发,从而得出该问题的唯一解([4]p.497)。意味着这些问题都有对应的单一最合适解,而如果根据哈耶克的立场,把这些问题放到参照类的问题中来讨论,那么就意味着存在着最优越的参照类,而并不是说几种解决角度都可行且其地位都平等,因此不存在最优越的参照类。尽管由无差别原理带来的问题没有最终全部解决,但是现有的解决途径就能表明确实有最恰当解。如此一来,至少在已经解决的问题内,就存在着最优越的参照类。

由此我们得出:以上两类问题,它们的相同之处在于都能给出某一概率问题两个以上的概率值,而根据的标准却有所差异。在单个事件中,也就是在赖兴巴赫的经典表述中,我们所面对的是一个具体事件。因为具体事件拥有众多属性,于是它属于不同的参照类,其中每个属性对应于一个参照类。而由于无差别原理的应用带来的概率多值问题,所针对的往往不是具体的事件,于是这类问题在我们看来不是参照类问题,而哈耶克认为它们是参照类问题。这其中显然存在着没有经过严密分析而采用的假设。然而,在哈氏的对参照类问题的后继处理中,却越来越接近赖兴巴赫给定的参照类含义。在讨论古典概率解释中的有限样本空间的参照类问题时,哈氏如此处理此类问题:考虑抛硬币的概率取值问题。通常,抛硬币事件主要有两种可能情形,即正面或者反面。但是,哈耶克认为,这里的基础是我们以往建立的经验,而如果在对各类结果无知的情况下,我们将要考虑更多的结果,比如:(正面,反面,边)或者更多。这样,对于正面朝上这一事件,根据原来的样本空间所给出的结果是1/2,而根据现在的样本空间所得到的结果是1/3。或者还有其它更多的值。除此以外,哈氏认为,我们还可以用以下方法来改变样本空间:把正面朝上的情况加以区分——比如,正面的某个标记的朝向和北方的夹角,这样可以分为:(0°120°](120°240°](240°360°]。于是,样本空间变为{正面(0°120°],正面(120°240°],正面(240°360°],反面}。([2]p.13)某事件根据如此这般来划分的样本空间所得的概率值,就不同于基于原来的样本空间所给定的值。

事实上在这个例子中,哈氏是将参照类问题泛化了,改变样本空间,那么由此所得的概率值显然会有所变化。但是,问题已经不是原先的问题。如果硬币以边着地,并且这种概率很大,那它已经不是通常的硬币。而如果要考虑硬币正面的某个标记的朝向,问题显然已经不是原先的只问哪面朝上的问题。我们可以做到对硬币状态的描述更加具体,比如其质料、花纹、投掷地点等等,如此这般地将原来的类事件逐渐地加上约束条件,以至于几乎变成一个单一事件,那么必然遇到参照类问题。即便是通常不必考虑参照类选择的问题,也变得依赖于参照类,这使得问题复杂琐碎,重要的是原先的问题已经被修改,所以在实际应用上并无多大意义。比如我们掷色子的时候不会考虑色子的朝向问题,也不会考虑每颗色子会掉在盘子的什么具体位置,因为这些问题并不影响我们的游戏目的,也左右不了我们所要考虑的概率值,比如总共有几个一点或者几个六点。如此这般地构造参照类问题的方法就是把通常的概率问题具体化,加上一个个另外的维度使得参照类问题变得明显。而其中所隐含的参照类的意义其实就是赖兴巴赫给定的那种意义——参照类问题针对于具体的问题,如:约翰逊,一个70多岁的澳大利亚人,将活到81岁的概率是多少?而这类问题和无差别原理的应用带来的概率多值问题属于不同的两类问题。其中共同之处或者仅仅在于,概率是变化的,没有固定值的,相对的;不存在原先绝对的概率。如果考虑卡尔纳普对逻辑概率所做的工作,——前期的C函数理论和后期的C[λ]函数理论,那么概率相对性的表现可以粗略地概括为:逻辑概率依赖于描述的语言,依赖于前提假设,依赖于证据,或者依赖于λ值的指派。但是,如果把这些特性都称之为参照类问题,(其中也包含无差别原理的应用带来的概率多值问题),那么参照类问题的含义就显得过于宽泛,以至于完全失去了原先赖兴巴赫所给定的那种意义。

三、参照类问题与概率的相对性

上文讨论了所谓的几种不同版本的参照类问题。我们认为不能把概率的相对性问题等同于参照类问题。相对概率是和绝对概率而言的;而概率值依赖参照类的选择而变化只是概率相对性的一种。

参照类问题在最原先的意义上,也就是赖兴巴赫给出的表述:对于具体的事件,单一事件,可以归为不同的参照类中,所以有不同的概率取值。事实上,对于某些事件,参照类的选择往往比较简单以至于根本不是问题。比如,打牌的概率,掷色子的概率。我们并不否认,其中存在的概率的相对性,比如某一次打牌,某一次掷色子,依赖于某个人,某个场景。但是我们不必囿于此类描述,因为完全可以采用更确定的方法,比如,在电脑上打牌,电脑其实完全知道全部的排列,以至于每张牌出现的概率都是确定的。

于此,本文指出:参照类问题实际上主要源于哲学上个与类的关系问题;而不在于相对与绝对的关系问题。当然不否认这两组关系之间的联系;相反,正是因为这两对范畴间有密切的关系,所以凸显出了个体事件的概率的相对性问题。但是我们认为除了强调参照类问题的相对性以外,问题可以主要地通过个与类的范畴来分析。

在上述例子中,我们学到了哈耶克在古典解释的有限样本的问题中找出参照类问题的方法:加上额外的更具体的维度,使得原先的样本空间发生变化,从而使得参照类问题变得显然。简单地说,影响因素越多,事情越具体,参照类问题就越明显。所以,当考虑单一事件的情形时,问题中就会出现专名的描述,比如某次试验,某个人的事件,或例子中的约翰逊。而它们的特征可以用摹状词来描述。借于专名和摹状词之间的关系,有理由认为,参照类最为有效的作用在于对确定单一事件概率值的影响。而对于类事件,在实际活动中往往可以忽略其个性差异而将其作为一类事件来考虑。也就是说,我们还是倾向于选择某一个参照类作为理想的情形。比如抛硬币的例子,只要是理想的硬币,总是能找到一个参照类。而哈氏通过强调这个参照类是相对的,从而否认有这么一个理想的或者最优越的参照类的存在。理由是由于概率的相对性,不存在一个最优越的参照类,就像相对论中惯性系的相对性一样。而他没看到,相对性存在的原因是在于个体和类的差异。这就是为什么赖兴巴赫的给出的表述和哈氏给出的其它版本的表述之间不连贯的原因;共同之处仅仅在于相对于不同的东西(‘不同的东西指称十分晦涩,可以是参照类,样本空间,描述的语言,前提假设,证据等等),有不同的概率值。而这些不同的东西之间除了相对性这一特征以外,并不存在多大程度的共同之处。尤其是如果把它们都放在参照类的名下,那么这个名词会太臃肿而显得过于宽泛了。

反之,假如参照类问题无处不在,因为概率本身就是相对的,而他认为在认识论上仍然保留参照类问题,也就是说,参照类在认识论上仍旧是有意义的,其实这体现出他对概率的主观主义解释的无奈。因为提倡概率的纯粹主观主义解释的极端分子根本就不需要任何约束来给出概率值,甚至只要逻辑上连贯,可以不顾事实。事实上,如吉利斯(Donald Gillies)认为的那样,主观主义概率,适合于单个事件……”([6]p.186)换言之,主观主义的概率观对于单个事件解释不会遇到频率解释的那样经典的参照类问题。如果概率是纯粹主观的相对的判断,那么参照类对主观主义并不构成问题,因为这里并不存在参照类问题。

四、结语

哈耶克认为承认概率的相对性,能在本体论上消解参照类问题。因为参照类问题其实无处不在,这意味着参照类问题不是一个真正需要解决的问题。但是,参照类问题无处不在这一结论已经在题设之中。因为承认了概率的相对性,更因为我们发现他所理解的相对性参照类几乎是意义相同的一对概念。这种理解视角的确拓展了参照类的含义,但是这使得含义过于宽泛而掩盖了参照类问题的关键,即个体与类事件的关系,特别是因为其中包含了无差别原理的应用带来的概率多值问题。

【注释】

无差别原理的应用会碰到一系列的问题。

给定一个正方形,假定边长从(01)之间任意取值。如果边长的值取在(01/2)之间,那么相应的面积取值应该在(01/4)(因为面积等于边长的平方)。而假定边长从(01)之间任意取值,那么边长的值取在(01/2)之间的概率就是1/2。根据无差别原理,相应的,也就是面积值取在(01/4)的概率也就是“1/2”。然而,如果边长可以从(01)之间任意取值的话,那么面积也是在(01)之间任意取值,而它取在(01/4)之间的概率等于“1/4”——根据无差别原理。这和前面所得的“1/2”这一结果相矛盾。无论如何,总之我们能根据不同的依据来得到不同的概率,也就是根据不同的参照类得到不同的概率值。于是,Hajek就认为古典概率的解释也要面对参照类问题。

有一种酒精和水的混合物,我们只知道它们的比例在1/33之间,即1/3≤/≤3,应用无差别原理P(/≤2)=(2-1/3)/(3-1/3)=5/8;但是,1/3≤/≤3,再次使用无差别原理P(/≤1/2)=(3-1/2)/(3-1/3)=15/16,而其中P(/≤2)=P(/≤1/2),而这两个的答案却是不相等的。

问题表述为:圆的任意一根弦比它的内接正三角形的边长长的概率是多少?”这个问题已经被Jaynes早在1973年的时候澄清了。

【参考文献】

[1]James, F. , Feature Selection Methods For Solving the Reference Class Problem: Comment on Edward K. Cheng, A Practical Solution to the Reference Class Problem[J]. Columbia Law Review Sidebar, 2010, 110: 12-23.
[2]Hájek, A. , The Reference Class Problem is Your Problem Too[J]. Forthcoming in Synthese, 2006,
转引自http://philrsss.anu.edu.au/people-defaults/alanh/papers/rcp_your_problem_too.pdf.
[3]Keynes, J. M. , A Treatise on Probability[M]. London: Macmillan and Co. , Limited, 1921, 47.
[4]Jeffrey, M. M. , Dissolving the Wine/Water Paradox[J]. Brit. J. Phil. sci. , 2004, 55: 137-145.
[5]Jaynes, E. T. , The Well-posed Problem[J]. Foundation of Physics, 1973, 3: 477-492.
[6]Gillies, D. , Philosophical Theories of Probability[M]. London: Routledge, 2003: 186.

(原载《自然辩证法通讯201401期。录入编辑:里德)