归纳概率逻辑的研究进展_概率计算论文

归纳概率逻辑的研究进展,本文主要内容关键词为:研究进展论文,归纳论文,概率论文,逻辑论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔中图分类号〕B81  〔文献标识码〕A  〔文章编号〕1002-8862(2004)05-0021-05

归纳概率逻辑哲学主要关注的是对概率的各种解释。按照古典解释,概率与可能性是密切相关的,这样一来,概率就成了一种模态。对于像频率解释和性向(propensity)解释那样的客观主义解释来说,概率理论可以看作“机遇”的逻辑。按照主观主义(贝耶斯主义)的解释,概率是部分信念的逻辑。按照逻辑的解释,概率理论作为部分衍推(entailment)的逻辑,实质上是演绎逻辑的推广。近年来归纳概率逻辑研究的进展主要表现在:第一,在哲学方面,进一步发展了概率的主观主义解释,以下我们着重介绍这种进展;第二,在逻辑方面,提出了许多非科尔莫哥洛夫(Kolmogorov)公理系统,它们是“异常”(deviant)逻辑在归纳概率逻辑中的对等物。我们将扼要介绍这些新系统,着重介绍亚当斯式的“概率逻辑”,亦即在不确定推理中研究概率增殖(propagation)的理论。

一、概率的主观主义解释方面的进展

1.信念度。主观主义认为,概率可以看作信念度,或者称作置信(credences)。主观主义常被称为“贝耶斯主义”,这是由于贝耶斯定理在主观主义概率演算中通常起着重要作用,尽管这个定理本身对解释是中立的。不像逻辑解释(至少不像卡尔纳普最初构想的解释)那样,主观主义允许有同样证据的不同主体对同一假说可以合理地赋予不同的概率。

刘易斯(1998)对条件化给出了一个“历时的”(diachronic)荷兰赌论证:若主体的概率更新是由规则支配的,如果这种更新没有条件化,那么他就将接受(懂得所用规则的赌注登记者打的)一个荷兰赌。同等重要的是这样的逆定理:若主体的概率更新是条件化的,那么他就不可能接受荷兰赌(斯基尔姆Skyrms,1987)。

另一方面,正统贝耶斯主义则借助下列原则刻画:

(1)理性主体的“先验”(初始)概率符合概率演算。

(2)理性主体的概率借助(杰斐莱)条件化规则来更新。

(3)对理性主体没有任何进一步的约束。

一些学者批评正统贝耶斯主义对先验概率赋值的过分随意性。标准的辩护,例如豪森和乌尔马赫(1993)以及萨维奇(1954),则诉求著名的“向真收敛”(convergence-to-truth)和“意见的吸收合并(merger-of-opinion)的结果。粗略地说,他们的基本思想是,在长序列中,选择一个先验概率而不是另一个先验概率的结果具有概率1这种情况是要淘汰的。对证据的相继条件化将使一个给定主体最终收敛到真,假如没有先验地赋予真以概率0,而且后续的一系列证据足够丰富,开始时有分歧的主体最终就会取得共识。

3.对主观概率的进一步约束 针对准则(3),一些不那么允许随意赋值的贝耶斯主义者也要求一个理性主体的概率应是正则的,或者严格一贯的:若P(A)=1,则A就是重言式。范·弗拉森(1995)建议把理性意见的进一步约束称之为自反(reflection),它涉及某人自己未来置信的一种置信。以下是其形式表述:

这里的P是主体在时间t的概率函数。其思想是,当一切情况都很理想时,如果置信以一个理性学习过程的结果而出现,那么认识上的某种完整性就要求人们把自己未来的意见看作是值得信赖的。自反的更一般形式是由戈尔茨坦(Goldstein)(1983)提出的。

刘易斯(1986)提出了一个把客观机遇与合理置信联系起来的原则:

这里的(A)是A在时刻t的客观机遇,E是在时刻t“可接受的(admissible)(粗略地说,即没有给出关于A的实际真值的证据的)任何信息。例如,该原则说的是:相信给定这枚硬币是公平的,从而在下一次抛出头像的机遇在那时是,人们应该对这一结果指派的置信度为。另一方面,这一原则可以被看作是对作为一种理论特征的机遇所做的含蓄的刻画,而这种机遇的特定作用就是以这种方式约束合理的置信。

正统贝耶斯主义也一直被指责,说它的要求过分了:它对所有命题、逻辑全知者等等指派精确概率的要求一直被有些学者看作是不合情理的理想化。这就导致了对上述原则(1)和原则(2)的各种放宽。原则(2)可以被弱化,以容许除条件化之外的更新概率的其他规则——例如在相关约束条件下,修改使熵极大化的概率函数(杰恩斯,1968;斯基尔姆,1987);而另一些贝耶斯主义者放弃了概率更新完全由规则支配的要求,例如厄尔曼(Earman,1992)。值得注意的是唐纳德·吉利斯(Donald Gillies,2000)提出的概率的主体间性(intersubjective)解释,开拓了概率的哲学理论的新视野。

这些成果在很大程度上促使了一些非科尔莫哥洛夫式概率理论的诞生。

二、非科尔莫哥洛夫概率理论

由于抛弃了科尔莫哥洛夫公理系统的某个部分,不少学者因而放弃了对科尔莫哥洛夫概率演算做出恰当解释的追求。

1.抛弃西格马域子结构 法恩(Fine,1973)论证说,概率函数的域应该是西格马域的要求是过分的限制。例如,人们可能就种族和性别拥有有穷的达成共识的材料,它关于概率P(M),(亦即随机选定的某人是男人)和概率P(B)(亦即此人是黑人)拥有充分的信息。但不拥有关于这个人既是男人又是黑人的概率P(M∩B)的任何信息。

2.抛弃精确概率 每一科尔莫哥洛夫概率都是单独的数。但是可以想像一个主体的意见状态并不确定单独的概率函数,而是与这些函数的积相一致。在这种情况下,人们可以把该主体的意见表达为所有这些函数的集合。这个集合的每一函数都对应于一种合法地确定一个主体意见的方式。这种方法通常与区间值概率指派相吻合,但并非一定如此。库普曼(Koopman,1980)提出了“上界”和“下界”概率的公理,它可以看作是这种区间的终点。

3.完全抛弃数字概率 与迄今为止涉及的“定量的”概率相对照,法恩(1973)倾向于深入探讨各种比较概率的理论,以如“A至少像B那样概然(A≥B)”的陈述来举例说明这种概率。他提出了支配着“≥”的公理,探讨了比较概率能够以科尔莫哥洛夫概率表达的条件。

4.否定的概率和复数值概率 如迪拉克(Dirac)、威格纳(Wigner)以及费曼(Feynman)那样的物理学家更激进地主张否定的概率。费曼建议说,在一维标尺中粒子漫射具有一种给定位置和时间存在的概率,它由取否定值的一个量值给定。然而,依赖于如何对概率做出解释,人们想要说的是,这种函数与概率函数有某种相似性,但是当它取否定值时,这种相似性就没有了。考克斯(Cox)在连续时间具有离散状态的随机过程理论中容许概率在复数中取值。参见缪肯汉姆(Mückenheim,1986)。

5.抛弃正规化公理 概率函数可以取的最大值是1,看起来是约定俗成的。然而,这就有了某种并非平凡的后果。与其他公理配套,它容许概率函数至少取两个确定值,然而在有P(Ω)=0的配置时则不是这样的。更有意义的是,存在着一个最大值并非微不足道。其他如长度或体积的测度并不受此约束。实际上,雷伊(Renyi,1967)完全抛弃正规性假定,允许赋予∞概率“值”。

一些学者放松了经典逻辑对概率的约束,容许逻辑的必然真被指派小于1的概率——也许是因为逻辑的或数学的猜想几乎可以充分地确认。此外,公理(2)涉及了经典逻辑设定的“重言式”概念。非经典逻辑的拥护者也许想用他们青睐的“重言式”的“异常”概念(也许需要在公理化时在别的地方作相应的调整)。因此,构造主义者主张把概率理论建立在直觉主义逻辑的基础之上。

6.无穷概率 科尔莫哥洛夫概率函数取实数值。许多哲学家(例如,刘易斯,1986;斯基尔姆,1980)取消了这个假设,容许概率从一个非标准模型中取实数值(参见斯基尔姆,1980对这个模型的构造的分析)。尤其是,他们允许概率是无穷的:正数又小于每一标准实数。在无穷概率空间中的非空命题按照标准概率论通常会得到0概率,而这样一来指派正的概率实质上就会被认为是不可能的(考虑随机地选择来自[0,1]区间的一个点)。在不可数空间,正则概率函数不可避免要取无穷值。

7.抛弃可数可加性 科尔莫哥洛夫最有争议的公理无疑是连续性公理——例如,可数可加的“无穷部分”即是如此。他认为它对于使数学更为精致的理想化没有任何经验意义。如上所述,按照古典的、频率的、以及性向的解释,概率违反了可数可加性。德·芬内蒂(1972)安排了一组反驳这种观点的论证。其中一个代表性的论证是:可数可加性要求人们对事件的不可数划分指派极端的有偏分布。实际上,对于任何ε>0,无论多么小,都将存在有穷数量的事件,它具有至少1-ε的组合概率,从而使所有概率拥有最大的份额。

8.抛弃有穷可加性 甚至放弃有穷可加性的各种概率理论(所谓非可加性概率)也提出来了。登普斯特-谢弗(Dempster-shafer)理论是从一个识别标架Ω(假说的一个划分)开始的。对Ω的每一个子集,指派一个包含0和1在内的0与1之间的“质量”(mass);所有质量的和为1。然后按照下列规则定义一个信念函数Bel(A):对于Ω的每一子集A,Bel(A)是A的子集的质量之和。谢弗(1981)给出了这样的解释,假定主体将发现Ω上的某一命题,那么Bel(A)就是主体将发现A的相信度。Bel(A)+Bel(-A)不一定等于1;实际上Bel(A)和Bel(-A)从函数角度看是相互独立的。信念函数有许多与库普曼的下界概率相同的形式性质。蒙金(Mongin,1994)表明,认知模态逻辑与登普斯特-谢弗理论之间存在着重要的联系。

所谓“培根式概率”表示另一种背离概率演算的非可加性概率。一个合取式的培根式概率等于合取支的概率的最小值。这种“概率”在形式上类似于弗晰逻辑的隶属函数。科恩(Cohen,1977)认为它们对于测度归纳支持是恰当的,从而对评价法庭证据是恰当的。

要进一步了解非可加性概率理论,还可参见杰拉答托(Ghirardato)为含混背离(ambiguity aversion)建立的模型,沙克尔(Shackle)的潜在惊奇函数、杜波依斯(Dubois)和普拉德(Prade)的弗晰概率理论,施梅德勒(Schmeidler)和韦克尔(Wakker)分别提出的期望效用理论以及斯庞(Spohn)的非概率信念函数理论。

9.把条件概率作为初始项 按照概率理论的各种解释,概率陈述总有隐含的相对化。按照古典解释,它们是相对于所考虑的可能性集合的;按照逻辑解释,它们相对于一个证据陈述;按照频率解释,它们相对于一个参考类;按照性向解释,它们相对于一个机遇装置;按照主观解释,它们相对于某一时刻(可能有某种背景知识的)主体。这样一来,也许更为基本的概念应该是条件概率。

波普(Popper,1959)和雷伊(1970)并不是先对非条件概率加以公理化,然后据此定义条件概率,而是把条件概率作为初始项,并直接对它加以公理化。

麦吉(McGee,1994)表明,在某种重要的意义上,根据波普函数计算的概率陈述和根据非标准概率计算的概率陈述是可以互译的。

三、概率增殖:亚当斯的概率逻辑

如果一个有效论证的前提全都是确定的,那么结论也是确定的。另一方面,假设前提并不全是确定的,而只是有各种程度的概然性,那么怎样才能确定该结论的概率呢?或者假设,人们希望一个给定有效论证的结论的概率高于一个特定阈限,那么前提必须有多大概然性呢?这些问题是很关键的,因为在现实生活的论证中,人们通常对前提并不那么肯定,而重要的东西可能是人们如何才能认为其结论可信?“概率逻辑”是亚当斯(1998)对这些问题的形式研究——即关于有效推理中概率传递(或由此不传递)的研究。这种处理的框架如下文所述。

这种概率逻辑的标志是,传统上对前提和结论的关注被关于它们的概率关注所取代。这又反过来导出概率逻辑的非单调特征:一个开始被赋予高概率从而被接受的结论以后可以由于新证据的出现而不被接受。用以下公式定义一个语句的不确定性U(F)

U(F)=1-P(F)

概率逻辑中各种重要的结果根据不确定性而不根据概率可以更为方便地陈述。例如,有效推理的不确定性定理:一个有效推理的结论的不确定性不能超过前提不确定性之和。因此,当前提的不确定性之和大时,一个有效推理的结论的不确定性只能也是大的——考察一系列悖论,在这些悖论中,前提中许多小的不确定性的结论。尤其是如果每个前提都有不大于ε的不确定性,相对于有极大不确定性的结论,其不确定至少有1/ε。该定理对结论的不确定性施加了约束。在某些情况下约束能够实施。如果省略一个前提但其他前提不变的推理不是有效推理的话,那么就可以说一个有效推理的那个前提是本质的。

亚当斯称一个推理在概率上有效,当且仅当,对于任何ε>0,存在着δ>0,使得在任何概率指派下,按照这种指派每一前提有大于1-δ的概率,结论就有至少1-ε的概率。他对概率有效性加以解说的关键是他对条件句的处理。按照他的观点,一个条件句没有任何真值,从而不能由它的真之概率来构成涵义。然而条件句能清楚地描述为论证的前提或结论,而人们还是想去评价这些论证。这样一来,怎样确定条件句的概率呢?这就引出了另一个重要论题——条件句概率的问题。

从归纳概率逻辑研究的文献看,这方面的新成果大多数是最近几年的。它讨论的热点集中在概率的解释问题和非科尔莫哥洛夫概率理论方面,而且所讨论的问题实际上是原创性的。

标签:;  ;  ;  ;  ;  ;  

归纳概率逻辑的研究进展_概率计算论文
下载Doc文档

猜你喜欢