溯因:最佳解释的推理,本文主要内容关键词为:,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B812.23 文献标识码:A 文章编号:1673-7059(2010)11-0039-07
溯因推理作为发现与解释的一种最佳方法,日益地被运用于科学的各个领域,包括机器的故障检测、理论的建构、行为理论、知识更新以及逻辑编程等方面,引起了国外哲学、逻辑、认知与计算机学界的极大关注。特别是近几年,对于溯因推理的研究,由以前单纯哲学角色的探讨向多角度、多层次发展,开启了溯因研究的一些新思路,主要体现在:1.溯因的逻辑研究,为溯因提供结构模型,刻画溯因是如何进行的。2.溯因的计算研究,为溯因的执行提供逻辑程序,刻画溯因解释是怎样产生的。3.溯因的认知研究,把溯因看成一个信念修正的认知过程,刻画溯因是如何使信念发生变化的。4.日常与实践推理的溯因,处理在复杂真实生活中充满高度不确定性因素的不完全证据,比如策划与决定、检测与诊断等。本文主要考察溯因的逻辑特征以及对溯因的逻辑处理,尝试对其进行深入的探析,以期能够引起国内学者对其更多的关注。
一、溯因的逻辑特征
著名哲学家皮尔士(C.S.Peiree)首先提出溯因,探讨了溯因的性质与特征,给出了溯因的逻辑形式,并把其纳入与演绎推理、归纳推理并列的推理范畴之内。但是他的溯因是一个很难揭示的概念,一方面,这个概念是与他哲学的其他许多方面纠缠在一起的;另一方面,从他这一思想里发展出了几种不同的溯因观念,比如因果溯因、归纳溯因、统计溯因等。即使在当前对于溯因逻辑特征的认识也存在不同视角与进路,如何揭示与看待溯因的这些逻辑特征就成为我们首先不得不面对的问题。
(一)溯因:结果还是过程
溯因可以被看成是一个完成的结果(溯因解释),也可以被看成是一个导致溯因解释的行为(溯因过程)。这两种使用是完全不同的,一个是静态的,它关注溯因之后的情况,即溯因之后有什么结果?这个结果合理吗?一个是动态的,它关注溯因之中的情况,即溯因是如何进行的?这个过程是怎样的?如开普勒的溯因解释“行星的轨道是椭圆的”,证实了被观察的事实,但是不涉及他如何制造这个发现的溯因过程。发现常常被看成是纯心理的,认知心理学家研究发现的心智模式(溯因研究的认知途径),而逻辑学家与计算数学家则往往研究假设如何产生的形式模型,从而制造溯因解释(溯因研究的逻辑途径)。逻辑学家贝思(E.W.Beth)[1]和范·本特姆(J.Van Benthem)[2]都分别对溯因进行了结果一过程的区分,认为对于两者的区分可以通过如下程序得到:(1)把需要的假设制造为前提的证明—发现过程(制造前提);(2)依次产生一个证明作为逻辑论证,从而证明想要定理的真实过程(证实过程)。
但是两者之间又是紧密相连的,一个溯因过程制造一个溯因解释作为它的结果,一个溯因解释是解释论证中的一个元素,它是一个溯因过程的一个结果。溯因解释一旦被制造,它又成为证实的对象,它必须能够被独立的逻辑标准所检验与证实。
从结果—过程本身以及两者相互关系出发,都会导致一些令人感兴趣的问题,比如,如果是完成的结果,则关注能够给出信息解释力的条件,采用非单调性推理进行处理,为其提供结构模型;如果是过程,则关注其改变信念的动态性,采用动态逻辑与信念修正逻辑进行处理,为其提供逻辑程序与数学设计;如果是两者的关系,则关注其可检验性与可证实性,为其提供检验与证实的标准与途径。
(二)溯因:建构还是选择
溯因有两个认识方面的意义:一是激发合理性假设的溯因,也即创造与建构的溯因。创造性溯因要处理的是知识增长的问题,因为得到的结果超越或扩充了前提中的信息。一是最佳解释推理的溯因,也即选择与评估的溯因。选择性意指试图制造供进一步检验的一些假设,以利于有机会证实这些假设是最好的。一个事实常常有几个可能的溯因解释,但是仅仅有一个或者几个能够是最好的。比如,当我走进房间,开灯但灯不亮,房间漆黑一片。按照常识,有几种溯因解释:电线坏了、电闸切断、灯泡损坏等。但是仅仅一种可能是被看成是这一事件的最好解释,即真正造成这一事件的那个解释。一些人把溯因看成一个单一的过程,通过这一过程最好的解释被建构。而其他一些人认为其是独立的两个过程,溯因建构处理哪些能被看成是可能的解释,即创造出可能性的解释;而溯因选择处理如何运用一些选择标准于可能解释,对可能解释进行评估,进而得到最好的解释。
如果从溯因的建构出发,则关注建构的路径,当前对于溯因的建构主要有三种路径:一是利用因果理论来对溯因进行建构,把假设与解释两者之间的关系看成是因果推理关系。A.Darwiche和J.Pear首先讨论了溯因与因果的密切关系,指出很多溯因中的假设与解释之间的关系就是结果与原因之间的关系,可以通过条件因果形式来进行阐释。[3]A.Bochman认为能够根据因果推理为溯因提供相似的描述与表达,并据此给出了一个初步的溯因系统与溯因语义。[4]二是采用演绎附加条件的方法来对溯因进行建构,为经验的溯因解释提供模型。最著名的就是C.Hempel的两种演绎—规律模型(DS)和P.Oppenheim提出的演绎—统计模型(D-S)。三是把溯因建构看成是信念修正的过程,利用信念修正的理论来处理溯因。C.Boutilier和V.Becher于1995提出可以利用人工智能里AGM理论来表征溯因建构过程,并为溯因过程中单个主体的认知状态的修正问题提供了模型。[5]2009年L.Magnani在其著作《溯因认知—假设性推理的认识与生态认知维度》里全面地从认知角度探讨了溯因中主体的认知变化以及其模型的问题。[6]
而溯因选择则注重选择标准的探究,即通过什么标准能够从可能性解释中筛选出最好的解释。当前普遍认为简单性标准(simplicity criteria)与可信性标准(plausibility criteria)是衡量溯因解释“好坏”的最基本的标准。除此之外,计算机学家D.B.Leake还提出了基于消耗的标准(cost-based criteria)和基于目标的标准(goal-based criteria)[7]。
(三)溯因:归纳还是其他
我们在阐述归纳与溯因的时候,常常把两者混合在一起。哲学家穆勒(J.S.Mill)在讨论归纳的时候,认为只要是从个别事例到一般性质的和从事实到因果假设的推理都可称为归纳。[8]他实际上把所有非演绎的推理(non-deductive reasoning)都归入归纳,比如归纳概括、解释归纳与统计推理等。哲学家塔家德(P.R.Thagard)也持同样的观点,认为只要是知识性扩展的不确定性推理都应该算作归纳。[9]即使到现在很多学者也一般把可能性的推理纳入归纳推理,比如AI领域的学者沙比罗(E.Shapiro)、弗兰奇(P.Flach) 和考考什(A.Kakas)。而溯因往往是与确证(假设的证实)和可能性(可能性的选择)紧密相连的,若按此说法很自然地就应该把溯因看成是归纳的一种特例。
把溯因看成是归纳的特例,对溯因的处理必然会参照归纳的方法。的确,在目前不少有关溯因推理的文献中,借鉴了归纳处理的方法,比如演绎—规律(deductive-nomological)、归纳—统计(inductive-statistical)等。但是皮尔士(C.S.Peirce)之所以将溯因纳入与演绎推理、归纳推理并列的推理范畴之内,说明溯因除了具有与归纳的这些纠缠性之外,它自身还具有有别于归纳的诸多特征。溯因是从观察出发,发现最佳解释的推理,关注的是假设与解释之间的关系,是一种“解释的推理”(explanatory reasoning),因此从更广泛的视角来看,溯因应该超越归纳特例的局限。墨西哥哲学家安利斯达(A.Aliseda)就认为把溯因与归纳区分来看是必要的,溯因是从单个的观察到它的溯因解释的推理,解释的是单个的观察,不再解释之后的观察,而且依赖于背景理论来建构和证实它的溯因解释;但归纳是从事例到一般性陈述的枚举归纳(enumerative induction),解释一组观察,对进一步的观察作出预测,并且不需要背景理论。[10]
二、基于逻辑的溯因
(一)溯因的逻辑参数
溯因推理是非单调推理(non-monotonic inference),它是根据当下所拥有的不完全的信息来做出最可能的解释,但是最可能的解释不一定是必然正确的,如果后来被证明是不适当的或不正确的,那么就会对解释进行修正或者撤销。对溯因的逻辑处理,依据其非单调性,可采用“后向演绎加附加条件”(backwards deduction plus additional conditions)的处理办法,其逻辑形式如下:
被给的一个理论θ(一公式集)和一公式β(一个原子公式),α是一个溯因解释,如果:
1,θ∪αβ; 2,α与θ是一致的。3,α是最小的(或者最简单的)。
4,α有一些被限制的句法形式(通常是一个原子公式或一个它们的合取)
如果附加条件不明确则θβ,这就是说被解释的事实不能单独从背景知识得出,有时附加的条件是溯因问题的先决条件。在溯因的逻辑形式中,θ∪αβ被看做是三重关系,以对应于溯因的过程:背景知识θ和被给的观察β作为输入,被制造的一个溯因解释α作为输出。而决定这三重关系的是三个主要的逻辑参数:
2、不同的动机。根据皮尔士(C.S.Peirce)的观点,溯因推理被一个令人惊奇的现象激发,但是惊奇是一个相对的概念,令我惊奇的东西可能不是令他人惊奇的,一个事实β是令人惊奇的,仅仅是根据一些背景理论θ提供了某种“期望”。令人惊奇的事实需要一种解释,而不是断定了事实已经被背景理论所解释了(θ∶θβ)。因此从逻辑的角度来看,我们不仅需要考虑β的肯定状况,也需要考虑β的否定状况,在这个意义上说溯因至少有两种不同的动机:新奇(novelty)和异常(anomaly):
新奇是一个溯因的条件,激发溯因问题,当然并不否认非惊奇的事实也能成为溯因解释的对象,因此一个基于θ的可能事实需要综合考虑这些状况的溯因解释。
3、不同的结果。 溯因解释本身以不同形式出现:事实、规则甚至理论。有时一个简单的事实就能解释一个令人惊奇的现象,如下雨就能解释为什么草地是湿的;有时具有因果关系的一个规则也可能成为一个溯因解释,比如云的类型与下雨;而在科学上的许多溯因提供新的理论来解释令人惊奇的事实。这些不同的选择有时为同一个观察而存在,这取决于我们想如何理解它。但是下面主要从溯因的逻辑结构规则的角度,用原子事实、它们的合取以及简单的条件形式来考虑溯因解释。
(二)溯因的逻辑结构类型
根据溯因的逻辑结构规则的不同,把溯因分为下面五种类型的:清晰性的(plain)、一致性的(consistent)、解释性的(explanatory)、最小性的(minimal)、偏好性的(preferential)。
1、清晰性的
清晰性以集合描述的方式明确了什么样的推理是溯因,是成为溯因的一个最基本的条件,它定义了一个表达三角(θ,α,β)。θ是理解相关背景知识的理论,常看成为公式的集合;β是令人惊奇的观察,用一公式表述;α是一个解释,解释观察。
清晰性最早来源于C.S.Peirce的描述,“令人惊奇的事实(fact)C被观察到,如果A是真的时候,C也当然是真的,那么就有理由得到A也是真的。”[11]C.S.Peirce虽然区分了演绎、归纳与溯因,但在对溯因进行描述的时候是从单个的具体事例出发,借助于逆向演绎来定义溯因。C.G.Hempel在C.S.Peirce观点的基础上,提出了溯因的演绎—规律解释,他认为如此的解释由某些特殊的事实(specific facts)和一般的科学规律(scientific laws)构成,并一起演绎地蕴涵一个被给的观察。[12]在C.G.Hempel这里,虽然也是用演绎的方式进行描述的,但他提到的溯因是多个事实与多个规律构成,因而已经具有一种普遍的集合特性。正是由于这个原因,现在很多AI学者普遍根据C.G.Hempel的科学解释理论,采用集合表述的方式处理溯因。
2、一致性的
因此必须要对这些失效的规则增加一些限制,这样才能使一致性溯因有效:
逻辑学家里特(R.Reiter)在对诊断性问题进行研究的时候,首先讨论了一致性的溯因[13]。他认为一个诊断问题的解决可以被映射为一个溯因解释的问题,当一个系统失常则部件之间存在不一致,当系统正常则部件之间一致,因此可以用溯因的一致性来进行刻画。他随后用一阶形式语言为一致性溯因建立了结构模型。2006年安利斯达(A.Aliseda)在里特(R.Reiter)的一致性溯因基础上讨论了一致性的规则问题,并对一致性溯因中的这些规则的可靠性与完全性进行了证明,[14]从而使这三个规则保证了溯因前提的一致性。
3、解释性的
θ∪αβ,当且仅当:θ,αβ,并且θβ,αβ
解释性的溯因被定义为清晰性溯因加两个条件:必要θβ和非充分αβ。对于解释性溯因的探讨有两个方向:一是解释性较强的,这就涉及溯因解释的选择问题;一是解释性较弱的,最基本的解释性溯因。从技术性的角度来看,对于解释性溯因进行规则的分析还是比较容易的,只需要对一些规则进行限制与增加:
解释的单调性陈述了当我们加强一个事实的解释时,只要背景理论没被改变,它就不可能是无效的。但当我们把一个公式加入理论中,即:
这个推理就是无效的,对于理论的单调性是不成立的。自返性与消除性对于较弱的解释溯因来说是完全有效的,体现了这种溯因最基本的特征。除此之外,经典的收缩(contraction) 和置换(permutation)性质依然成立。
4、最小性的
溯因程序的结果是一组可能的解释,这些可能的解释完全可能是大量的,为了获得最好的解释,就有必要消除一些可能假设。这里就存在选择标准的问题,即如何选择才能决定最好的解释。当前的偏好型选择标准主要是基于:第一、简单性标准;第二、解释关联性标准。
虽然只要满足这三个条件就体现了奥卡姆剃刀的要求,但是在更深的层面来说,还是不够的。D.E.Appelt和M.Pollack认为还应该考虑两个条件:整体性标准(global criteria)和局部标准(local criteria)。[17]他的整体性标准是指对基数对比(cardinality comparisons)、最少推定解释(least presumptive explanations)和最小失常性(minimal abnormality)从一个整体的角度来考虑,而局部性标准则是指利用贝叶斯统计法(Bayesian statistical methods)、加权溯因法(weighted abduction)和基于消耗的溯因法(cost-based abduction)来提出一个最好的假设。
到目前为止,还没有发现有效的偏好性结构规则,主要原因在于公式中的关联偏好序,这种关联偏好序本身就需要借助结构规则来进行理解。对于偏好性溯因来说,下面一个单调性形式是有效的,但它已经不再是一个结构规则,因为在它里面加入了一个数学关系符号(“<”表示偏好序),而不能借助于后承关系一般性地表达。
三、问题与挑战
溯因的确定性低而非单调性高,这就使对它的逻辑处理变得比较的困难,同时溯因的解释与假设的后承关系在结构形式上也有许多不同于经典逻辑,但是它还是有清晰的推理结构。虽然我们不能直接使用经典逻辑的一些结构规则于溯因,比如自返性、单调性和消除性等,但我们可对经典逻辑的结构规则进行一些变化或者添加一些条件来处理溯因,如何进行变化?添加一些什么条件?当然这对于逻辑学家来说是一个新的挑战。
另一方面,由于溯因解释的可能性与复杂性,能否对溯因进行系统化的逻辑处理也是不得不面对的向题。计算机学家G.Nordh和B.Zanuttini用一种固定的加以限制的逻辑语言初步地建立了一个命题溯因逻辑系统,但是他也不得不承认要对溯因进行像经典逻辑那样系统化的处理总是很难的。[18]虽然在计算机界对溯因的逻辑—计算的形式处理关注较多,也提出了较多的处理思路,但是到目前为止,还没有能够建立一个比较成熟的令人满意的溯因逻辑系统,这对于逻辑学家和计算机学家来说确实是一个比较难的挑战。
收稿日期:2010-07-25