归纳接受与知识_期望效用函数理论论文

归纳接受与知识,本文主要内容关键词为:归纳论文,知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B812.3 文献标识码:A 文章编号:1000-7660(2006)02-0120-06

英国经济学家凯恩斯在《论概率》一书的开篇中写道:“我们的知识,部分是直接获取的,部分是由推理论证得到的。”[1] (P3)推理分为演绎推理和归纳推理。在日常思维和科学研究中,人们广泛运用归纳推理来扩充知识。归纳推理是或然性的,前提真并不能保证结论真,因此,根据什么规则把归纳推理的结论纳入我们的知识集合,成为归纳逻辑研究中一个无法回避的问题。

按照凯恩斯的设想,概率逻辑与人们用归纳推理建立的知识有关。但是卡尔那普和杰弗里(R.Jeffrey)却拒绝谈论接受归纳结论的问题,他们认为,对于一个命题所进行的归纳推理,不是导致对这个命题的接受或者拒绝,而是给它指派一个置信度的值(概率),在决策的时候,人们可以用这种概率来计算行动方案的期望效用。

有许多学者对归纳接受的规则以及归纳接受与知识的关系进行了深入的研究,本文介绍有代表性的接受理论,并且指出归纳接受问题对归纳逻辑发展的影响。

一、概率接受规则与抽彩悖论

齐硕姆(R.M.Chisholm)在讨论与知识相关的各种认知概念时涉及到归纳概率和假说的接受问题。他这样定义知识概念:“S知道h是真的”,其意思是:(ⅰ)S接受h;(ⅱ)S对h有适当的证据;(ⅲ)h是真的。在齐硕姆的理论中,“S对h有适当的证据”常被简略地说成“S对h有证据”,它蕴涵“S接受h”。因此,只需要明确“S对h有证据”成立的条件就可以知道“S接受h”的条件。

按照齐硕姆的定义,“S对h有适当的证据”意思是,S接受h是没有根据的;“S接受h是没有根据的”意思是,对于S而言h比h更值得相信。可以看出,齐硕姆所说的“S对h有适当的证据”是在一种较弱的意义上使用的,只要S对h的相信超过他对h的相信,则S就对h有适当的证据。齐硕姆讨论了概率与证据之间的关系。他使用的是卡尔那普的归纳概率概念。齐硕姆说,如果一个假说相对于一个人的全部证据具有大于0.5的概率,则这个假说是有证据的。齐硕姆没有直接讲述概率与接受的关系。不过根据“S对h有证据”蕴涵“S接受h”的关系可以得知,在这种情况下,S可以接受h。

亨普尔也讨论了归纳接受和知识的问题。他并不要求表达科学知识的陈述是真的,而是“把科学知识解释为在给定时刻为适当的科学程序所保证的被接受的信念的总和。”[3] (P150)他用一个集合K表示某个科学家在给定时刻t所具有的全部知识。

亨普尔把归纳接受问题看成风险型的决策问题。对于一个假说h,是接受它,拒绝它,还是悬而不决,是特殊的科学研究的抉择,这种选择有三种可能的结果:K由于加入h而得到扩充;K由于加入h而扩充;K没有变化。现在需要给出这三种结果的效用的测度,亨普尔把这种效用称为科学效用或认知效用。

把h加入K的认知效用首先取决于h是真还是假,此外还取决于h含有多少新的信息。亨普尔让e是这样一个语句,一方面e为集合K所逻辑地蕴涵,另一方面,e蕴涵K中的每一个语句。这就像几何学中各个公理的合取蕴涵几何学中所有的公理和定理一样。于是语句e所具有的信息与集合K所含的信息相同。假说h所包含的超出K的信息用(h∨e)表示。

亨普尔提出了一种关于认知效用的尝试性的测度:把一个假说h纳入原有的知识的集合K,如果h是真的,则其认知效用为m(h∨e);如果h是假的,认知效用为-m(h∨e);拒绝h等于接受h,如果h为真,则其认知效用是m(h∨e),如果h为假,认知效用是-m(h∨e);如果是悬而不决,K没有发生变化,认知效用为0。像风险型决策一样,亨普尔考虑了三种方案的期望效用。计算一个行动方案的期望效用,除知道相应的结果的效用外,还需要知道结果的概率。相对于知识集合K,假说h为真的概率是P(h/e),h为假的概率是1-P(h/e)。

很容易证明,当P(h/e)=1/2时,三种行为的期望效用都是0;如果P(h/e)>1/2,接受h的期望效用超过另外两个期望效用;如果P(h/e)<1/2,拒绝h的期望效用大于其它两个期望效用。亨普尔根据最大期望效用原则得出了一个尝试性的归纳接受规则:给定K,如果P(h/e)>1/2,则接受h;如果P(h/e)<1/2,则拒绝h;当P(h/e)=1/2时,h可以被接受,被拒绝,或者悬而不决。显然,这个接受规则与具体的信息测度函数根本没有关系。

齐硕姆和亨普尔提出的归纳接受规则实际上只依赖于假说相对于证据的概率,这种规则被称为概率规则。

规则1(概率接受规则)根据证据e,假说h被接受,当且仅当P(h/e)>1-ε,0<ε≤0.5。

亨普尔在讨论归纳接受问题时还提出,科学知识的集合应当是一致的,不能含有矛盾;知识集合应当是演绎封闭的,也就是说,以被接受的命题作为前提进行演绎推理,其结论也应该是被接受的。

然而同时承认概率接受规则和演绎封闭条件会导致接受不一致的命题。按照概率论的乘法定理,当两个命题之间没有逻辑推论关系时,这两个命题的合取的概率小于其中任何一个命题的概率。假设我们有n个假说h[,1],…,h[,n](它们之间没有逻辑推论关系),并且有:

现在把这些假说合取在一起,如果假说的数量足够多,则存在着这样的可能:

在这种情况下,按照概率接受规则,根据证据e应该接受每一个假说h[,i],同时接受每一个假说的否定的析取h[,1]∨…∨h[,n]。由于假说h[,1],…,h[,n]的合取h[,1]∧…∧h[,n]是由这些假说组成的集合逻辑地推出的,这就使我们处于这样的境地:如果我们不接受这些假说的合取,我们会违反演绎封闭条件,因为这个条件要求我们接受已被接受的命题所组成的集合的逻辑结论;如果我们接受这个合取,我们将接受互相矛盾的命题,因为所有假说的合取与每个假说的否定的析取是矛盾的,这样我们就违反了一致性条件。可见,如果采用概率接受规则,就会违反亨普尔提出的条件。

由概率接受规则和亨普尔条件所造成的这种矛盾被凯伯格(H.E.Kyburg)称为抽彩悖论。例如,在一次公平的抽奖活动中共有n张彩票,其中只有一张中奖。每张彩票中奖的概率都是1/n。设n=1000000,令h[,1],…,h[,n]分别表示命题“第1号彩票中奖”,…,“第n号彩票中奖”;令e是对上述抽奖条件的描述。由这些条件可以得知,[P(h[,1]∨…∨h[,n])/e]=1,即至少有一张彩票中奖,并且对于每一张彩票,都有P(h[,i]/e)=0.000001,因此,P(h[,i]/e)=0.999999(1≤i≤n)。现在让ε比1/n略大,比如让ε=0.000002,于是接受h[,i]的临界值为0.999998。根据概率接受规则,应当接受每个h[,i]的否定,这意味着对于每一张彩票我们都接受它不会中奖。同时应当接受所有hi的析取,这表明我们接受这些彩票中有一张会中奖。从被接受的所有h[,i]组成的集合中可以推出它们的合取“所有的彩票都不会中奖”,这与已经接受的“有一张彩票将会中奖”相矛盾。

抽彩悖论形象地说明概率接受规则与亨普尔的条件之间存在着不协调的地方,这个悖论也叫做凯伯格悖论。解决这个悖论是归纳接受理论中的一个重要问题。

二、解决抽彩悖论的尝试

凯伯格主张削弱亨普尔的演绎封闭条件和一致性条件,保留概率接受规则。凯伯格的弱演绎封闭条件是说,知识集合K中每一单个语句所蕴涵的语句都是被接受的;凯伯格的弱一致性条件要求集合K中不应包含互相矛盾的语句,但不要求从K中语句的合取中不应推演出矛盾。概率接受规则既满足弱演绎封闭条件,又满足弱一致性条件:如果语句h[,2]为h[,1]所蕴涵,则h[,2]的概率至少与h[,1]一样高,如果h[,1]被接受,h[,2]也会被接受;如果语句h的概率大于0.5,则h的概率小于0.5,如果h被接受,则h不会被接受。

由于归纳接受的语句不是确定的真,凯伯格提出多层知识集合的构想,按照不同程度的“实践的确定性”定义了语句集合的等级。较低层次的集合包含较高层次的集合。最高层次的集合是由观察语句的集合以及逻辑与数学的真理组成的,这个集合中的语句具有最大的确定性。较低层次集合中的语句是根据这样的概率规则选定的:如果语句h相对于第n+1级的集合所具有的概率是(p,q),并且p≥r[,n],则h可以被接受进入第n级的集合。这里凯伯格使用的是区间概率(p,q),p是下限,q是上限,r[,n]是进入第n级集合所要达到的概率。

有意思的是,尽管凯伯格的知识集合不满足亨普尔的演绎封闭条件和一致性条件,但是抽彩悖论仍以一种奇特的方式出现在他的系统中。因为h[,1]→(h[,2]→(h[,1]∧h[,2]))是逻辑真理,按照凯伯格的规定,如果h[,1],h[,2],…,h[,n]属于第n层集合,则它们的合取属于第n-1层集合。如果K是最高层的知识集合,抽彩悖论将出现在比K低两层的集合之中。为了避免这种抽彩悖论,凯伯格不得不放弃了多层知识集合的构想,只保留两层集合。一个是由逻辑和数学真理以及观察语句组成的集合;另一个较低层次的集合,由达到一定程度概率因而被接受的语句组成。

芬兰学派的学者欣迪卡和希尔皮宁主张保留一致性条件和演绎封闭条件,对概率接受规则进行限制。他们利用欣迪卡建立的几个概率逻辑系统,在一个非常狭小的范围之内解决了全称假说的接受问题。

欣迪卡用一种简单的语言L[,∞][π]建立了概率逻辑的理论,他用“构件”这一概念来刻画世界的可能状态。构件是具有下面形式的语句:

用C[,w]表示构件,w是该构件中出现的Q谓词的个数。构件C[,w]是说,在论域中有并且只有这w个谓词是有例证的。在语言L[,∞][π]中,每一个全称事实句都能写成若干个构件的析取,用一个构件来表示的全称语句叫做强概括。

在欣迪卡建立的第一个系统中,所有的构件具有相同的先验概率,并且它们的概率之和为1。证据e报告说,观察了多少个体,这些个体分别具有哪一种Q谓词所表示的属性。令n是e中所含个体的数目,c是e中所观察到的Q谓词的数目。证据e会改变构件的概率。凡是与e相矛盾的构件都被证伪,它们的后验概率为0。其余构件C(c≤w≤K)是与e相容的,它们相对于e的确证度(后验概率)用贝叶斯定理计算。当n变的很大时,具有最高确证度的构件是C[,c],C[,c]中所包含的Q谓词恰好是证据e中观察到的Q谓词,换句话说,构件C[,c]恰好与证据e相符。欣迪卡和希尔皮宁希望接受的正是这个构件。为了使构件C[,c]达到接受所要求的确证度,需要对证据e中所包含的个体数目n做出规定,因为只有当n增大到一定程度时,构件C[,c]才会脱颖而出,一枝独秀。因此,欣迪卡和希尔皮宁所给出的接受规则为:

规则2(欣迪卡和希尔皮宁的规则)

根据证据e,假说h被接受,当且仅当:

(ⅰ)P(h/e)>1-ε,0<ε≤0.5;

(ⅱ)n>n[,0]。

n[,0]的具体值是由语言L[,∞][π]中Q谓词的总数K,证据e和构件C[,c]中所含Q谓词的个数c,以及ε的值决定的。由于系统中所有构件的后验概率之和为1,当构件C[,c]的确证度达到接受标准后,其余构件的确证度都不会达到接受的要求。采用这个规则,在系统中能够被接受的全称事实句有构件C[,c],还有以C[,c]作为析取支的那些全称语句。由这些语句组成的知识集合既是一致的,又是演绎封闭的。显然,欣迪卡和希尔皮宁所说的知识集合仅限于语言L[,∞][π]所能表达的语句。他们的接受规则不是纯概率的,而是加上了对证据数量的限定。

关于单称预测假说,欣迪卡和希尔皮宁给出的接受规则为:一个单称假说A(a)被接受,当且仅当相应的全称假说xA(x)被接受。根据这个规则,接受了语句“所有的乌鸦都是黑的”,才接受语句“下一只将要观察的乌鸦是黑的”。尽管某个单称预测假说h具有高于1-ε的确证度,但相应的全称假说未被接受,那么也不能接受h,接受这样的单称假说会导致抽彩悖论。

希尔皮宁从知识的角度为他们的规则做辩护。他认为,用关于未观察到的事件的单称命题来表达知识是不合理的,除非这些命题能够从已经被接受了的全称命题中推演出来,或者从哲学史上公认的原理中推演出来。希尔皮宁引用亚里士多德的话说:一个人只能具有一般的知识。[4] (PP.18-19)

三、认知决策理论与认知效用概念

莱维认为科学研究有两个基本目的:真和信息。追求这样的目的要冒风险,归纳接受问题可以看成风险型的决策问题。亨普尔最先提出了认知效用的概念,但他没有获得成功。莱维仿照贝叶斯决策理论建立了认知决策理论,对认知效用进行了深入的探讨。

在归纳逻辑的文献中,关于语句h的信息,有两种测度概念。一种是对数信息概念,用inf(h)表示:

inf(h)=-logP(h);

另一种内容信息概念,用cont(h)表示:

cont(h)=1-P(h)。

亨普尔使用的信息概念属于内容信息概念,准确地说,是增加的信息。亨普尔认为,一个假命题的信息量越大,其认知效用越低。如果一个人对真的并且有信息的答案感兴趣,但却被限制在假的答案中进行选择,按照亨普尔,他应该选择信息量最少的假说,莱维认为这样做违反直觉。笔者同意莱维的观点。设想警察局正在追捕一名在逃的要犯,一个举报说此人在广州,另一个举报说此人在广州或贵阳。如果事后得知两个举报都是假的,当时选择哪个举报认知效用更大,或者说损失更小呢?显然是选择信息量大的举报损失更小。使用内容信息的记法,亨普尔是把cont(h)作为接受h且h为真的认知效用,把-cont(h)作为接受h但h为假的认知效用。莱维则认为,接受h且h为假,其认知效用不是-cont(h),而是-cont(h)。欣迪卡等人的看法与莱维相同。

莱维没有使用上述两种信息测度,而是另外给出了一个测度函数。他认为科学研究是回答问题。在一定的背景条件下,研究者依据证据e对某个问题提出若干个可能的答案,这些答案是基本假说,它们组成一个集合U[,e],U[,e]={b[,1],…,b[,n]}。莱维把U[,e]叫做基本划分。对应于U[,e]有假说集合M[,e],M[,e]中的语句等值于U[,e]中i个元素的析取(1≤i≤n)。M[,e]中还有一个由U[,e]中所有元素合取而成语句。莱维的决策问题是,从集合Me中选出一个语句h[*],h[*]是基于e被接受的最强的语句。

莱维用一个归纳概率测度P来确定假说h[,i]的先验概率P(h[,i])和条件概率P(h[,i]/e)。他另外给出了一个测度函数m,m满足概率演算的公理,但它不是概率测度。用函数m来定义语句的信息。基本划分U[,e]中的每一个基本假说b[,i]具有相同的m值和相同的信息:对于每一个b[,i]∈U[,e],有m(b[,i]/e)=1/n,以及cont(b[,i]/e)=1-m(b[,i]/e)。

莱维认为,真语句的认知效用大于假语句的认知效用。如果两个语句都是真的,或者都是假的,那么其中信息量大的语句具有较大的认知效用。因此,假说h的认知效用是它的信息cont(h/e)的单调的增函数,莱维选择了最简单的线性函数。用u(h,f,e)表示基于证据e接受h且h为真的认知效用,用u(h,t,e)表示基于证据e接受h且h为假的认知效用。于是有

u(h[,1],t,e)-u(h[,2],t,e)

=u(h[,1],f,e)-u(h[,2],f,e)

=q(cont(h[,1]/e)-cont(h[,2]/e))(q是正数)。

如何选择效用的单位和零点是一个习惯问题。莱维让恒假语句的认知效用为0,让恒真语句的认知效用为某个正数s。他选择q+s为认知效用的单位,q+s=1。经过技术处理之后,得到计算假说认知效用的公式:如果假说h为真,则u(h,t,e)=1-qcont(h/e);如果h为假,u(h,f,e)=-qcont(h/e)。由此可以计算出接受h的期望认知效用:

Eu(h/e)=P(h/e)-qcont(h/e)(0≤q≤1)。

按照贝叶斯决策原则,研究者应当接受期望认知效用最大的语句,莱维的接受规则略有不同。

规则3(莱维的规则)对于U[,e]中的任一b[,i],如果Eu(b[,i]/e)<0(即P(b[,i]/e)<qcont(h/e)),则拒绝它;接受所有未被拒绝的基本假说的析取h[*]为基于证据e最强的语句。

莱维的接受规则被认为是用联合规则(rule for ties)补充了贝叶斯决策原则。规则中的q被称为谨慎度或冒险度。q越大,表明研究者为获取信息而甘冒更大的犯错误的风险;q越小,表明研究者越谨慎。

莱维的归纳接受规则是基于概率的,但不是纯概率规则,对于接受一个假说而言,并不需要它的概率高于0.5。这个规则综合了假说的信息量和概率,反映出研究者在真和信息之间的均衡。就抽彩悖论的具体例子而言,莱维规则得出的结果是暂不判断,即:如果所有的彩票以相同的概率被抽出,那么应当接受所有基本假说的析取;不会出现拒绝所有基本假说而接受“每一张彩票都不会中奖”的情况。

莱维规则遇到两个困难。其一,他在定义假说的信息时拒绝使用概率概念,假说的信息测度依赖于问题的形式以及对问题的基本回答,也就是说,依赖于基本划分。因此,可能会有一个假说,在同样的证据下,相对于一个问题和基本划分U[,1]可以被接受,而相对于另一个问题和基本划分U[,2]会被拒绝,这是非常违反直觉的。

第二个困难。使用莱维的规则会出现这种情况:有两个假说h[,1]和h[,2]。根据证据e,h[,1]被接受,h[,2]不被接受。h[,1]进入知识集合后也可以作为证据,这时根据证据e^h[,1],h[,2]可以被接受。这也违反了直觉。这个问题在归纳逻辑的文献中被称为“簿记问题”(the bookkeeping problem)。为此,莱维区分了一般的归纳接受和被接受为证据。但是他没有给出一个假说被接受为证据的明确的条件。

芬兰学派的学者也讨论了认知效用概念。希尔皮宁效仿莱维,设U是构件的集合,U={b[,1],…,b[,n]}。他像莱维那样引进一个冒险指数q(0≤q≤1),像莱维一样确定效用函数的零点和单位,但是采用内容信息概念作为信息测度函数。根据贝叶斯决策原则和联合规则提出下面的归纳接受规则:

规则4(希尔皮宁的规则)对于U中的任一构件b[,i],如果P(b[,i]/e)<qP(b[,i]),则拒绝它;接受所有未被拒绝的构件的析取作为基于e最强的语句。

这个规则是基于概率的,但不是纯概率的接受规则。它是根据假说后验概率与先验概率的关系来决定假说的取舍,体现了证据对假说的确证作用(是正相关,而不是负相关)。由于假说h的后验概率P(b[,i]/e)与假说的似然P(e/h)有关,而假说h的似然与证据e的先验概率之比P(e/h)/P(e)能够表现出假说h解释证据资料e的力量,因而这个规则也把假说对证据的解释力作为一种认知效用。希尔皮宁表明这个规则可以克服莱维规则遇到的两个困难。

四、接受问题对归纳逻辑发展的影响

归纳推理的结论进入知识集合时有一个“跳跃”过程,这种跳跃不是单纯凭借逻辑的力量实现的,还需要其他因素的支持。这些因素中最重要的是归纳结论的认知效用,包括信息量、解释力、简单性等等。价值因素在归纳推理和归纳认知过程中起着重要作用。因此,语义信息、认知效用、认知决策理论等成为归纳逻辑理论研究的重要的问题,

接受归纳结论要冒一定的风险,研究者不能保证进入知识集合的假说一定是真的。这种情况影响到人们对知识的看法。齐硕姆把知识定义为“被接受的有适当证据的真命题”。亨普尔对知识的要求比齐硕姆要弱一些,认为知识是被科学家所接受的推测真的陈述。以研究知识动态变化而著称的学者伽德福斯(P.Gardenfors)则把知识看成完全的信念:“当我说到某个具体的知识时,我是在完全相信的意义上使用‘知识’一词,而且我没有假设这个概念产生关于信念的真(the truth)的任何东西”[6] (P20)。知识概念中的“真”这种成分的地位被逐渐削弱,知识概念弱化为信念概念。

归纳接受的命题具有或多或少的不确定性,以这种命题为前提进行演绎推理,其结论所具有的不确定性是一个不能不考虑的问题。抽彩悖论突出地表现了这个问题。对于这个问题的处理大致可以分为两条路线。一条路线是莱维等人的做法:一个命题一旦进入知识集合就被当作真命题看待,不再考虑它的概率和不确定性。知识集合是一致的和演绎封闭的。当发现有新的观察命题或更有价值的命题与原来接受的命题相矛盾时,研究者再进行处理,可以对知识集合进行收缩,清除某个命题等等。70年代后期发展起来的信念修正的理论也可以归属于这类处理方式。另一条路线是亚当斯(E.Adams)的概率逻辑,这种逻辑研究在演绎推理的过程中前提的概率(或不确定性)是如何传播的,根据前提的不确定性来计算结论的不确定性,或者根据结论必须达到的概率限度来确定前提所必须具有的概率。对抽彩悖论的研究促进了归纳理论的发展。

标签:;  ;  ;  ;  ;  ;  ;  

归纳接受与知识_期望效用函数理论论文
下载Doc文档

猜你喜欢