关于“酒—水悖论”的分析与解决,本文主要内容关键词为:悖论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:N031文献标志码:A 文章编号:1000-8934(2007)06-0020-04
1 酒—水悖论与无差别原则
酒—水悖论(the wine-water paradox)是由无差别原则(the principle of indifference)引起的,而无差别原则是确定基本概率的原则之一,它在概率论、统计学和现代归纳逻辑中占据重要的地位。
“无差别原则”这个名称得自于现代归纳逻辑的创始人之一凯恩斯(John M.Keynes),但是事实上这个原则几乎是伴随概率概念一道出现的。早在18世纪初概率论处于草创阶段,概率论的先驱者之一J.伯努利(Jakob Bernoulli)就把它命名为“不充分理由原则”(the principle of non-sufficient reason)。大约一个世纪以后,古典概率论的集大成者拉普拉斯(Pierre S.Laplace)把它正式地作为概率论的理论基础。
古典概率概念是以“等概事件”(equally possible cases)为初始概念的,古典概率的定义是:P(A)=m/n,意为:事件A的概率等于A所包含的m个基本事件在全部n个基本事件中所占的比例,而基本事件的概率是相等的。那么,如何确定基本事件的等概性呢?拉普拉斯指出:我们的知识或无知使我们无法对所讨论事件的可能性持有倾向性意见,即认为哪一个比哪一个更可能发生,那么我们就应该赋予这些事件以相等的概率。基本事件的等概性成为我们计算其他事件的概率的基础[1]6。请注意,拉普拉斯确定等概事件的依据包含了人们的无知,换言之,相等的知识或相等的无知都是确定等概事件的理由。显然,这种确定等概事件的原则是对伯努利的不充分理由原则的继承,具有认识论的甚至主观主义的色彩。
在维护无差别原则这一点上,凯恩斯同拉普拉斯是一致的,因为凯恩斯也认为量化的概率只有通过等概的候选者来得到。凯恩斯对无差别原则的最初表述是:“无差别原则宣称,如果没有已知的理由对我们题目中的一个候选者做出比其他候选者更强的断言,那么,相对于这样的知识,关于每一个候选者的断言有着相等的概率。”[2]42这一表述同拉普拉斯和伯努利的意思是基本相同的,我们称之为“古典无差别原则”。
然而不幸的是,古典无差别原则(不充分理由原则)很容易导致逻辑悖论。拉普拉斯注意到这一点并给出他自己的解答。他举出一个例子:A女士被告知一个硬币是有偏向性的,但却未被告知偏向哪一面,并且被要求说出这枚硬币投掷后正面朝上的概率。一方面,A女士根据无差别原则判定这枚硬币正面朝上和反面朝上的概率均为1/2,既然她对这枚硬币倾向于哪一面的问题是完全无知的。另一方面,A女士有理由说:这枚硬币正面朝上的概率不为1/2,既然已知它是有偏向性的。这样,对于这枚硬币正面朝上的概率P就有两种相反的答案:P=1/2和P≠1/2,这是一个逻辑悖论。对于这个逻辑悖论,拉普拉斯的解答就是坚持前者而放弃后者[1]56这一解答无异于是对无差别原则的五条件地维护,难免是武断的和缺乏说服力的,并没有从根本上解决问题。事实上,由无差别原则导致的逻辑悖论层出不穷,以致后来的凯恩斯不得不认真地对待这一问题。我们把这类悖论称之为“无差别悖论”,其中最为典型的一个是酒—水悖论。下面我们着重讨论酒—水悖论。
假定有一瓶酒和水的混合液,对它我们只知道其中两种液体的比值不超过3:1,至于哪个多哪个少以及其他信息一概不知。由此我们能够确定酒对于水的比例在区间[1/3,3]之内,即1/3≤酒/水≤3,但是具体在哪一点上我们没有理由持有倾向性意见。根据无差别原则,酒对水的比例的概率是均匀分布在区间[1/3,3]之上的。相应地,酒对水的比例不超过2的概率是均匀地分布在区间[1/3,2]之上的。因此,后者的概率是:
同理,水对酒的比例也是在区间[1/3,3]之内,即1/3≤水/酒≤3,并且其概率均匀地分布在该区间。相应地,水对酒的比例不小于1/2的概率均匀地分布在区间[1/2,3]。因此,后者的概率是:
我们知道,水对酒的比例在区间[1/3,3]内不小于1/2与酒对水的比例在该区间不大于2恰好是同一事件,但却被无差别原则赋予两个不同的概率值。这是一个逻辑矛盾。
2 线性无差别条件
在这一节,我们要对导致酒—水悖论的原因给予进一步的分析,进而引出线性无差别条件。线性无差别条件对于其他无差别悖论也是适用的。
为了消除无差别悖论,凯恩斯曾经提出不可分条件以对无差别原则加以限制[2]60。但是,不可分条件对于连续性场合是无效的,既然连续参数在其区间内是无限可分的。事实上,不可分条件对于离散性场合也不具有普遍性。因此,我们有必要探寻具有普遍性的关于无差别原则的限制条件。
D.吉利斯(Donald Gillies)从酒—水悖论概括出将无差别原则用于连续性场合而导致悖论的一般规律。连续性场合是:参数θ在某一区间[a,b]是连续的并且=f(θ),f是一个定义在[a,b]上的连续函数,并且,a≤θ≤b当且仅当f(a)≤≤f(b);这就是说,a≤θ≤b逻辑等值于f(a)≤≤f(b)。如果我们没有理由倾向于设定θ在[a,b]内的某一点上而不在该区间的其他点上,那么,根据无差别原则,θ在[a,b]上有一个一致f的概率密度,亦即有一个均匀的概率分布。相应地,我们也没有理由倾向于设定在[f(a),(b)]内的某一点而不在该区间的其他点上,根据无差别原则,在[f(a),f(b)]上也有一个一致的概率密度或均匀的概率分布。然而,一般而论,θ有一个一致的概率密度不等于有一个一致的概率密度。这就是由无差别原则导致悖论的原因所在。在酒—水悖论中,首先将无差别原则用于酒对水的比例,即把酒/水作为θ,据此又把无差别原则用于水/酒即=f(θ)=1/θ,这便导致逻辑悖论[5]。
吉利斯的这一分析是有一定启发性的,它向我们强调,在一般情况下不要把无差别原则同时用于一个参数θ和它的某种映射f(θ),否则,很容易导致逻辑悖论。不过,在笔者看来,我们有必要进一步明确其中的限制条件,即明确在什么条件下,无差别原则可以或不可以同时用于θ和f(θ)。下面我们就对这一问题做一探讨。
我们知道,θ在区间[a,b]具有均匀的概率分布,当且仅当,概率分布函数F(θ)在该区间的导数F′(θ)是一常数c,F′(θ)又叫做θ在区间[a,b]的概率密度函数。现考虑另一参数=f(θ)和均匀的复合分布函数G()=G[f(θ)],相应于该分布函数的密度函数是
G′[f(θ)]=G′()f′(θ)=c·f′(θ)
由此可见,复合函数G[f(θ)]表示一个均匀的概率分布,当且仅当,f′(θ)是一常数。我们又知道,f′(θ)是一常数(0除外),当且仅当,f(θ)是一个一次函数,即:
=f(θ)=kθ+b(k>0)
这样,我们便找到了可以把无差别原则同时用于θ和f(θ)的限制条件。由于一次函数也就是线性方程,其中两个变量和θ的关系叫做“线性关系”,我们不妨把这一条件称之为“线性无差别条件”。
线性无差别条件:如果参数θ在一区间的概率分布是无差别的,并且 =f(θ)是一次函数,那么,在相应区间的概率分布也是无差别的;否则,在相应区间的概率分布是有差别的。
线性无差别条件从直观上更容易理解:当横坐标上的动点θ在区间[a,b]上匀速移动时,它投射到任何一条斜线上的点在相应的区间内也是匀速移动的;与之不同,θ投射在曲线上的动点则不是匀速移动的。现在我们可以说,导致无差别悖论的根源是将无差别原则同时用于并不满足线性无差别条件的θ和f(θ)。
顺便提及,吉利斯的上述分析中有一个疏忽。一方面,他提到的一个条件是“a≤θ≤b当且仅当f(a)≤≤f(b)”;另一方面他又把酒—水悖论当作一个相关的例子。然而,在酒—水悖论中,f(θ)=1/θ,并不满足他所提到的这个条件。这个条件实际上是要求函数f(θ)是单调增加的,可以说,它作为把概率均匀分布从θ推广到f(θ)的条件,既不是充分的也不是必要的,而是无关的。
3 对酒—水悖论的解决
既然导致无差别悖论的根源是将无差别原则同时用于并不满足线性无差别条件的θ和f(θ),那么消除这类悖论的途径就是在θ和f(θ)之间做出评价和选择,然后将无差别原则只用于其中一个而放弃另一个。做出这种评价和选择的标准是什么?在笔者看来,评价的标准不是绝对的,而是相对的,是相对于试验机制而言的。相应地,无差别原则也是相对于试验机制而言的。不妨把这种相对于试验机制的无差别原则称之为“试验机制无差别原则”,表述如下:
在离散性场合中。对于若干可能结果而言,如果某一试验在其机制上是无差别的,那么,该试验得出各个结果的概率是相等的。在连续性场合中,对于某一参数θ位于区间[a,b]各点上,如果某一试验在其机制上是无差别的,那么,θ在该区间有着均匀的概率分布[4]。
试验机制无差别原则与古典无差别原则的区别在于:古典无差别原则并不要求考虑试验机制的无差别性,而只要求对所讨论的各个可能事件在认识上是无差别的。根据古典无差别原则,当人们对所讨论的各个事件完全无知时,也应对它们赋予相等的概率,因为人们对它们在认识上是无差别的。与古典无差别原则不同,试验机制无差别原则并不是简单地要求认识上的无差别,而是要求认识到试验机制是无差别的。如果人们对两个事件完全无知,那么,他们就不会认识到产生这两个事件的试验机制的无差别性,因此,根据试验机制无差别原则,不能由相等的无知得出相等的概率。
将试验机制无差别原则同线性无差别条件结合起来,我们可以消除酒—水悖论甚至所有的无差别悖论。首先以不对称硬币悖论为例。导致这一悖论的原因是:从物理的层面看,那枚硬币的不对称结构使我们认为正面朝上和反面朝上的概率是不相等的;但从知识层面看,我们对这枚硬币的重心偏于正面或偏于反面处于完全无知的状态,这种相等的无知使我们赋予正面朝上和反面朝上以相等的概率。现根据试验机制无差别原则,我们只承认前一结论而不承认后一结论,因为只有前一结论是根据对试验机制的认识做出的。这样,逻辑悖论便不存在了。
现在考虑酒—水悖论。前面指出,导致无差别悖论的根源是将无差别原则同时用于并不满足线性无差别条件的θ和f(θ),这里的θ是酒/水比例,f(θ)是水/酒比例,f(θ)=1/θ。首先,根据线性无差别条件,这种做法是错误的,因为f(θ)=1/θ不是一次函数,相应地,f(θ)的导数f′(θ)不是一个常数,而是f′(θ)=(1/θ)′=-1/θ[2]。其次,根据试验机制无差别原则,即使只将无差别原则用于其中一个,也只有在具体考察试验机制的基础上才能够确定。在没有给出试验机制的情况下,我们无从选择,当然也就得不出任何悖论。
为了对酒—水悖论以及线性无差别条件做更为深入的考察,让我们以如下试验机制为例。假定装有酒水混合液的瓶子容量是1升,我们通过测量酒的体积来测量酒/水比例。酒/水比例在区间[1/3,3]的分布是通过测量酒的体积在区间[1/4升,3/4升]的分布而得到的,这种测量结果相当于水的体积在区间[3/4升,1/4升]。酒/水比例在区间[1/3,2]的分布是通过测量酒的体积在区间[1/4升,2/3升]的分布而得知的,这种测量结果相当于水的体积在区间[3/4升,1/3升]。在此,酒的体积为θ,水的体积为=1-θ。进一步假定,这种试验机制可以在区间[1/4升,3/4升]随机地选择酒的体积,以使酒的体积在该区间的任何一点同在该区间的其他点是无差别的,那么,根据试验机制无差别原则,θ在该区间有一个均匀的概率分布。据此,θ在区间[1/4升,2/3升]的概率是:
相对于该试验机制,θ在区间[1/4升,2/3升]相当于酒/水比例在[1/3,2],因此,
P(1/3≤酒/水≤2)=5/6
我们注意到,=1-θ,这是一次函数,相应地,′=(1-θ)′=-1,满足线性无差别条件,所以,我们可以将无差别原则从θ推广到,即在区间[3/4升,1/4升]有一个均匀的概率分布。据此,在区间[3/4升,1/3升]的概率是:
相应地,
P(1/2≤水/酒≤3)=5/6
我们看到,在满足线性无差别原则的情况下,我们把无差别原则同时用于θ和f(θ),所得结论是相同的,并未导致逻辑悖论。也许有人提出,尽管这两个计算结果是相同的,但它们同导致酒—水悖论的两个计算结果——P(1/3≤酒/水≤2)=5/8和P(1/2≤水/酒≤3)=15/16——却是不同的,逻辑矛盾仍然存在。对此,我们的回答是:既然导致悖论的那两个计算结果完全没有考虑试验机制,这是对无差别原则的误用,相应的计算结果是无效的。这样,逻辑矛盾也就不存在了。
一个需要考虑的问题是,与古典无差别原则相比,试验机制无差别原则的应用范围受到很大的限制,以此来换取对无差别悖论的消除或避免,其代价似乎太大了。对此,笔者的回答是,无差别悖论属于认识论范围,它们是古典无差别原则所引起的认识上的困境。试验机制无差别原则使我们在认识上摆脱这一困境并不意味着我们在实用上完全拒绝古典无差别原则;正如我们认识到一个坏人以后仍然可以出于策略的考虑同他继续合作。从贝斯方法的观点看,对于验前概率的确定可以是因人而异的,这种差异可以随着验后概率的确定而得到缩小甚至消除。这也就是说,对验前概率的确定仅仅是权宜之计。因此,在没有其他更好方法的时候,我们不妨通过古典无差别原则对于各个竞争假设赋予相等的验前概率。如果面临无差别悖论,可以主观性地或私人性地选择其中一个赋值而放弃另一个赋值,然后根据贝叶斯公式和新的证据来确定验后概率。验后概率是对验前概率的修正,随着新证据的增加,这种修正过程可以淡化甚至消除验前概率的主观性和私人性。这样,一方面,我们通过试验机制无差别原则在认识上消除了无差别悖论,另一方面,我们可以在策略上保留对古典无差别原则的广泛应用。对于贝叶斯方法论来说,这是不成问题的。
4 关于酒—水悖论的语言分析
这一节将给出另一视角,以表明对无差别原则加以试验机制的限制是必要的。为此,请回顾第二节中对酒—水悖论的表述。我们注意到,在这一表述中,开始使用的是中性语词即“酒水混合液的比例”相当于“酒和水的比例”或者“水和酒的比例”,但是后来却使用非中立的语词即“酒对水的比例”和“水对酒的比例”,这里有偷换概念之嫌。让我们对此做进一步的考察。
从图1我们可以看到,式(1)是根据横轴上边的两部分的比例计算的,它是关于酒对水的比例即酒/水的;而式(2)是根据横轴下边的两部分的比例计算的,它是关于水对酒的比例即水/酒的。可见,这上下两部分谈论的不是同一个对象。
为澄清这一点,我们有必要区分四个术语,即“酒和水的比例”、“水和酒的比例”、“酒对水的比例”和“水对酒的比例”。前两者表达的是对称性关系,因而“酒和水的比例”同“水和酒的比例”表达同一对象。与此不同,后两者表达的是非对称关系,在多数情况下,酒对水的比例不等于水对酒的比例,因而“酒对水的比例”和“水对酒的比例”表达了不同的对象。然而,在酒—水悖论的表述中却在这些术语之间进行了不恰当的置换。
图1
不过,我们并不否认在某种意义上,“酒对水的比例”即“酒/水”和“水对酒的比例”即“水/酒”是可以互换的。现在,我们就来分析这种意义是什么。为了论述简捷,我们把“酒和水的比例”和“水和酒的比例”分别记为“酒—水”和“水—酒”。
由于“酒—水”和“水—酒”是对称的,它们表达同一个对象,这个对象也正是复合谓词“酒/水或者水/酒”所要表达的。因此,“酒—水”=“水—酒”=“酒/水或水/酒”。显然,“酒/水或水/酒”≠“酒/水”,“酒/水或水/酒”≠“水/酒”。相应地,(x是酒/水或水/酒)(x是酒/水),(x是酒/水或水/酒)(x是水/酒)。从逻辑上讲,(x是酒/水或水/酒)≡(x是酒/水或者x是水/酒),这是一个析取命题,它的两个支命题分别是“x是酒/水”和“x是水/酒”。尽管这两个支命题不是等值的,但它们同这个析取命题之间有着相同的真值函项关系,即:当“x是酒/水”为真时“x是酒/水或者工是水/酒”也为真;同样地,当“x是水/酒”为真时“x是酒/水或者x是水/酒”也为真。因此,“x是酒/水”和“x是水/酒”能够以相同的函项关系分别从一个侧面或角度来刻画这个析取命题所要表达的对象;正是在这个意义上,二者是可以互换的。具体地说,当用“[1/3,3]是酒/水的变化区间”来刻画“[1/3,3]是酒—水的变化区间”时,我们把其中的“酒/水”换为“水/酒”之后并不改变所要刻画的对象;同样地,当用“[1/3,2]是酒/水的变化区间”来刻画“[1/3,2]是酒—水的变化区间”时,我们也可以把其中的“酒/水”换为“水/酒”而不改变所谈对象。相应地,这两个区间即[1/3,3]和[1/3,2]的比例关系也不随着这两个术语的互换而发生变化,因而不会导致酒—水悖论。同样的道理也适用于区间[1/3,3]和[1/2,3)。
请注意,在这里“酒/水”和“水/酒”的互换是相对于析取命题的真值函项关系而言的,并不意味这两个术语本身可以互换。然而不幸的是,人们由此产生了误解,让“酒/水”和“水/酒”之间的互换超出特定的范围。导致酒—水悖论的直接原因就是,无条件地将“酒/水”和“水/酒”进行互换,相当于将x和1/x进行互换,从而将讨论对象从图一横轴上边移到横轴下边,这样便违犯了最基本的逻辑规则即同一律。
总之,在遵守逻辑规则的意义上将“酒/水”和“水/酒”互换,并不改变讨论对象,这种互换实际上是一种同语反复。否则,讨论对象就会发生转移,从而导致逻辑矛盾。然而,这又使我们面临另一种困境,即:当我们将“酒/水”和“水/酒”进行置换的时候,其结果要么是同语反复,要么是偷换概念;这意味着,此时我们要么是无内容地谈话,要么是自相矛盾。这一困境是我们对酒—水悖论进行纯粹语言分析的结果,它从另一个角度告诉我们,把试验机制引入无差别原则是必要的。因为相对于某种试验机制,我们既可以有意义地交换“酒/水”和“水/酒”,又不会因此而导致逻辑悖论。这一点在第三节的分析中已经表明。
收稿日期:2007-03-02