可能世界上的选择:纽科姆问题_囚徒困境论文

可能世界中的选择:纽康姆难题,本文主要内容关键词为:难题论文,世界论文,纽康姆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、纽康姆难题(Newcomb' s Problem)①:一个陈述

有一个生物(a being)具有强大的预测能力,能够事先预测你的选择。你知道这个生物具有这种能力,并且可以无限信赖这种能力(至于为何可以完全信赖不是关键问题。我们可以假设在你之前已经有一千个人接受了该生物的测试,结果它的预测都是准确的;或者假设该生物带着一台大脑扫描仪的外星高科技仪器,可以准确地读出你的思维;甚至我们可以假设该生物就是上帝)。现在,该生物将两个盒子摆在你面前:第一个盒子B[,1]是透明的,里面放着一千美元(1000);第二个盒子B[,2]是不透明的,里面可能有一百万美元(M),也可能什么也没有。而第二个盒子里的内容取决于生物对你的选择的预测,你有两个选择:C[,1]——拿走全部两个盒子;C[,2]——只拿走盒子B[,2]。② 如果生物预测到你会拿走两个盒子,那么它会确定地把盒子B[,2]空着;如果生物预测到你会只拿走盒子B[,2],那么它会确定地在里面放入M。此外,如果生物预测到你会随机地作出某个选择,那么它也会确定地把盒子B[,2]空着。上述事实你完全知道,生物也知道你知道这些事实,如此往复。生物对你进行预测,在第二个盒子中放入或者没有放入一百万美元。现在,你选择。两种观点:

(1)只拿走盒子B[,2]。理由,如果你拿走全部两个盒子,生物几乎可以确定地预测到你会作出这个选择,那么它就总是会把盒子B[,2]空着,那么你就只能获得1000;如果你只拿走盒子B[,2],生物也几乎可以确定地预测到你会作出这个选择,那么它就总是往盒子B[,2]中放入M,那么你就能成为百万富翁。因此你只应该拿走第二个盒子。这种观点我们称之为预期效用的观点(the Expected-Utility Argument)。

(2)拿走全部两个盒子。理由,生物已经作出预测,也已经往第二个盒子中放入或者没有放入一百万美元。因此等到你选择时,情况已经确定或者注定了。那么,如果生物往盒子B[,2]中放入了M,你选择两个盒子,你可以获得一百万零一千美元;你选择一个盒子,只能获得一百万美元。如果生物把盒子B[,2]空着,你选择两个盒子,可以获得一千美元;你选择一个盒子,只能空手而归。这样,无论如何拿走两个盒子总要比拿走一个盒子要好。因此你应该拿走全部两个盒子。这种观点我们称之为占优观点(the Dominance Argument)。

以上我们称为纽康姆难题。纽康姆难题最早由物理学家威廉·纽康姆(William Newcomb)提出,诺齐克于1963年从一位朋友,克鲁斯卡尔(Martin David Kruskal)那里听到了这个问题。(Nozick,1969,1993)在断断续续思考了这个问题五年之后,于1969年在《纪念卡尔·G·亨佩尔文集》(Essays in Honor of Carl G.Hempel)中发表了著名的论文《纽康姆难题与选择的两项原则》(Newcomb' s Problem and Two Principles of Choice),纽康姆难题才声名远播,引发了《哲学杂志》(the Journal of Philosophy)所称的“纽康姆狂热(Newcombmania)”。(Holt,2002)③ 此后一段时间中,纽康姆问题一度成为一个热点。1973年,《科学美国人》(Scientific American)刊载了诺齐克的论文(Gardner,1973),在随后一年左右的时间中,接到了148封读者来信试图解决该难题。(Nozick,1974)其中89封信认为应该只拿一个盒子,37封信认为应该拿两个盒子,其他的则认为纽康姆难题存在缺陷而不可解。

诺齐克在1969年的原文中对于这个问题的态度则让人有些捉摸不透,诺齐克提出拿走两个盒子的解释,但是并没有拒绝拿走一个盒子的选择,并且占优观点的论证也似乎并不非常强有力。因为似乎没有充分的解决方法能够拒绝一个盒子论者(One-boxer)的选择,纽康姆难题似乎总为预期效用的观点留下余地。正如索贝尔所指出,诺齐克也承认的那样,充分的解决方法存在于更深处。(Sobel,1988,Nozick,1969)而1974年的《反思纽康姆难题》(Reflections on Newcomb' s Problem)中,诺齐克这种犹豫不定的态度则更加明显。在阅读了厚达650页的读者来信,对各种各样、千奇百怪的解决方案作出回答之后,诺齐克说:“不幸的是,在我看来,这些信没有让这个难题彻底解决。并且反而让我重新开始思考这个问题!你没法赢。”(Nozick,1974)近二十年之后,诺齐克在《理性的本质》(the Nature of Rationality)中终于再度回答这个问题。这一次,他明确承认两种观念都具有其有效性,问题在于在何种情况下人们的选择会遵从其中的一条原则。(Nozick,1993)为此,他提出“决策价值(Decision Value)”试图解决这一问题。

而在其他诸多的讨论纽康姆问题的文献中,既有支持一个盒子的论证,例如Bar-Hillel and Margalit(1972)、Rapoport(1975)、Benditt and Ross(1976)、Horgan(1981)、Ross(2003)等等;也有支持两个盒子的论证,例如Gardner(1973)、Schlesinger(1974)、Lewis(1979)、Sobel(1988)、Zvonimir ikic(2003)、Burgess(2004)等等;还有的则认为纽康姆难题难以成立或者两种结论都可以成立的论证,例如Cargile(1975)、Brams(1975)、Hubin and Ross(1985)、Schmidt-Petri(2004)等等。其中,博弈论专家试图将纽康姆难题与囚徒困境(Prisoner' s Dilemma)联系起来,进而化解纽康姆难题;更多的则是从决策理论出发,分析这个问题。而决策理论专家主要可以划分为两个阵营:证据决策理论(Evidential Decision Theory)与因果决策理论(Causal Decision Theory)。前者大部分支持一个盒子的选择,后者大部分支持两个盒子的选择。④

也许在如今看来,与博弈论中著名的囚徒困境相比,纽康姆难题变得几乎不为人所知,但是纽康姆难题并没有也不会归于平息。正如郝特(Jim Holt)所言,是否在2500年之后,在《无政府、国家与乌托邦》(Anarchy,State,and Utopia)也被遗忘了的时候,纽康姆难题仍在让哲学家们烦恼不堪?(Holt,2002)

本文将对纽康姆难题进行一次梳理。我们首先分析博弈论专家对纽康姆难题的解决方法,指出其中的不足。然后我们转向一个盒子论者的观点,在形形色色的解决方案中,我们关注于其中最强有力的理论支柱——证据决策理论——存在的致命缺陷。进而我们分析诺齐克对这个难题的思考过程。我们认为,诺齐克在1969年最初那篇论文中所提出的解决方案,直到2004年在伯杰斯(Simon Burgess)的《纽康姆难题:一项不合格的解决方案》(The Newcomb Problem:an Unqualified Resolution)一文中才获得完美的形式化解答。通过两者的结合,我们将给出纽康姆难题两个盒子的论点一个形式化的证明。但是正如诺齐克所考虑到的,这仍然不能让纽康姆难题归于安息。因此,最后我们将随着诺齐克的决策价值理论深入到纽康姆难题的核心。

二、博弈论解决方案:一种尴尬

也许,纽康姆难题在一段时期的热潮之后归于沉寂,有一部分要归于博弈论专家的功劳。他们中的许多人以一种不在乎的态度放弃了纽康姆悖论,因为在博弈论的框架下,纽康姆难题似乎不可能成立。所以宾默尔(Ken Binmore)认为,纽康姆难题这种“工作很大程度上是一种浪费”。(Binmore,1994,中文版第290页)但是,我们更有理由相信,这种浪费或许是因为博弈论理论的问题,并非是由于纽康姆难题本身不可解。

运用博弈论方法研究纽康姆难题的主要手段,是将纽康姆难题与囚徒困境联系起来。其中,最著名的是勃拉姆斯(Steven J.Brams)1975年的《纽康姆难题与囚徒困境》(Newcomb' s Problem and Prisoners' Dilemma),刘易斯(David Lewis)1979年的《囚徒困境是一纽康姆难题》(Prisoners' Dilemma is a Newcomb Problem),以及Schmidt-Petri(2004)等人的研究。另外,Bar-Hillel and Margalit(1972)和Zvonimir ikic(2003)的文章也采用博弈论方式论述纽康姆难题,但是并没有将其和囚徒困境联系在一起。博弈论专家们将纽康姆难题和囚徒困境联系在一起,主要采取两种方法:一种是将纽康姆难题构建为一个人与自然的博弈,例如Brams(1975);一种是将囚徒困境构建为两个对称的纽康姆难题,例如Lewis(1979)。后面一种方法确切来说事实上并不属于博弈论的解决方案,因此我们将在后面再来讨论。现在我们关注的是前一种方法。

纽康姆难题和囚徒困境具有联系并不是博弈论专家的发明,诺齐克最初的论文对此就有所阐述(Nozick,1969),其后在《理性的本质》中更是详细论述了囚徒困境问题。(Nozick,1993)据称,纽康姆本人最早是在1960年思考囚徒困境时构想出这个难题的。(Gardner,1973,Ross,2003)因此,可以认为纽康姆难题和囚徒困境具有先天上的血缘关系。

在勃拉姆斯的论文中,为了将二者联系起来,他首先试图将纽康姆难题转换为一个博弈论问题。因此,他根据纽康姆难题的陈述,将博弈的参与人确定为“你”和“生物”,给出的支付矩阵(Brams,1975)见图1。

其中获得的金钱就直接代表得到的效用。这实际上是对Bar-Hillel and Margalit(1972)的文献中提出的一个博弈论形式的复述。但是这个支付矩阵乍看起来也许会让人觉得有些奇怪:生物不存在支付问题。不过,在这里这也许还不算最主要的问题。主要问题是生物的策略:“预测”。生物的预测究竟能不能算作选择?勃拉姆斯自己也对此感到有些尴尬(Brams,1975)。因为严格根据纽康姆难题的陈述,生物的预测并不是对参与人“你”的策略的反应,而是严格依赖于“你”的行动:如果“你”选择拿走盒子B[,2],那么生物就“被迫”预测拿走盒子B[,2];如果“你”选择拿走全部盒子,那么生物就“被迫”预测拿走全部盒子;而左下角和右上角两种结果只不过是生物不小心预测错了的结果。

因此,生物根本就没有策略,它就像傀儡一样,任由“你”的行动摆布。并且,这个支付矩阵所能得出的结论也是勃拉姆斯不愿看到的:无论如何“你”都应当选择拿走全部盒子。因此,勃拉姆斯仍旧回到了决策理论之中,给出了图2的支付矩阵(Brams,1975)。

勃拉姆斯的理由是,根据费尔强(John A.Ferejohn)的观点,在这种情况下纽康姆难题中预期效用最大化和占优策略两项原则的冲突就消失了。此时选择只拿走盒子B[,2]的预期效用为:PM+(1-P)0;选择拿走全部盒子的预期效用为:P1000+(1-P)(M+1000)。那么,采取何种选择就要根据概率P的大小,而这代表的是生物预测的准确率:如果准确率大于0.5005,那么就应该只拿走盒子B[,2];如果准确率小于0.5005,那么就应该拿走全部盒子;如果准确率等于0.5005,那么随便怎么选择都可以。(Brams 1975)⑤

事实上这就是持第一种观点——预期效用观点——的人所提出的单人决策的支付矩阵。(Nozick,1974)而对于勃拉姆斯最初提出的,这场生物既不存在支付也没有策略集合的博弈,这里生物的角色更像一种状态,因此我们也可以将其更合适地视为一个单人决策问题,即图3。

和图1相比,区别在于这里我们关注的是生物的行动而非“预测”。这就是持第二种观点——占优观点——的人所提出的支付矩阵。(Nozick,1974)

这样,问题又转了回来,纽康姆难题仍然是一个决策问题而非博弈论问题。勃拉姆斯相信,如果认为生物对图2中两种自然状态不能控制,那么“生物就不是如图1所示的两人博弈中合适的参与人,因此,纽康姆难题合适的表达形式就是一个决策理论问题”。(Brams,1975)但是,如果生物能够对可能达到的状态进行控制,也就是说,生物具有“自由意志(free will)”,那么如图1那样的博弈论形式则是合理的。勃拉姆斯认为纽康姆难题的陈述中并没有说明生物的“选择”存在与否,但是仍然可以相信这种情况:它的“选择”仅受到它的预测的支配。这样,生物预测准确性的概率P的值就扮演了一个相当重要的角色。在勃拉姆斯看来似乎假设生物预测完全可以信赖(P=1)是不可能的。因为如此一来,首先生物不可能具有“选择”,它没有“自由意志”:它的“选择”仅受到它的预测的支配,而它的预测完全就是行为人“你”的行动所决定了的。因此,生物不可能控制可能的状态。其次,这样的话,博弈论形式不可能存在,只能采用决策理论形式,但是如图2所表现出来的,此时概率P又可能不一定是1。那么,两者就存在矛盾。因此,最佳的解决方案是不假设生物的预测完全准确,这样博弈论方法和决策理论方法都可以适用。

在得出这样的结论后,生物就转化为博弈中的参与人,勃拉姆斯进而将纽康姆难题转化为这样一种形态(Brams,1975)(图4):

现在,纽康姆难题成为一场预测—选择博弈中的非对称形态。因为参与人B有预测能力,而参与人A没有这种能力。因而可以反过来假设参与人A具有预测能力,而参与人B没有,这样就有了图5。(Brams,1975)

将图4和图5结合在一起,就成为如下的形式(Brams,1975):

至此,纽康姆预测—选择博弈的对称形式就转化为囚徒困境,并且具有相当的拟合。如果在纽康姆情况下行为人采取占优策略,那么在囚徒困境下最终的均衡结果就是不合作,结果是(A[,3],B[,3])。尽管采取“合作”可能对双方参与人都有更好的结果:(A[,2],B[,2])>(A[,3],B[,3])。

并且,根据前面对纽康姆问题的分析,勃拉姆斯将纽康姆难题中预测准确性的概率P扮演的角色应用到了囚徒困境之中。因为遵照前述的思路,行为人是否选择占优策略取决于P的大小,如果P足够大,则行为人不会采取占优策略。对应到囚徒困境之中,参与人都具有预测能力,那么如果双方参与人的预测能力都足够大,即P足够大,则双方就有可能采取“合作”的策略。在现实中,所谓“预测能力都足够大”意味着双方尽可能了解对方,心灵相通。也就是说,勃拉姆斯在暗示用“串谋”来解决囚徒困境。

对于勃拉姆斯的论证我们或多或少都会有些困惑。首先,为何要假设生物的策略集合为“预测”而不是“行为”——放入或者没有放入M?如果要将纽康姆难题作为人与生物的博弈,用“行为”不是更合理吗?勃拉姆斯的解释是因为生物的“行为”和“预测”是一一对应的,所以采用哪个作为策略集合并无差异。(Brams,1975)但是,也许更为适合的解释是采用“预测”更容易将勃拉姆斯所关注的概率问题应用进来。回顾一下两个盒子论者(Tow-boxer)的支付矩阵图3,严格符合占优原则,而此时概率P是不重要的。对于生物的行为我们不需要关注是否存在一个预测准确性的概率,也许生物的行为和预测密切相关,但是预测准确性的概率P和我们的选择没有直接关系:如果P值高,生物具有两个“行为”——放入或者不放入M;如果P值低,生物还是具有两个“行为”——放入或者不放入M。其次,尽管勃拉姆斯费尽周折证明了图4、图5这种非对称的预测—选择博弈的合理性,但是我们仍然想知道:生物是否愿意和“你”玩一次博弈,它的预测是否真的是一种策略集合?勃拉姆斯的证明实际上修改了原有的纽康姆难题的性质。在纽康姆难题的陈述中,生物和行为人双方似乎并没有“交往”:生物作了完美的预测,放下盒子,走了;行为人选择。因此,生物既没有“支付”,也没有“策略”,更重要的是没有“意愿”玩一次博弈。

因此,勃拉姆斯的论证充满了博弈论专家的技巧,但是仍然不能免除博弈论在面对纽康姆难题时遇到的尴尬。同时,勃拉姆斯的模型中保留了预测和选择,放弃了时间。(Binmore,1994,中文版第298页)在宾默尔看来,纽康姆难题中时间预测和自由选择的冲突是其最大的问题。不过我们后面的论述将会证明,纽康姆难题中,时间问题、预测问题都可以是不重要的,关键问题是选择。

宾默尔对纽康姆难题有些漫不经心的处理似乎是由于他对这样一种看法相当在意,即“诺齐克告诉我们纽康姆悖论揭示了‘占优’和‘预期效用最大化’之间的冲突”。(Binmore,1994,中文版第291页)这种冲突是博弈论专家不可忍受的,因为这似乎意味着博弈论的垮台。因此宾默尔的主要工作并不是解决纽康姆难题,而是折断诺齐克的佩剑:证明根本不存在这种冲突。要证明“预期效用最大化”和“占优”两项原则之间不存在冲突不是一件容易的事情,因为诺齐克并没有专注于两项原则的冲突本身,更没有否定两项原则进而否定博弈论。在这一点上博弈论专家的反应也许过度敏感了。或许诺齐克特有的似是而非的论述让人有些迷惑,但是诺齐克真正关注的是两种强有力观点——预期效用观点和占优观点,为什么各持有其中一种观点的双方会认为对方是错的(Nozick,1974,Nozick,1993),人们在何种情况下应当依据何种选择原则。这样,宾默尔的工作和诺齐克的思考就好像两条道路上的陌路人,他们并不在同一维度上对话。

宾默尔的工作是致力于澄清一切模棱两可的内容。因此他提出的模型是一个不存在自由选择的模型——无参与人博弈(Binmore,1994,中文版第298页):自然决定行为人采取何种选择——一个盒子或者两个盒子。最终的结果是拿到M或者拿到1000。在此我们似乎没有必要复述宾默尔的论证过程,我们只需要说明一点:否定了自由选择的纽康姆难题是不存在的。在纽康姆难题的陈述中明确指出了:如果生物预测到你会随机地作出某个选择,那么它也会确定地把盒子B[,2]空着。也就是说自然让行为人以某个概率π采取行动时——相当于行为人扔个硬币决定选择,在这种随机情况下行为人最终的支付确定为0或者1000。此时,如果行为人还是理性的话,仍然适用占优原则,拿走两个盒子。宾默尔的最终结论有两个:一是所谓两项选择原则的冲突并不存在;二是纽康姆难题本身模糊不清,似是而非。但是,我们也可以从中提取出我们的结论:一是在不同条件下可以适用不同的原则,关键是如何适用;二是纽康姆难题在博弈论的框架下确实有些格格不入。

施密特—彼得(Christoph Schmidt-Petri)2004年的文献《纽康姆难题与重复的囚徒困境》(Newcomb' s Problem and Repeated Prisoners' Dilemmas)实际上在某种程度上是在重复Bar-Hillel and Margalit(1972)文章中的观点。在那篇文章中,作者用博弈论的形式论证纽康姆难题,认为持有占优观点的人误用了占优原则,“由于在我们的难题中,世界的状态在概率上不独立于行为,因而不能适用占优原则”。(Bar-Hillel and Margalit,1972)这实际上是在复述诺齐克1969年那篇文献提出的一项主张。(Nozick,1969)随后作者在论证一个盒子的观点时又似乎在求诸信仰——相信拿一个盒子的人会成为百万富翁;拿两个盒子的人只能得到1000,而这种信仰又是一种重复博弈的结果——前面一千人的经历已经证明了这一点。施密特—彼得的文章进一步强化了这种思想。他的主要主张是根据囚徒困境中一次博弈和重复博弈可能产生的不同结果来证明纽康姆难题中两项主张各自的有效性。如果是一次性的纽康姆难题,就应当采用占优原则,拿走全部盒子;如果是重复性的纽康姆难题,就应当采取预期效用原则,拿走一个盒子。诺齐克关于纽康姆难题的陈述中的疏误是没有说明纽康姆难题是一次性的博弈还是重复博弈。

施密特—彼得采取的一个纽康姆—囚徒博弈的支付矩阵如图7(Schmidt-Petri,2004)。

这一种形式事实上主要是根据Lewis(1979)中的论证而来的,在后面我们将作分析。施密特—彼得这里所强调的一次博弈和重复博弈的区分实际上是在支持证据决策理论者的观点,“正是证据决策理论者对概率的应用,将预测者在过去预测准确性的频率的概率等同于对下一次预测准确性的主观信念程度的概率,在重复博弈的情况中指导他所关心的内容”。(Schmidt-Petri,2004)这就是对Bar-Hillel and Margalit(1972)文章中有些让人困惑的“信仰”问题的正式说明。因此,证据决策理论者在重复博弈的情况下是对的。而因果决策理论者的证明只能适用于一次性博弈的情况。

但是,为纽康姆难题添加一个重复博弈还是一次性博弈的条件究竟为何呢?施密特—彼得应用重复博弈的真正目的似乎仍然是让我们相信预测者预测准确性的概率P足够大——过去1千次博弈中预测者都是准确的,因而我们就应当成为一个盒子论者。因此,问题的关键似乎仍然是一个概率问题。这样,如我们已经说过的,如果在纽康姆难题中概率P并不是非常重要的,那么,诺齐克没有在纽康姆难题的原初陈述中说明一次/多次选择也就并没有太大关系。也就是说,如果我是一个盒子论者,那么无论这场纽康姆选择进行多少次,我都是一个盒子论者;如果我是两个盒子论者,那么无论这场纽康姆选择进行多少次,我都是两个盒子论者。

到此为止,我们可以暂时停止对博弈论解决方法的分析。我们发现,将纽康姆难题化解为博弈论形式总是存在着某种程度的紧张。如果不修改原初陈述中的一些条件,就很难获得完备的解释。如果我们接受一些决策理论专家的观点,即博弈论是理性决策理论一专门分支(Ledwig,2000),那么或许我们更能接受另一种方式,将一些博弈中的决策者转化为纽康姆难题中的决策者,这就是Lewis(1979)中所作的工作。其次,我们发现博弈论专家们在讨论纽康姆问题时最终会不由自主地集中到预测准确程度的概率和时间问题上。事实上,我们认为博弈论专家的讨论默认了证据决策理论的观点。因此,现在我们最好转向决策理论对纽康姆难题的分析,首先我们要考察的是一个盒子论者。

三、一个盒子论者:一项缺陷

持预期效用观点的人主张只拿走一个盒子。从《科学美国人》1973~1974年收到的读者来信我们可以看到,一个盒子论者占大多数。其中原因之一也许是由于一个盒子的观点更符合人们的直觉。预期效用观点的支付矩阵就是图2,从图中我们可以看出,如果生物的预测是完全正确的,那么只剩下两种支付——M/1000,分别对应两种选择——只拿走盒子B[,2]/拿走全部盒子。即便假设生物的预测并不完全正确,而存在概率为P的准确程度。那么只拿走盒子B[,2]的预期效用为EU[,2]=PM+(1-P)0⑥,拿走全部盒子的预期效用为EU[,1]=P1000+(1-P)(M+1000)。因此,只要概率P足够大,使得EU[,2]>EU[,1],行为人仍然应当只拿走一个盒子。⑦

现在让我们进一步审视这个问题,我们会发现,概率P更确切地说应当是一个条件概率P(生物的预测|行为人的选择)。我们假设“生物预测到行为人拿走全部盒子”这种可能性状态为S[,1],“生物预测到行为人拿走盒子B[,2]”这种可能性状态为S[,2];而行为人的选择根据原初陈述分别为C[,1]、C[,2]。因此,上述两个预期效用式子进一步修正为:

EU(C[,1])=P(S[,1]|C[,1])1000+P(S[,2]|C[,1])(M+1000)

EU(C[,2])=P(S[,2]|C[,2])M+P(S[,1]|C[,2])0

因为根据纽康姆难题的陈述,条件概率P(S[,1]|C[,1])和P(S[,2]|C[,2])的值接近1——可以完全信赖生物的预测,在曾经一千次的测试中生物都是对的;反之则P(S[,2]|C[,1])和P(S[,1]|C[,2])的值接近0。因此EU(C[,1])<EU(C[,2]),应当选择一个盒子B[,2]。一个盒子论者这一观点应用的原则可以称之为“条件预期效用最大化(Maximizing Conditional Expected Utility)”原则。诺齐克指出,如果世界的状态在概率上不独立于行为,那么应当采用条件预期效用原则,将给定行为下的状态的条件概率作为概率权数。(Nozick,1969,1993)⑧

以上观点所包含的决策理论我们可以称之为“证据决策理论”。所谓证据决策理论,简单地说,就是行为人的决策要求“最大化预期的满足程度(desirability)”(Horwich,1985),而最大化预期满足程度的方法是将行为人的决策基于“条件证据预期后果(conditional evidence expected outcomes)”。(Burgess,2004)也就是说,只要先前发生的事件与行为人行为的预期之间具有高度代表性,行为人就应当根据最大化这种预期而决策。(Horwich,1985)因此,证据决策理论家认为,“理性的选择是这样一种选择,其将能提供最强的证据认为某些好的事情在过去已经发生过了”。(Burgess,2004)⑨

证据决策理论以杰弗里(Richard Jeffrey)的理论为代表。⑩ 而1969年诺齐克论述纽康姆难题的文章发表后,证据决策理论就受到了因果决策理论的反对。(Ledwig,2000)那么纽康姆难题中,证据决策理论哪里出了错呢?诺齐克在1969年的文章采用的是一种直觉举例方法揭示这一缺陷。(11)

F知道G或者T是他的父亲,但是不知道究竟是哪一个。G死于某种可怕的遗传疾病,而T没有。人们知道这种疾病基因上是显性的,而F的母亲没有携带这种基因,因而G携带的不是隐性基因。如果G是他的父亲,F会死于这种疾病;如果T是他的父亲,F不会死于这种疾病。此外,我们假设还有一种已经充分证实的理论,关于决定从事构成知识分子生活的行为倾向的基因遗传。这种倾向基因上是显性的。G具有这种倾向(携带的不是隐性基因),T没有,F的母亲也没有。F现在决定是(a)读研究生然后当教师,还是(b)成为一名职业篮球运动员。他更喜欢(尽管不是极其地)学院的生活而不是成为一个职业运动员。(Nozick,1969)

先让我们根据证据决策理论者的预期效用观点来分析这个例子。(12) 给出P的支付矩阵:

注:(1)B[,1]表示“G是F的父亲”;B[,2]表示“T是F的父亲”。(2)A[,1]表示F从事学院事业;A[,2]表示F从事职业运动员事业。(3)x=F从事学院事业,死于疾病所获得的支付;z=F从事职业运动员事业,死于疾病所获得的支付;y=F从事学院事业,没有死于疾病所获得支付;w=F从事职业运动员事业,没有死于疾病所获得的支付。(4)x>z;y>w;w>x。

因此,y、w的值要显著大于x、z,假设y=100,w=95,x=-20,z=-25。同时假定例子中所说的遗传理论告诉我们,如果F决定从事学院事业,就表明他具有知识分子的倾向,反之则反是。因此可以给出假设的条件概率:P(F具有知识分子倾向|A[,1])=0.9;P(F不具有知识分子倾向|A[,1])=0.1;P(F具有知识分子倾向|A[,2])=0.1;P(F不具有知识分子倾向|A[,2])=0.9。因为F具有知识分子倾向,当且仅当G是F的父亲,所以我们就有:P(B[,1]|A[,1])=0.9;P(B[,2]|A[,1])=0.1;P(B[,1]|A[,2])=0.1;P(B[,2]|A[,2])=0.9。

预期效用EU(A[,1])=-8;EU(A[,2])=83。EU(A[,1])<EU(A[,2]),因此根据条件预期效用最大化原则,F的理性选择是成为一名职业运动员。

上述的论证看似很有道理,但是只要我们稍微想一想,便会发觉这是荒谬的。谁是F的父亲这已经是既定的事实,不会再改变:如果G真的是F的父亲,哪怕F千方百计要成为运动员,也改变不了这一事实。而上述的论证似乎在告诉我们,F的选择能够决定或者说能够影响谁是他的父亲。这就好比在说,是儿子生了父亲而不是父亲生了儿子。再看看图8给出的支付矩阵,选择A[,1]符合占优原则,因此根据占优观点,既然F偏好于成为知识分子,他的理性选择就是成为知识分子。尽管成为知识分子也就意味着F很可能死于可怕的遗传疾病,但是这不是他的选择所能决定的。既然一切已经注定,留给人的就是自由意志。

诺齐克的这个例子好比一个滤镜,将纽康姆难题中预期效用观点隐藏的缺陷显现出来,将占优观点不那么符合直觉的因素滤除了。那么,这究竟说出了证据决策理论哪一项缺陷呢?

伯杰斯认为证据决策理论要求最大化的预期是“条件证据预期后果”,但是在思维过程中,这种“条件证据预期后果”所基于的并不是真实的“证据(evidence)”,而仅仅是假设的证据。(Burgess,2004)让我们再来回顾一下前面证据决策理论论述纽康姆难题中采用的条件概率P(S[,i]|C[,j]);i=1,2;j=1,2。在行为人进行决策思考时,应当是什么情况呢?S[,1]/S[,2]是已经发生的事实,而C[,1]/C[,2]则不是事实,而是假设,因为这时我们还没有作出选择。也就是说,条件概率P不是给定行为下的状态的条件概率,而是给定假设的行为下的状态的条件概率,应当标为C′[,1]/C′[,2]更确切些。

这就是证据决策理论的缺陷,一项“证据的”决策,要求基于“条件证据预期后果”,而这又要求基于“条件证据概率值(conditional evidence probability values)”。这项要求在一些情况中无疑太苛刻了。这意味着,只有当前例为真时,你才能获得证明结果的证据。换句话说,你要获得生物预测你拿一个盒子的准确程度的概率,你必须已经拿了一个盒子。但是在纽康姆难题中,你还没有选择,因此给出的条件概率不能提供任何证据;而当其真的能够提供证据时,一切都太晚了——因为那时你已经作出选择。

从逻辑上看,条件概率[P(S[,i]|C′[,j]);i=1,2;j=1,2]可以写成[P(C′[,j]→S[,i]);i=1,2;j=1,2]。因此我们可以把证据决策理论的这种缺陷称之为结果论的弊病,即,由假设的条件出发推定现在的行动。如果我们将纽康姆难题中预期效用的观点换成逻辑表达式,就会更清楚(Horgan,1981):

(1)如果我选择全部盒子,那么生物会预测到这一点。

(2)如果我选择全部盒子并且生物预测到这一点,那么我将得到1000。

(3)因此如果我选择全部盒子,那么我将得到1000。

(4)如果我选择盒子B[,2],那么生物会预测到这一点。

(5)如果我选择盒子B[,2]并且生物预测到这一点,那么我将得到M。

(6)因此如果我选择盒子B[,2],那么我将得到M。

(7)如果(3)和(6)为真,那么我应当选择盒子B[,2]。

(8)所以,我应当选择盒子B[,2]。

其中(3)和(6)两项条件的得出并不是基于事实(fact),而是“如果我选择……那么生物会预测到……”,这被称之为“反事实(counterfactual)”(13)。从逻辑的角度说,“反事实受到模糊性的侵染”。(Horgan,1981)如果条件已经成为事实了,那么结论就是真的或者能够是真的,但是如果根本没有发生,那么结论就很可能是错的。在标准的逻辑解决方案中,这种倒推的(back-tracking)观点是错误的。(Horgan 1981)尽管Horgan(1981)的文章极力想证明在非标准的解决模糊性的方案中,这种倒推的方法可以是对的,但我们仍旧认为这种结果论的弊病是证据决策理论最大的缺陷。(14)

在遇到这种前例后于结果的情况下,证据决策理论无疑遇到了困难。这时候与其说是“证据”不如说是一种“信念”,行为人相信会产生这样的情况,尽管还没有行动。为了试图修正证据决策理论这一缺陷,杰弗里提出他的“确念主义(Ratificationism)”。(Jeffrey,1983)(15)

根据杰弗里,确念主义的一个解释为:“一项确念的决策是一种为最大化与概率矩阵相关的估算的满足程度的行为,该概率矩阵是行为人认为如果他最终决定为该行为时会拥有的概率矩阵”。(Jeffrey,1983,p.16)简而言之,当你作出选择时,选择成为你希望成为的人。也许这个解释作为定义在专家眼中显得有些模糊,因此Rabinowicz(1988,p.411)提出了一个更精确的定义:“一项决定为A行为的决策是确念的,当且仅当给定行为A的预期满足程度dA,至少和给定的任何可供选择的行为B的预期满足程度dA一样高。”

因此,确念主义告诉我们一旦你决定做某事,那么你执行该项决策的行为(无论成功与否)都不会再提供任何与条件预期效用相关的新的东西。(16) 根据确念主义,纽康姆难题可以得出选择两个盒子的论证。(17) 但是其证明的有一项条件却有些牵强——“不小心失了手”,这就好比无心的欺诈。如果生物的预测真的能够完全信赖,显然它能看穿欺诈——无论有意还是无心,作出正确的预测,那么最终的结论仍旧是一个盒子。因此,确念主义的两个盒子的论证似乎是在“求诸奇迹”。(Burgess,2004)

这样看来,确念主义的分析似乎是不完整的,但是更重要的是,确念主义还是躲不开对于证据决策理论最根本的批评,当条件证据概率基于的不是真实的证据,而是假设的证据时,该怎么办?杰弗里承认这看起来有些反常(Burgess,2004),但是仍然认为在通常情况下,证据决策理论是对的。

现在我们知道了运用证据决策理论论证一个盒子的选择的缺陷,(18) 当然也有一些人不承认存在这种缺陷。如Rapoport(1975)就认为将生物的预测这个已经发生的事实在主观上假设为在未来发生的事实是合理的,理由是我们的无知,不知道生物的预测究竟是什么。因此,他采取贝叶斯概率来分析纽康姆问题,认为纽康姆悖论源于我们混淆了事件的可能性的影响和事件本身的影响。

实际上Rapoport(1975)中的观点还代表了证据决策理论家对因果决策理论的一个主要批评:因果之间时间上的倒置究竟可不可能。因此,我们此时最好来考察一下因果决策理论家对纽康姆难题的分析,也就是两个盒子论者的解释。

四、两个盒子论者:一个证明

尽管诺齐克1969年的文章揭示了经典决策理论存在的缺陷,但是引起的更多是争议而非认同。诺齐克修正了适用条件预期效用原则和占优原则的规则,他指出,“这个例子(19) 至此为止引导我们相信如果行为或者决定为该行为的决策,并不影响(affect)、帮助引致(bring about)影响等等,既存的状态,那么无论怎样的条件概率(只要它们不表示一种影响),个人应当实施占优行为”(Nozick,1969)。因此,即便像前面所说的世界的状态概率上不独立于行为,但是由于对该状态的达至不产生影响,此时的条件概率P(既存的状态|可能的行为)就表示一种可能性,这样我们就可以不考虑这种条件概率,那么如果占优原则能够适用,就应当适用占优原则。证据决策理论家当然不会同意诺齐克的论证,因果决策理论家也很难接受诺齐克:尽管诺齐克表述了因果决策理论很重要的一点直觉,但是他的论证方式让人不能接受。(20) 诺齐克所表达的因果决策理论的直觉就是:信赖你的行为能够引致欲求的结果。因果决策理论也要求最大化预期效用,但是并不满意证据决策理论所简单要求的基于条件概率的条件预期效用。认为条件概率既能反映证据关系也能反映因果关系,而在决定是否为某一行为时,我们考虑的是为这一行为后的结果,而此时就要求这一结果是我们所为的行为之因果上的结果,而不是证据上的结果。(Pollock,2002)简而言之,因果决策理论要求我们为那些预期到会引致值得欲求的结果的行为。

与证据决策理论相比较,因果决策理论更注重理性思维过程中的复杂性,其不满足于简单的“证据”,而更强调行为与结果之间是否具有因果性。但更重要的是,因果决策理论可以避免证据决策理论对于条件概率过分的依赖性。我们已经知道,证据决策理论所要求的基于条件证据概率的条件预期效用并不能在所有情况下得到满足。而因果决策理论则可以避免这一点,因为其并不要求过强的条件证据概率,因此概率值的大小也就不在因果决策理论中扮演关键性角色。(21) 如伯杰斯所认为的那样,因果决策理论将其决策基于“惯常的条件期望后果(conventional conditional expected outcomes)”(Burgess,2004),二者并不要求特殊的条件证据概率,如果要使用到概率,也可以适用多种概率(22),只要其不会削弱行为与结果之间的因果性。而在这种情况下,因果决策理论完全有可能容纳证据决策理论的主张。因此,就理论上而言,因果决策理论似乎比证据决策理论更为合理。有因果决策理论家自豪地宣称,“因果决策理论是目前可供应用的理论中最好的理性选择理论”(Armendt,1988);而另有人认为,“因果关系应当被看作理性选择理论中的初始条件”。(Ledwig,2000)

然而,即便如此,将因果决策理论应用到纽康姆难题上的路途仍然不是一帆风顺,似乎要获得完满的解释仍然存在困难。例如Gibbard and Harper(1978)中证明拿走两个盒子是理性的,就仍然要假设生物的预测是绝对可靠的(infallible)(23),并将决策者限制为信仰决定论的世界,并且不具有运用倒推方法的直觉。因此证据决策理论者对于因果决策理论主要有四点批评。(Horwich 1985)首先,太过于复杂,与之相比证据决策理论不需要诉诸任何因果观念(Burgess,2004),因而远比因果决策理论简单,从而也能成为理论经济学的基石。(Horwich,1985)(24) 其次,存在必然的非理性,这指的是行为人的选择可能因为因果关系而被贴上非理性的标签。再次,独断的时间偏见,即因果决策理论家排斥原因后于结果这种情况。这是证据决策理论家最普遍的指责之一,诺齐克1969年的文章中就说明只有相信存在向后的因果关系(backwards causality),行为人才应该拿一个盒子(Nozick,1969),而这种魔术般的情况不应当存在。所谓向后的因果关系就是指这样一个问题:未来能不能影响过去?这实际上涉及一个“时间悖论”的问题。(25) 最后,规范性上的不一致,即行为人应当为某一行为的主张(assertion),和行为人愿意为某一行为的欲求(desire)之间应当具有紧密的联系,而因果决策理论在这两者之间却出现了断裂。

虽然如此,不过伯杰斯2004年的文章中终于为两个盒子论者的观点给出了一个充分的形式化证明。事实上,我们认为,诺齐克1969年所给出的解释,已经从直觉上为两个盒子的观点给出了一个较为合理的证明——最重要的,诺齐克的解释不需要附加诸如概率问题、时间问题、生物的性质等额外条件。但是,这种诉诸直觉的解释虽然直观,却显然不能为理论家们所接受。(26) 时隔35年之后,伯杰斯(2004)的文章中才最终为这一直觉解释赋予了形式化的证明。(27)

伯杰斯将纽康姆难题归类为一个共同因问题(common cause problem)。这里首先要说明的是,共同因理论最初是由Eells(1981,1982,1985)提出来的,作为对证据决策理论的一种修正,因此也被归入证据决策理论之中。(Ledwig,2000)但是该理论中使用了重要的因果关系之一般特征,并且该理论本身的特性,也受到因果决策理论家的欢迎,更愿意将其作为一种因果决策理论看待。(28) 这也从一方面说明了伯杰斯反对证据决策/因果决策二分法的观点,随着时间的推移、理论的修正,二者的划分越来越不重要。

何谓共同因?抽象地说,即一项事例中所包含的某些事态(state of affairs)具有双重影响,其中一方面是人类行为,另一方面是涉及其中的人所关心的东西。(Burgess,2004)举例来说,卡尔文教派的信徒相信过一种有德行的生活和救赎共同成为某种永恒不变的灵魂的影响;有些吸烟者相信,吸烟的倾向和致癌共同成为吸烟者具有某种基因构成的影响。前一个例子说明,救赎不是过一种有德行的生活的理性激励,而是两者共同构成另一个原因的影响;后一个例子说明,致癌并不是由于吸烟的癖好而导致,而是两者都是某种吸烟基因的结果。最后回顾诺齐克的儿子—父亲例子,成为运动员并不能避免不得遗传疾病,选择成为知识分子与得上可怕的遗传疾病共同成为F是G的儿子这一原因的影响。这样,共同因的因果关系结构就可以由图9表示出来(Burgess,2004):

在纽康姆难题之中,共同因就是在生物预测之时你的思想状态。用伯杰斯的话来说,就是被大脑扫描仪扫描之时行为人的大脑状态(Brainstate At the Time of the Brainscan,简称BATOB)。而两项相关的影响,则是行为人关于拿走一个盒子还是两个盒子的决策(SA),和生物关于往盒子B[,2]中放入还是不放入M的决策(SO)。(Burgess,2004)

共同因问题有一个特征,即存在一个占优的选择。在上述例子中,过一种罪恶的生活、吸烟、成为知识分子、拿走两个盒子,都比其他的选择——过有德行的生活、不吸烟、成为运动员、拿走一个盒子——要好。正如前面所阐述的条件证据预期后果存在的缺陷,伯杰斯认为,基于占优选择的惯常预期后果比基于非占优选择的惯常预期后果要更好,而且无论概率取何值结果都是如此。(Burgess,2004)因此,与其他因果决策理论相比,共同因理论可以更好地绕过概率问题的束缚,并且对于难以确定的因果关系,也能够进一步简明化。

现在我们来证明纽康姆难题(29)。行为人的决策要最大化他的预期效用(即伯杰斯所称的惯常的条件期望后果),就要最大化盒子B[,2]的预期效用,与此直接相关的是生物放入或者不放入M的概率是多大(参见占优观点的支付矩阵图3),而这和行为人的决策一起,取决于共同因BATOB。同时,生物的预测,作为一个中间步骤,也是BATOB的结果,与其构成一个条件概率判断生物预测的准确性。(30) 要获得生物放入或者不放入M的概率,同时取决于(1)行为人思考为何种决策的概率和(2)生物的预测准确性的概率。因此,首先我们假设行为人想要选择一个盒子的概率为α,即:根据行为人现在的认识状态,

这就是对诺齐克(1969)的直觉解释的一个形式化证明。(33) 但诺齐克的解释有些模糊,(34) 而这个证明则在形式上比较完满。在这一证明中,期望效用确切地说是建立在实际的行为之上的:思维状态—生物预测—生物行动—行为人选择。对比前一节中的证明:如果行为人选择X,那么生物预测行为人为X。显然前者逻辑上更严谨、更具有说服力。其次,这个证明中使用的是条件因果概率。显然条件因果概率比条件证据概率逻辑上更为合理——生物的预测准确性是根据因果关系确立概率,因此不会出现条件证据概率中根据假设的“证据”确立概率这种情况,并且预测准确性的值可以变动,但不会影响最终结果。再次,证明中另一个非条件概率,是行为人可能作出的选择。注意,这里的α的含义与宾默尔的证明中的π含义是不同的。并不表明一种随机选择,而是既存的某种状态,在纽康姆难题中特指行为人过去的理性思维。这里α的值可以变动,这表明因果决策理论更注意思维的复杂性,但是最终结果不变。(35) 因此,总的来说,因果决策理论中概率的建立比较复杂(因为要确定因果关系),但是概率又不会如同证据决策理论中扮演关键角色(其值的大小的变动并不一定产生绝对影响),因此,可以说概率问题的重要性削弱了。最后,这项证明没有为纽康姆难题的原初陈述增添或者减少任何实质性内容。

到此为止,我们为纽康姆难题给出了一个较为满意的证明,但是似乎仍存在某种缺憾。如果说关于“是否存在时间倒置的因果问题”因为涉及物理学的难题我们可以不去理会的话,那么仍然还存在一种嘈杂的声音:“既然你证明你的选择是理性的,那么为什么我们这些‘非理性’选择的人都加入了百万富翁俱乐部,而你只能拿着你那可怜的1000回家?为什么你不富有?”

伯杰斯在完满的证明之后面对这个问题也有些为难。他的方式是将纽康姆难题的决策过程分为两个阶段:(1)你知道自己处于BATOB阶段,正在接受BATOB;(2)你不知道自己处于BATOB阶段,已经经过了BATOB。对于前者,他建议选择一个盒子;后者则选择两个盒子。这实际上削弱了他前面证明的力量,突出了其中的一个假设,不知道过去的既定的状态。因此他称自己的方法是“一项不合格的解决方案”。(Burgess,2004)事实上这是一个能够使所有因果决策理论家都感到尴尬的问题,既然我是理性的,为什么给我带来的却是糟糕的结果?

五、决策价值:一种可能

这也就是诺齐克在面对纽康姆难题时犹豫不决的原因。因果决策理论家提出的证明从逻辑上看是理性的(rational),但却为何总是不能让人觉得合理(reasonable)?如果一项理性的决策不能给人带来幸福,反而引致不幸,我们还能认为这是理性的选择吗?或者更激进一些,我们还能相信理性吗?如果我们仍然坚信“理性不仅仅只是获得知识或者增进我们的生活、改善我们社会的工具,而且是人类自我形象至关重要的要素”(Nozick,1993,p.xii),那么我们必须为此给出一个解释,或者至少给出一种可能的解释。

诺齐克从直觉上感到纽康姆难题包含的困难远不止如何选择那么简单,其复杂性存在于更深处,而我们只不过是容易犯错的生物。因此,他主张,“关于这类事例对任何一种特定的推理或者任何一项特定的决策原则都寄予绝对的信心是不合理的”。(Nozick,1993,p.43)这样,在回答纽康姆问题近二十五年之后,他明确指出,无论证据决策理论也好、因果决策理论也好,单独采取任何一项原则都不是解决纽康姆难题的途径。至此,诺齐克强调了他的立场,如何选择是不重要的,重要的是为什么这样选择。与经济学家、博弈论专家、决策理论专家不同,诺齐克更关注的是选择的意义,因为对个人的行为来说,有时候选择的意义才是决定选择的关键。

因此,诺齐克注意到了纽康姆难题中一个不太惹人注意的问题:盒子B[,1]中的1000。(36) 他没有去关注诸如概率问题、时间问题、生物性质问题这些被众多理论家讨论的问题,而是问,如果这1000变动,我们会怎么选择?如果盒子B[,1]中的1000变成了990000,一个盒子论者是否还会嘲笑两个盒子论者,而坚决不去碰那透明的盒子B[,1]?(37) 如果盒子B[,1]中只有1,两个盒子论者是否还会十分自信地依靠自己的理性,坚定地拿走两个盒子?诺齐克注意到这样一个直觉事实:随着盒子B[,1]中钱的数量的变化,一个盒子论者与两个盒子论者的数量也会随之而变化。

理性选择包括三部分内容:信念(belief)、欲求(desire)和理性思维过程(rational deliberation)。(Armendt,1988)那么是否一个符合逻辑的理性选择过程就能包含理性选择的全部?除了这种单纯的理性之外,我们的选择是否还具有其他意义?考虑这个例子:

上帝摆在你面前两个盒子。一个盒子是透明的,你可以清楚地看见里面摆着自由;第二个盒子是不透明的,里面或者摆着爱情,或者是空的。上帝是全知全能全在,他可以清楚地预知你的选择。现在摆在你面前的选择是两种:(1)只拿走第二个盒子;(2)拿走全部两个盒子。上帝告诉你,如果他预知到你只拿走第二个盒子,那么你将确定地获得爱情;如果他预知到你拿走全部两个盒子,第二个盒子将确定地是空的。现在你选择。

此时,一个盒子论者也好、两个盒子论者也好,是否还能百分百确定地作出他们的选择?如果你只选择爱情,在你余下的生命中是否永不后悔,不后悔失去的自由?如果你选择拿走两个盒子,你是否决意面对不幸,注定成为世界上最孤独的人?

此时,如果行为人要作出理性选择,他的理性的依据之一就在于他怎样衡量“爱情”和“自由”。事实上,预期效用最大化原则和占优原则根本目的上是一致的,都是为了最大化条件预期效用,只是各自的依据不同。这也是证据决策理论与因果决策理论的分歧所在。因而,行为人的这种衡量就将会影响其对不同决策原则的信心,或者说,不同决策原则的合法性力量(legitimate force)将会随着决策人对不同选择的价值的估计的变化而变化。因此,诺齐克提出一种新的决策原则:行为人将选择最大化决策价值(DV)的行动(Nozick,1993,p.45),即:

DV(A)=Wc×CEU(A)+We×EEU(A)(1)

A表示选择的行动;CEU(A)表示行动A的因果预期效用;EEU(A)表示行动A的证据预期效用;Wc表示对行为人赋予根据因果决策理论的原则行动的权数;We表示对行为人赋予根据证据决策理论的原则行动的权数。诺齐克特别强调,这里的权数不是衡量不确定性,而是衡量各原则的合法性力量。(Nozick,1993,p.45)

一个决策价值的最大化者,只要其不对Wc和We赋值为0,那么就能允许其在纽康姆难题的境况中变换他的选择:根据盒子B[,1]中钱的数量不同;根据不同年龄对“爱情”和“自由”的不同看法。此外,DV的构成完全可以变化,可以依据可能世界的不同而改变其中的决策原则,诺齐克就在其中加上了象征性效用(symbolic utility),决策价值的(1)式就变化为(Nozick,1993,p.48):

DV(A)=Wc×CEU(A)+We×EEU(A)+Ws×SU(A)(2)

其中,象征性效用是指由于行动的象征性意义而赋予结果或者行为的效用。(38)

值得注意的是,上述式子都不是严谨的数学表达式,而仅仅是表明一种决策结构。其中,各个组成部分的表达式及其权数的赋值,都涉及到极为复杂的问题(Cleave,1994),并且如象征性效用这种组成部分,并不一定要采取这种形式纳入决策价值之中。

不过决策价值极大的灵活性仍然对于我们的现实决策具有启示。诺齐克想通过决策价值表明,在我们的理性决策中,没有任何一个单一的原则能够是完全充分的。(Nozick,1993,p.46)人们采取何种决策取决于我们处于何种可能世界之中,因此可能并不存在最好的理性决策原则。

为了表达诺齐克这种思想,我们最好将决策价值通过纽康姆难题应用到囚徒困境中来。囚徒困境实际上是两个纽康姆难题,刘易斯1979年的文章标题就表达了这种观点:《囚徒困境是一纽康姆难题》。与其他作者不同,刘易斯强调的是,这两个问题不是相关,而就是同一个问题。我们可以把囚徒困境中的坐牢年限的负效用转化为用纽康姆难题中的金钱衡量,因而囚徒困境的支付矩阵就变为如图7所示。但是要将保持沉默与拿一个盒子等同,告密与拿两个盒子等同,还需要进一步的证明。(39)

假定我们自己就是囚徒困境中的一名囚徒,分析一下我们自己会怎样思考?首先我面前有1000,拿或不拿;其次还有一个小盒子,里面可能有M,可能是空的,拿或不拿;再次,如果我要拿到M或者更多,当且仅当你不拿你那1000。因此,我想要确定你是否拿那1000。此时我认为你是理性的,那么你也一定会和我有同样的想法,(40) 拿不拿1000,拿不拿小盒子,最后,“我”拿不拿那1000。此时我再冷酷一点,严格一点,我认为你同我一样理性,或者至少不比我差,你能绝对地和我一样思考,也就是说你能揣摩我的思想,因此,你能“预测”我拿不拿那1000。这样,我的第三步思维就转变为:如果我要拿到M或者更多,当且仅当你预测到我不拿那1000。

这时,囚徒困境中囚徒的思维,就转变为纽康姆难题中行为人的决策思维;而囚徒困境中的另一名囚徒,在我这个囚徒的思维中,就转变为我的“复制人(replica)”,一个能完全复制我的思想,因而能预测我的思想的生物,也就是纽康姆难题中的生物。这样我们就将囚徒困境中的囚徒博弈各自转化为两个纽康姆决策。因此,可以认为囚徒困境就是纽康姆难题,二者在本质上是同一个问题。

值得注意的是一个问题,在纽康姆难题中直觉将我们引向证据决策原则,拿一个盒子。但是在囚徒困境中我们倾向于因果决策原则,占优策略,告密。因此,我们或许可以认为,如果在囚徒困境中有某种方式能够将我们的直觉引向证据决策原则——预期效用最大化,那么我们最终就能得出合作——不告密——的策略。但事实并不如此简单,在囚徒困境中证据决策理论也能将我们引向不合作——告密——的策略,只要我想像中的另一名囚徒——复制人——总倾向于不跟我合作,即为与我不一致或者敌对的行为,使他自己的效用最大化。(Nozick,1993,p.52)(41)

现在我们来看决策价值应用到囚徒困境中的情形。我们回顾图6中给出的囚徒困境的一般形式。根据决策价值在纽康姆难题的应用中表明,随着盒子B[,1]的价值的变化,行为人遵从的决策原则会改变,从而选择会改变。在囚徒困境中,只要我们改变了A[,1]>A[,2]>A[,3]>A[,4]和B[,1]>B[,2]>B[,3]>B[,4]的价值排序,博弈参与人的决策原则就会改变,选择从而也会改变,进而不合作的策略就会转变为合作策略。初看起来也许这并没有任何新意,博弈论专家早已想到用“可以置信的威胁”——例如黑社会,改变支付,从而改变博弈的均衡结果。但是这里缺少一个决策逻辑步骤,因而似乎告诉我们,我们只不过是利己动物,钱多钱少(或者用经济学家喜欢的“效用”)可以改变我们。决策价值明确指出,是我们所依据的决策原则决定我们的选择。将带有象征性效用的决策价值应用到囚徒困境之中,我们就可以为我们的博弈增添一个意义层面。如果我是一个坚持原则的人,总是偏好于选合作,“合作”的行为与“不合作”的行为相比,带给我一个绝对的象征性效用。这时如果我是一个决策价值最大化者,我根据(2)式的决策结构行动,我的象征性效用为SU[EEU(A)]。此时决策价值会将我的决策引向证据决策原则,由于我们不知道博弈的另一方是一个怎样的人,所以我们不能断言博弈的均衡结果一定会是(合作,合作),但是至少不会再是(不合作,不合作)。(42) 此时,信奉效用最大化者肯定会指出,这种情况下,最有可能的结果是左下角或右上角,坚持合作者一无所有,不合作者获得一切。确实,我们不能消除这种末世论的悲观。但是,在这里我们不想假设每个人都是带着原罪的囚徒,而是想指出,采取象征性效用之后,我们在博弈中更会倾向于通过判断对方是怎样的人,而采取不同的选择。现实中,直觉告诉我们如果我知道对方也是一个偏好合作的人,我也会偏好合作。因为我的象征性效用SU(我为合作行为|他为合作行为)会大于SU(我为不合作行为|他为不合作行为),并且如果我自己不是一个偏好不合作的骗子,那么更会大于SU(我为不合作行为|他为合作行为)。从而,加上象征效用之后,我的决策原则,进而我的选择会发生变化。囚徒的困境因此而在某些可能世界中消散。

六、选择的意义:一个结论

至此我们暂时完成了全部分析。本文从纽康姆难题开始,讨论我们的理性选择困境。我们认为纽康姆难题是一个明确完善的命题,不存在构成问题(ill-formed)。和博弈论中囚徒困境一样,纽康姆难题表述了一个个人决策中的一般困境。博弈论方法在分析纽康姆难题上并不成功,因为博弈论中个人的决策原则基础模糊不清,在很大程度上,我们认为博弈论基于的是证据决策理论,因而存在着与证据决策理论相同的缺陷。这一缺陷就是用假定的前提条件推论结果。那么在纽康姆难题这种情况下,所谓的结果已经存在,而前提尚未出现,论证的结果就将显得荒谬。在现实中,面对这样一种思考:如果我怎样做了……那么我就能怎样……理性的行为人应当只将其作为一种可能,如果没有确切的因果关系能够支持这一“如果……那么”的反事实陈述,那么不能作为一项决定行为人决策的证据。因此,因果决策理论在逻辑上和现实中都更具有说服力。证据决策理论太依赖于概率问题,而概率本身就存在许多难题。运用共同因方法分析纽康姆难题,我们可以在很大程度上绕过概率问题。因此,共同因分析给出了纽康姆难题一个形式化证明。

但是这还不足以平息纽康姆难题。一项理性选择包含信念、欲求和理性思维,当我们厘清了我们的思维过程之后,能否就说我们解决了理性选择的一切难题了呢?汪丁丁曾说,囚徒困境意味着经济学理性走到了尽头。(汪丁丁,1998)但是更确切地说,纽康姆难题真正突显了这种困境,然而却又将理性引领到了更高的层次。我们的理性选择应当包含更深刻的价值。诺齐克的决策价值展现了一种可能,我们可以通过一种决策结构引入那些被我们过于单纯的理性思维所忽略的价值和意义,从而使纽康姆难题在某种程度上得以平息。而将囚徒困境转化为纽康姆决策进行分析之后,这也表达了另一种可能,在多人博弈的决策中纳入决策价值的结构,从而使博弈分析具有更坚实的决策基础。但是我们应当承认我们的分析到了这一步还没有完结,仍旧留下一道门,通向另一个领域。决策价值告诉我们对效用的衡量将会影响我们适用何种决策原则,这就事实上将我们引向另一个问题:我们如何评价我们的效用。

最后,每一个讨论纽康姆难题的作者都会表明自己的选择。因此,我也应当表明自己的立场:我会选择两个盒子。选择两个盒子并不仅仅表明我相信因果决策理论家的理性证明,更是表明我信任自己的理性,信任自由意志,这种信赖赋予我一种绝对的象征性效用,促使我坚定地拿取全部两个盒子。哪怕最后的结果我只能得到1000,只能注定成为世界上最孤独的自由人;哪怕这种结果重复一千次,只要没有任何人或事改变我对于理性、对于自由意志的象征性效用,我的选择不会变。并且我坚信这是我的理性选择。用阿西莫夫(Isaac Asimov)的话来说:

我会毫不犹豫地拿走全部盒子……我自己是一个决定论者,但是对我来说很清楚任何值得被认为是人的人(相当确定地包括我自己)都会偏好自由意志,如果它是存在的……那么现在,假定你拿走全部盒子并且(这几乎可以确定)上帝预见了这一切而让第二个盒子空着。你至少表达了你的意愿,赌一次他并非全知,赌一次你自己的自由意志,并且为了这个意愿情愿放弃那一百万美元——扇全能者一耳光,为自由意志投上一票,无论多么徒劳……然而,如果你只拿走第二个盒子,你获得了你那一百万美元,不仅证明你只是个奴隶而且证明你甘愿为了一百万而成为一个奴隶,你不再是那个我所认为的成为人的人。(Nozick,1974)

注释:

①罗伯特·诺齐克(Robert Nozick)在对纽康姆难题的三次主要讨论中(Nozick 1969,Nozick 1974,Nozick 1993),分别叙述了纽康姆难题,在细节的着重点上稍微有所差异。本文中的陈述主要基于诺齐克第一和第二次的陈述。

②如果严格按照诺齐克的说法应当是“拿走盒子里的东西”。这是为了防止一种“魔术”观点:如果我成功欺骗了生物,生物放了M,而我又拿走全部盒子,生物会不会在我拿起全部盒子的同时,把其中的M魔术般地变没了?我们此处不这样写的原因是:(1)这种观点太“幼稚”;(2)根据纽康姆难题的陈述生物只有预测能力,不具有其他特异功能;(3)汉语使用上的便利。

③一些人认为纽康姆难题是由诺齐克本人提出的(参见Schmidt-Petri,2004),是一种误解。

④一些作者并不同意如此的划分,认为区分这两类标签不过是“不公平的、简单化的权宜之策”(Burgess 2004)。在本文中,我们暂时接受这一权宜之策。

⑤事实上真的两种选择会“无差异”吗?也许,如果真的处于这样的概率之中,那么行为人可能真正陷入困境之中了。

⑥这里假设了货币数量可以完全代表行为人的效用。

⑦根据纽康姆难题的陈述,这一点很容易做到。

⑧诺齐克1969的文章中并没有特别说明“条件预期效用”,而只是称“预期效用”。他在1993年的文章做了修正。

⑨由于决策理论家各自专业方面的差异,所用的术语并不非常统一。这里所说的“预期的满足程度”“预期后果”实际上都是同一个概念,其中“满足程度”是杰弗里的术语。就经济学家来说,更偏好的术语是“预期效用”。本文中将视情况决定选用何种术语。

⑩Ledwig(2000)中列举了五种最著名的证据决策理论,杰弗里的理论占据四种(Jeffrey 1965,1983,1986和1996),并且其余四种理论都以杰弗里1965年的《决策的逻辑》(The Logic of Decision)中的理论为基础。

(11)诉诸直觉上的解释是诺齐克的一种独特论证方法,也是最容易受到攻击的方法,因为不仅令人困惑,而且不严谨、缺少形式化(Rapoport 1975)。

(12)以下的论证可以参见Nozick(1969),稍作变动。

(13)关于“反事实”和“反事实条件(counterfactual conditionals)”的详细说明参见Horgan(1981)。

(14)而事实上Horgan(1981)中的证明仍然要赋予生物的预测准确度以最高优先性,也就是说,仍然回到了概率问题上。用Schlesinger(1974)中的观点来说,就是哪怕在之前一千次选择中都证明生物的预测是正确的、我的选择是错误的,也不能证明下一次我的选择仍是错误的,因为生物的预测准确性仍然只是一个推论而非事实。另一方面,这也是在用逻辑上归纳推论的模糊性来驳斥Bar-Hillel and Margalit(1972)中对重复博弈的依赖。

(15)杰弗里的确念主义是受到Eells(1981,1982)的理论的启发而提出来的(Ledwig 2000)。此外除了确念主义之外,还有许多其他修正的证据决策理论,例如the Tickle Defense。

(16)这也就是旨在去除原有的证据决策理论遇到纽康姆难题这种前例后于结果的情况时,因为条件概率基于假设的证据而带来的模糊性。既然行为不会为预期结果带来任何新的东西,条件概率是否基于事实,也就不是那么重要了。

(17)假设四种情况(1)决定拿走一个盒子,实际也只拿走一个盒子;(2)决定拿走一个盒子,实际却拿走了全部盒子;(3)决定拿走两个盒子,实际也只拿走两个盒子;(4)决定拿走两个盒子,实际却拿走了一个盒子。对应的四种条件预期效用为(1)M;(2)M+1000;(3)1000;(4)0。因此,无论如何都是实际拿走两个盒子的选择占优(Burgess 2004)。

(18)当然,也存在一些一个盒子论者并不是证据决策理论家。Bar-Hillel and Margalit(1972)就是个例子。

(19)文中指的是“囚徒困境”(Nozick 1969)。

(20)因此,当人们论述因果决策理论时,总是围绕着Gibbard and Harper(1978)、Skyrms(1984)、Sobel(1986)和Lewis(1981)等人的工作,诺齐克不在其列。

(21)但这也不是说因果决策理论不涉及概率问题。事实上,因果决策中的概率的建立更为复杂。

(22)确切来说,是条件因果概率(conditionally causative probability)、非条件概率或者两者的结合(Burgess 2004)。

(23)这事实上颇有点和他人的直觉相反,一个盒子论者往往是在这个条件的支持下来证明一个盒子的观点的,如Horgan(1981),Hubin and Ross(1985)。

(24)确实,即便在因果决策理论家内部,因果关系也是个复杂的问题。因此,Ledwig(2000)中对因果决策理论列出了六种观点。

(25)Schmidt(1998)就从量子物理的角度证明未来影响过去的情况是可以发生的,因而向后的因果关系是可以存在的。

(26)例如存在这样一个问题,诺齐克说他举的直觉例子和纽康姆难题本质上是一致的,只是纽康姆难题存在一种“幻觉”:认为我们的未来行为可以改变过去。但是为何会出现这种幻觉呢(Hurley 1994)?

(27)不过令人感叹的是,伯杰斯(2004)的文章中丝毫没有提及诺齐克的名字,更没有引用任何诺齐克的文献。似乎,纽康姆的名字还存在,而诺齐克已被人淡忘。

(28)同样,也有人将杰弗里的确念主义作为一种因果决策理论(Ledwig 2000),尽管杰弗里自己不那么认为,而认为是对证据决策理论的辩护。

(29)以下的论证参见Burgess(2004),略作修改。

(30)这里,就与博弈论专家的观点不同,生物的预测和生物的行为不再是一致的了(Brams 1975),前者只是一个中间步骤,行为才是最终结果。这也体现了因果决策中的复杂性。

(31)C′[,1]/C′[,2]表示我们的理性思考而不是真实的选择,这与我们前面的论述相一致。

(32)S[,1]/S[,2]的赋值与前面相同,表示生物预测到行为人拿两个盒子/一个盒子。

(33)我们可以用相似的方法将诺齐克所举的“儿子—父亲”例子形式化,例如将F是谁的儿子的概率假定为α,在此基础上设定条件因果概率P(是否具有知识分子倾向|谁是父亲),而偏好成为知识分子则是一个明确的效用——相当于纽康姆难题中的1000。结论也是相同的。

(34)相当于证到EU(C[,1])=EU(B[,1])+EU(B[,2])>EU(C[,2])=EU(B[,2])就结束了。诺齐克直觉上认为概率并不重要,这在某种程度上也的确是对的,但是缺乏后面的证明就显得缺乏说服力。

(35)这里初看起来或许让人觉得疑惑:我曾经做过理性思考,但是事后我却想不起来?事实上这里很明确,一是排除那种具有无限回溯性的超级理性;二是表明一种动态的思维过程,无法确定思维进行到何种状态。

(36)Sobel(1988)中触及到了关于盒子B[,1]中的1000的问题,但是并没有深入。

(37)事实上,如果根据一个盒子论者的预期效用最大化,如果假设生物预测准确程度的概率为0.99,只要盒子B[,1]中的钱大于980000,行为人就会选择拿走两个盒子(Nozick 1993,p.44)。

(38)关于象征性效用,涉及到效用理论的问题,在本文中不再展开。

(39)Lewis(1979)给出了一个证明,我们以下的证明做了改动,有不一致,但结论相同。

(40)或者说至少我假设你会,这里意味着一种心理学上的假设。

(41)这里直指特定囚徒困境下的道德基础,关于此方面的论述,参见韦森(2002)。

(42)因为这里“我”是一个总倾向于“合作”的老好人,所以前面所说的“证据决策原则可能会导向不合作的策略”这种情况不再发生。

标签:;  ;  ;  

可能世界上的选择:纽科姆问题_囚徒困境论文
下载Doc文档

猜你喜欢