Newcombe难题求解的确定性路径_决定论论文

纽科姆难题消解的决定论路径,本文主要内容关键词为:决定论论文,路径论文,难题论文,纽科姆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B815 文献标识码:A文章编号:1007-8444(2013)02-0183-06

人是理性的动物,这其实意在表明一个本质性的观点,即人是理性行动的动物或者是基于理性而行动的动物。人之所以在行动中据以理性,原因在于,尽管对于行动主体来讲,理性所带来的收益可能是个预期,但是,通过理性的分析以及相应的推导、计算,并依此而行动,他能够在行动结束之后取得较好的收益,或者我们通常认为的“实现收益的最大化”,而不是毫无目的的非理性而导致的不确定的、随意的某种收益。

然而,对于同一个选择或决策情景,基于理性的行动能否确定性地带来“最大化的收益”,这是一个复杂的问题,因为基于理性而作出的选择可能存在不同的出发点,这样可能导致行动主体依不同的策略而行动,其最终的收益也会是不同的。因此,理性并不一定意味着选择的确定性。在这类选择情景中,看似合理的行为之间是有冲突存在的,这被称为合理行为悖论。合理行为悖论中最为有名的就是纽科姆难题。

纽科姆难题从表面看来是理性引发的冲突所造成的,即选择理论中期望效用最大化原则与占优原则之间存在差别所致,这是许多学者所持的基本观点。但从本质上讲,它产生的原因在于自由意志与决定论之间的冲突。

一、纽科姆难题

囚徒困境表明,个人看似理性的行为最终会导致不理性的收益,这导致的一个后果是对人类理性的挑战。纽科姆(W.Newcomb)在考察囚徒困境时,针对选择中的理性行为问题,进行了深入的思考,建构了纽科姆难题。1969年,诺齐克(R.Nozick)在一篇名为《纽科姆难题和决策的两个原则》[1]的论文中公布了这一难题,标志着该难题在学界的正式提出。

纽科姆难题是从另外的一种层面上对人类理性构成的一种挑战,对于选择理论的研究来讲具有极其重要的意义。在该难题正式提出的20年后,诺齐克在《理性的本质》一书中指出了它的研究意义:“一种精心建构的关于合理决策的理论已经被经济学家和统计学家发展了出来,并被广泛地应用于理论与政策的研究当中。该理论具有数学的严格性,是强有力的,也是容易被掌握的。作为对实际行为的描述,尽管其充分遭受广泛质疑,但它依旧在涉及合理决策所应满足条件的研究中处于支配地位。我认为,该理论应当拓展至与行为的符号意义以及其他相关因素的清晰考量相结合。正是纽科姆难题提供了一个对当下标准理论不充分性认识的有益入口。”[2]

在正式提出之后的众多研究中,纽科姆难题有许多描述版本,这里,我们采用诺齐克在《纽科姆难题和决策的两个原则》中的原始描述:

设想存在一个这样的生物(当然,也可以把它想象为一个来自于外星球的生物,已经掌握了先进的科学技术,此外,它对我们是极其友好的,等等,尽管这可能是一个科幻故事,但这故事可能使我们觉得更为有趣而愿意配合它进行一个选择实验),它具有超级的能力,能够预测到你将要做出的选择。

它的预测能力你可能早有所耳闻,它能够经常正确地预测到其他的选择,而且它与你所进行的关于预测的打赌中,从来都没有出现过错误。关于这个生物的预测能力,可以简单地归结为一句话:所有关于其预测能力的描述都会使得你相信它对你做出选择的预测都是正确的。

那么,这次关于它对你的预测是这样一个选择:在你面前有两个盒子:A盒、B盒。A盒里有1000美元,而B盒在他做出预测前是空的,他预测后才决定是否放入1000000美元。这时你选择是:或者只拿走B盒,或者同时拿走两个盒子。这个超级生物在这个选择中所要做的是:(1)如果它预测到你只拿B盒,则它在B盒中放入1000000美元;(2)如果它预测到你拿走两个盒子,他就不在B盒中放任何钱。

上面的关于选择的信息你是知道的,而且它也知道你是知道的,于是它做出了预测,而后依据预测对B盒实施了与放钱有关的某种行为。现在请你做出选择,你进行怎样的选择才是合理的:只拿走B盒,或两个盒子都拿走?

这里,合理行为是体现行动主体理性人与经济人品质或本质的行为或行动,通过理性,他能对行动或行为的后果进行有理由的判断,而通过经济人的理念,使得他能采取收益最大化的那个行动。理性人与经济人是行为中各方的公共知识,只有这样,选择中各方才能对行为或行动作出理性与否的判定。

这是一个带有“超现实假设”的思想实验。盖夫曼(H.Gaifman)的研究表明,该选择可以去掉超现实的假设,而依然可以保持难题本身迷人的吸引力[3];孔斯(R.C.Koons)曾去掉“超现实假设”对该难题进行过改编以及相应的研究[4]。

在纽科姆难题的选择情景中,有两点是超级生物与行动主体的公共知识:(1)超级生物的预测能力;(2)超级生物关于预测的B盒放钱行为。

一方面,超级生物具有预测能力,这一定要成为双方的公共知识。对这一点要求的刻画是,超级生物知道他自己具有预测能力,行动主体知道超级生物具有预测能力,超级生物知道行动主体知道超级生物具有预测能力,行动主体知道超级生物知道超级生物具有预测能力,等等,以至无穷。超级生物知道行动主体知道超级生物具有预测能力,那么,它所进行的预测以及相应的行为,对于该难题来讲才是有意义的,或者它的行为不至于是无用的。此外,行动主体知道超级生物知道超级生物具备预测能力,他才能完全确定超级生物会在该难题发挥应有的作用,而他自己会正确对待而不至于应付了事。

另一方面,超级生物在进行预测之后一定要根据其预测实施放钱与否的行为,这也要成为双方的公共知识。这一点保证了双方知道对方是否知道超级生物是否实施了放钱行为,这会使得选择按照正常的轨道进行。即使有了前面的第一个公共知识,而这一点不成为公共知识,那么,超级生物的预测对该选择不造成任何影响,行动主体在选择时会出现犹豫不决。

因此,这两个公共知识都是必要的,如果不存在第一个公共知识,那么该选择是一般的、带有不确定性的选择。第二个公共知识与第一个相关,涉及超级生物作出预测后放钱与否的行为,如果这一点不是公共知识,行动主体不知道超级生物的实施预测后是否遵守与否的诺言,那么,行动主体选择的作出就无法用来说明行为的合理性,或者其所谓合理行为具有误导的因素。

那么,行动主体(或实验中的“你”)在这种情景下如何作出选择呢?

二、纽科姆难题何以为难题

纽科姆难题之所以成为选择理论或悖论中的一个有名的难题,原因在于行动主体面临如下棘手的选择情景:选择两个盒子是最合理的行为,只选择B盒也是最合理的行为,这两个最合理的行为都能够在逻辑上给予确定的论证。张建军的研究表明,这两个论证的合取会自然而然地推导出这样一个矛盾的结论,即“把两个盒子都打开既是最合理的行为又不是最合理的行为”[5]223。

推导出这两个具有矛盾性结论的论证都具有直观上的合理性,选择拿走两个盒子的论证是:行动主体在作出选择时,超级生物已经作出预测并实施了放钱与否的行为,或者在B盒中放了1000000美元,或者没有放。如果超级生物在B盒中放了钱,行动主体选择两个盒子,他会得到1001000美元,这一情况要好于他仅仅选择B盒而只得到1000000美元的情形;如果超级生物在B盒中没有放钱,即使行动主体选择两个盒,他也会得到1000美元,在这种情况下,如果行动主体仅仅选择B盒,他什么也得不到。故而,选择两个盒是合理的选择。

只选择拿走B盒同样也有充足的论证理由:由于超级生物的预测能力,如果行动主体选择拿走两个盒子,超级生物不会在B盒中放钱(因为他预测到你要拿走两个盒子),他的收益仅为1000美元;而如果行动主体选择仅拿走B盒,由于超级生物会预测到这一点,则B盒中会有1000000美元,这时,行动主体的收益会是1000000美元。因此,仅拿走B盒是合理行为。

这两个论证分别体现了行动主体作出选择时的期望效用最大化原则和占优原则。

诺齐克[1]则通过对世界状态的描述,引入选择时的时间因素、置信度以及超级生物预测准确性的概率,从两路(期望效用最大化原则和占优原则)出发,形式上论证了拿走两个盒子不是合理的行为,而仅拿走B盒才是合理的行为。他也认为,结论的得出表现出了两个选择原则之间的冲突。孔斯(R.C.Koons)通过引入“可辩护”算子J,抽取掉“超现实假设”,在理论上形式地论证了拿走两个盒子与拿走B盒都是合理的,两个原则间的冲突具有理论上的不可避免性[4]。因此,学界把该难题称为“合理行为”问题[6],基于此,根据悖论的一般性定义,张建军则称之为“合理行为悖论”[5]233。

之后,杰弗里[7](R.C.Jeffrey)、莱法[8](H.Raiffa)、斯基姆斯[9](B.S.Kyrms)则开启了标准化研究的进路。标准化研究进路表明,在选择情景中,行动主体应当依照最大化条件效用的原则来作出相应选择,而占优原则需要进一步地被细化才能应用于选择情景。艾尔斯(E.Ells)的观点是,可以通过修改最大化条件效用的原则来解决纽科姆难题[10],他对行动主体的建议是拿走两个盒子,因为这是对条件效用计算的结果。刘易斯(D.Lewis)则对此进行了批评,认为“艾尔斯的理论只能应用于理想的合理决策者”[11],而现实则是颇为不同的。吉伯德(A.Gibbard)和哈伯(W.L.Harper)则通过引入U效用、V效用等概念的使用,推导出与艾尔斯相同的结论,即拿走两个盒子是合理的[12];但他们所提供的答案是建立在直觉的基础上的,并不能使人满意。

三、纽科姆难题的消解:来自决定论的方法

在纽科姆难题选择情形中,一个十分重要的公共知识就是超级生物具有预测能力,超级生物和行动主体都知道超级生物具有预测能力,并且行动主体知道超级生物知道超级生物具有预测能力,超级生物知道行动主体知道超级生物具有预测能力……关于超级生物具有预测能力的这一公共知识假定,使得行动主体在纽科姆难题的选择情形中,不得不考虑到这一点,即是说,他在选择时受到了这种预测能力的影响。

对纽科姆难题的一般性研究中,自由意志论者进行选择的机制是,超级生物与行动主体之间的选择行为可以被看做一个博弈,如表1所示:

由于在纽科姆难题中仅涉及行动主体的收益,我们在这里也仅仅标出行动主体的收益,图中的数字就是他的收益,而不考虑超级生物的收益如何。表1中超级生物有两种策略行为:在B盒中放钱或不在B盒中放钱;当然,他的这种策略行为是在他作出预测后实施的。行动主体也有两种策略行为:只拿B盒或拿走两个盒子。不难看出,对于行动主体而言,无论超级生物在B盒中放钱,还是不在B盒中放钱,他的占优选择都是拿走两个盒子。

而前面所阐述的行动主体只拿走B盒并没有体现出占优原则,虽然起作用的是期望效用最大化原则。

从博弈论的角度讲,尽管行动主体选择拿走两个盒子是理性的、占优的,并且为行动主体在该选择情景中拿走两个盒子提供了有理由的论证;但是,这里并没有显现出超级生物的预测能力,它会退化为一个简单选择问题。

我们先把预测能力放在一边,再从超级生物的角度分析一下超级生物是如何行为的。对于超级生物而言,如果行动主体选择只拿走B盒,根据纽科姆难题的选择规则,他应当在B盒中放钱;如果行动主体选择拿走两个盒子,那么他不在B盒中放钱。即超级生物的策略选择是不确定的。如果他考虑到行动主体的策略选择的唯一性,那么该博弈的均衡会在右下角处实现,即行动主体选择拿走两个盒子,而超级生物选择不在B盒中放钱。

这样,无论是否考虑到超级生物的策略选择,行动主体策略选择都是拿走两个盒子,这一点与传统的分析结果是一致的。但关于超级生物博弈选择的分析,会使得行动主体的收益有较差的结果。我想,从博弈论的角度看,这或许倒是行动主体选择的困境或难题,它最终涉及行为合理与否的问题。

但是,从博弈论角度的这种分析并没有显示出超级生物的预测能力,为尊重纽科姆在设计该难题时的初衷,我们要考虑到超级生物的这种能力。

无论是对于超级生物,还是对于一般人,预测是涉及未来的一个行为,即对未来是否要发生某个事件的一种断定行为。

在严格意义上,预测或者能够预测是决定论者的一个观点。决定论者最早可追溯至斯多亚学派。决定论者一般认为,发生的一切都有其原因,人类社会的历史发展具有某种“规律性”或“普遍模式”,一切尽在既有的或可预测的进程中自然地发生。可以看出,对于未来的可预测性是决定论者所持有的一个基本观点。尽管波普[13][14][15](Karl R.Popper)通过一系列论文批判了决定论者的基本立场,但笔者在一篇未刊的手稿中指出了这种批判的不完全性,波普的研究尚须进行进一步的工作。因此,至于决定论是否有存在的理由,我们还不算完全清楚。

在纽科姆所设计的选择情景中,涉及超级生物的预测能力,而且这一预测能力在该难题中也是一种公共知识,因此,我们不得不在对纽科姆难题的研究中重视这种预测能力。就是说,对于该问题探讨的一个基本出发点是,我们应当持决定论的立场或观点。

表1并没有显示出超级生物的预测能力,我们有必要对之进行重新建构,把这种预测能力在博弈中显现出来,如表2所示:

在表2这一博弈架构下,博弈双方如何作出自己的策略选择呢?对于行动主体而言,如果超级生物预测到他只拿走B盒,超级生物会在B盒中放入1000000美元,这时如果他心存侥幸,试图拿走两个盒子,希望能够得到他所谓的“1001000”美元,这是对超级生物预测能力的一种挑战;既然假定预测能力的存在,那么超级生物也会预测到行动主体拿走两个盒子的侥幸心理,这时他是不会在B盒中放钱的,那么行动主体的占优选择应当是只拿B盒。如果超级生物预测到行动主体会拿走两个盒子,根据表2,他的占优选择是拿走两个盒子。因此,行动主体会有两个策略选择:只拿B盒或拿走两个盒子,这使得他可能无法决断。

然而,对于行动主体而言,左上角和右下角这两处的均衡具有不同的收益意义,即左上角均衡处的收益绝对优于右下角均衡处的收益。这对于一个理性的行动主体而言,尽管该博弈的均衡表面上看来似乎具有一定的不确定性,一个均衡明显地优于另一个均衡,行动主体会无疑地选择那个更优的均衡,即左上角处的均衡,他在纽科姆难题的选择情景中,应当选择拿走B盒,这在潘天群的研究中[16],是“无理由”的理由。

表2所示的纽科姆难题的博弈构造可在左上角处实现均衡,即行动主体会选择只拿走B盒,这体现了选择中的占优原则与最大化原则。

此外,诺齐克通过引入概率等因素对该问题的研究,尽管他也得到仅拿B盒是合理的这一结论,但该结论并不具有严格的必然性。因为他所设定的概率是可以发生变化的。再者超级生物在该难题中放入B盒中钱的数目也是可以变化的,如果这些发生了变化,在诺齐克的理论下,是否还能得到相同的结论,是值得考虑的。

需要进一步说明的是,超级生物的预测行为、放钱与否的行为与行动主体的选择行为是同时发生的,或者我们可以看做同时发生的,不存在超级生物选定行为后行动主体的选择优势问题;而传统的解决方案则肯定或假定了这种优势预设,因为超级生物预测到的行动主体将作出的选择行为是超级生物与行动主体二者的公共知识。而且,尽管有先后顺序、时间间隔问题可能是一方面的影响因素,但是另一方面行动主体所不具有的类似于超级生物的预测力,也决定了超级生物与行动主体二者行为的同时性。但具体预测到行动主体会有什么样的行为,并不是行动主体所能知道的。因此,由于这种同时性,行动主体选择两个盒子以提高收益的侥幸心理,便化作了泡影。

不难看出,出于绝对占优的考虑,在纽科姆难题的选择情景中,行动主体唯一的策略选择应当说是只选择拿走B盒,这才是一种合理行为。纽科姆难题在决定论或者突出预测能力的假定下便不再是一个难题。

值得注意的是,超级生物的预测能力在纽科姆难题中只是一种假定,是超级生物与行动主体间的一个公共知识。由于这种能力的存在,超级生物是能够预测到表1中行动主体的策略行为的,或者通过理性分析也应当得出同样结论。因此,在表1的架构下,超级生物应当在B盒中放钱。这样一来,行动主体看似理性的策略选择,并不会导致最大化的收益,我想这也许是纽科姆难题称为难题的其中一个原因。

此外,我们可能会质疑超级生物的预测能力,既然存在质疑,那么赋予他预测能力任何一种较高的概率也是值得质疑的,因为我们并没有见证过他曾经的预测。潘天群认为,“我们不能知道我们未来的行动会是什么样的”[17]。而俄狄浦斯弑父娶母的传说,则说明了即使我们有意地回避预测到的事情,这些事情最终还是会发生的,它(们)不会因行动主体知道预测结果后有意回避或改变,使相应信息结构发生变化——可能变化的只是无足轻重的部分,而最终的结果不会发生变化。因此,对超级生物预测能力的肯定,是纽科姆难题选择情景中应有之意。

四、结语

人是基于理性而行为的动物,基于理性而发生的行为应当被视为理性行为或合理行为。然而,基于不同的行为准则,同一选择情景可能会产生不同的行为策略,进而会有不同的合理行为。到底哪一种行为是合理的行为或最合理的行为?这颇值得选择理论、博弈论、悖论等领域的专家学者作出研究与澄清。纽科姆难题便是这样一种选择情景。

在纽科姆难题选择情景中,行动主体会面临这样一种困惑:只拿走B盒是合理行为,还是两个盒子都拿走是合理行为呢?根据以前学者们的研究,行动主体的这种困惑在本质上表现为选择中期望效用最大化原则与占优原则之间的冲突。一些人把该难题视为“合理行为”难题或者“合理行为”悖论,另外一些学者则从不同方面寻求对该难题的解决,但是,他们似乎没有从整体上或者完整的意义上考虑超级生物的预测能力,而这一点是超级生物与行动主体的公共知识,在选择中占据着十分重要的地位。

尽管存在着超现实的假定,但超级生物的预测能力还是可以被看做决定论的一个方面。决定论者认为,一切都以一种命定的方式发生,未来是可以预测的,即一切都是已经决定了的。因此,在纽科姆难题中,行动主体所作的策略选择也是可以预测的,或者说是已经决定了的。这样,超级生物的预测能力不因行动主体的侥幸选择而有所影响,而行动主体在超级生物那里也不会有侥幸的,因为这种侥幸也是可以被预测到的。

在决定论的理论体系下,行动主体如果想取得“最大化”的收益,他只能选择拿走B盒,这是一种绝对的占优策略。这符合纽科姆难题设计的初衷,即超级生物具有预测能力是双方的一个公共知识,依据这一重要公共知识进行推导,只能是这个结果。

上述结论的得出是出于决定论的方法路径,尽管这一思想在纽科姆难题中表现为预测能力。然而,我们不得不考虑该难题的现实选择问题,在现实世界中,我们可能也会遇到“纽科姆”式难题的选择情景,它与理想的难题或实验是否是完全相同的,我们不得而知。这时,纽科姆难题的解决就要取决于决定论方法的可靠性,而决定论本身也是学界一直以来争论的焦点。因此,纽科姆难题的彻底消解需要寻求更为完全的方法。

标签:;  ;  

Newcombe难题求解的确定性路径_决定论论文
下载Doc文档

猜你喜欢