一种齐当别思想下的量子决策模型:对囚徒困境中的分离效应的解释论文



一种齐当别思想下的量子决策模型:对囚徒困境中的分离效应的解释*

辛潇洋 李 瑛 毕研玲 晏碧华

(陕西师范大学心理学院暨陕西省行为与认知神经科学重点实验室, 西安 710062)

摘 要 量子决策模型是近10年来提出的一种新型决策模型, 用以解释那些违背经典决策模型的现象。虽然当前的量子决策模型能够解释囚徒困境中的分离效应, 但其中却存在一些困难, 即会产生反常的概率关系以及无法精确拟合分离效应量较大的实验结果。本研究在分析当前量子决策模型困难的基础上, 结合齐当别思想对模型进行改进和优化。结果表明, 研究所构建的量子决策模型克服了当前模型中的困难, 并且能够预测囚徒困境博弈中由他人收益差距改变而引起的分离效应变化趋势。本研究还是一次启发式决策模型与计算式决策模型相结合的探索。

关键词量子; 决策; 齐当别; 分离效应; 囚徒困境

1 引言

早期的决策研究大都遵循个体完全理性的理论假设, 认为人们的决策是追求自我利益的最大化。在这种早期“经典”理论的影响之下, Savage (1954)提出了确定事件(sure-thing principle)原则, 所谓确定事件原则是指如果决策者知道事件E会发生, 他会采取行动A; 如果决策者知道事件E不会发生, 他仍会采取行动A; 以此观之, 决策者在不知道事件E是否会发生的情况下, 也会采取行动A。然而, 大量研究表明, 决策者并非总是遵循这一原则, 即当决策者不知道事件E是否会发生的情况下, 他会拒绝行动A, 这一现象被称为分离效应(Tversky & Shafir, 1992; 汪祚军, 李纾, 2008)。

一系列的研究已经证实, 在一次性二人囚徒困境博弈中, 决策者的行为往往也会违背确定事件原则, 出现分离效应(Busemeyer, Matthew, & Wang, 2006; Croson, 1999; Li & Taplin, 2002; Tversky & Shafir, 1992)。在这一博弈中, 只有合作和背叛两种策略可供博弈双方选择。无论对方选择合作还是背叛, 当自己选择背叛时, 收益是最大的(标准囚徒困境博弈中的收益矩阵如表1所示, 其中πc>πd>πa>πb) (Denolf, Martínez, Josephy, & Duran, 2017; Smith, 1982), 因此选择背叛是决策双方的优势策略。根据确定事件原则, 在对方策略不明的情况下, 决策者做出背叛的可能性应该介于两种确定的状态(对方背叛、对方合作)下决策者背叛的可能性之间。但实验结果表明, 此时决策者背叛的可能性小于两种确定状态下决策者背叛的可能性, 即出现了分离效应。例如, 在Shafir和Tversky (1992)的研究中,在两种确定情况下(已知对手背叛/合作), 决策者选择背叛的概率分别为97%和84%, 而在对手决策未知这一情况下, 决策者选择背叛的概率却只有63%。

除了教学,王润华教授也热心地向新马及港台的学术界推广和介绍比较文学的理论和方法。仅从1976年7月到1977年9月,他连续在《蕉风》月刊上发表了《比较文学的定义与功能》《比较文学研究的一些基本概念》《比较文学的概念、历史、研究方法及内容》等9篇译介比较文学学科理论的文章,引起了新马及港台学术界的广泛关注。

表1 标准囚徒困境博弈中收益矩阵

近10年来, 一些学者基于量子理论研究思想与方法探索出了量子决策模型, 为解释诸如分离效应这样违背传统决策理论的现象提供了新思路。量子决策模型能够给出独立于模型的参数和实证数据的预测, 且针对不同研究问题所构建模型的表述形式也不尽相同(Blutner, Pothos, & Bruza, 2013; Bruza, Wang, & Busemeyer, 2015; Busemeyer & Wang, 2015; Busemeyer, Wang, Khrennikov, & Basieva, 2014; 辛潇洋, 徐晨虹, 陈宏玉, 李瑛, 2018)。其中, 针对囚徒困境中出现的分离效应, Pothos和Busemeyer借鉴认知失调理论构建了可以解释囚徒困境中分离效应的四维动态量子决策模型(Pothos & Busemeyer, 2009; Busemeyer & Bruza, 2012)。但是, 当前量子决策模型在解释囚徒困境时, 仍存在一些困难之处。接下来, 本文将首先指出并分析这些困难, 并在此基础上, 提出解决这些困难的方法。

2 当前量子决策模型的困难

由Jerome R. Busemeyer教授等人提出的, 用以解释囚徒困境博弈中的分离效应的四维量子决策模型是一种较为成熟的动态量子决策模型, 这种模型及其变式可用来解释两阶段赌博任务中的分离效应以及分类−决策中的干涉效应等违背传统决策模型的现象(Busemeyer, Wang, & Lambert-Mogiliansky, 2009; Pothos & Busemeyer, 2009; Busemeyer & Bruza, 2012; Busemeyer, Wang, & Pothos, 2015; Wang & Busemeyer, 2016)。然而, 这种模型在对囚徒困境中分离效应进行分析解释的过程中, 存在着一些困难, 接下来, 本文将指出这些困难, 并分析产生这些困难的原因。

2.1 四维标准量子决策模型

研究者首先试图通过一种四维标准量子决策模型来解释囚徒困境博弈中的分离效应。在这一模型中, 首先需要定义研究问题的空间, 这一空间是对决策者所有可能出现的信念行为状态的界定, 在囚徒困境博弈中, 问题空间包含四种决策者可能报告的基态(basis state), 分别为width=92.2,height=15.05width=29,height=15。其中, BiAj表示决策者认为对方会采取i行动的信念状态(Belief state), 但其自身决定采取j行动的行为状态(Action state) (width=49.95,height=15, D表示背叛, C表示合作)。问题空间中共有四个“维度”, 所以这种模型称为“四维”模型, 且四个维度是互斥的, 代表了决策者所有可能出现的确定的信念与行为, 从数学上来说, 这个问题空间称为希尔伯特空间, 而这四个“维度”对应于这一空间的四个基矢(苏汝铿, 2002)。据此, 决策者的信念行为状态可由一个4×1列向量表示:

width=48.75,height=60.75(1)

这样的状态在量子力学中称为叠加态, 在进行观测(或者从心理学的角度, 在要求被试报告决策结果)时, width=56,height=18模的平方width=27,height=19即表示决策者从叠加态转变为基态width=24.95,height=17的概率, 且width=57,height=27width=6.95,height=11, 以满足状态的归一性。设定在未知对手策略的情况下, 决策者初始信念行为状态为:

width=60.75,height=60.75(2)

根据上文所述, 这一状态中, 在要求被试报告决策结果时, 从这一量子叠加态转变为任意一种基态的概率是相等的, 都为(1/2)2= 0.25。当已知对方策略为背叛时, 决策者便不可能报告width=29.25,height=15width=29.25,height=15, 此时width=65.25,height=15, 可令其转变为其他两种基态的可能性相同, 那么, 决策者在此时的初始状态可表示为width=116.25,height=17.25, 此时决策者报告width=30,height=15width=29.25,height=15的概率均为width=65.25,height=17.25。同理, 当决策者已知对手选择合作时, 其初始信念与行为状态可表示为width=116.95,height=17.25

Shafir, E., & Tversky, A. (1992). Thinking through uncertainty: Nonconsequential reasoning and choice. Cognitive Psychology, 24(4), 449−474.

根据量子决策模型, 决策者的信念行为状态会依据收益矩阵动态地从初始状态width=23.25,height=15转变为最终状态width=21,height=15, 而这种动态过程, 可以用薛定谔方程width=84,height=15的解width=78.7,height=17.25描述[1]。矩阵width=54.75,height=17.25为酉矩阵(Unitary Matrix), 其中第i行第j列元素的模的平方width=36.75,height=18.75表示在时间t内从状态j转变为状态i的概率。该矩阵满足width=31,height=15width=38.15,height=15, 以保证状态y 的内积不变, 从而确保决策者在决策时转变为所有可能基态概率之和保持为1。在薛定谔方程中, 哈密顿矩阵(Hamiltonian Matrix) HA起着至关重要的作用, 在这一模型中, 哈密顿矩阵仅根据决策者自身的收益矩阵建立, 故而称之为“标准”模型, 其哈密顿矩阵如式(3)所示:

width=79.45,height=30.85其中width=99,height=35.2(3)

其中的参数width=12.75,height=15width=12,height=15是与不同决策条件下决策者收益之差有关的效用函数, 其取值范围在−1到1之间。width=167.15,height=17.25表示当对手的行动为i, 决策者的行动为j时决策者的收益。例如width=18.75,height=15表示当对手选择背叛(D), 决策者也选择背叛时(D), 决策者的收益为width=14.25,height=15, 所以width=39.75,height=15, 同理可知width=120.75,height=15, 据此width=22,height=15width=111.8,height=15, 而根据Shafir和Tversky (1992)研究中的收益矩阵, 此时width=85,height=15width=46.85,height=15, 因此有width=74,height=15.35。依此将width=31,height=15width=13.85,height=15代入薛定谔方程, 便可得到不同条件下决策者经过时间t后形成的最终信念与行为状态width=28,height=15width=49.2,height=15, 通过计算最终状态中背叛行为概率之和, 即式(1)第一行元素模的平方与第三行元素模平方之和width=81.05,height=17.25, 便可以得出不同条件下决策者决策时从最终信念行为状态转变为width=30,height=15width=29.25,height=15的概率之和, 即决策者选择背叛的概率。但是, 计算得出决策者在三种条件下做出背叛行为的概率相同, 说明四维标准量子模型无法解释一次性两人囚徒困境博弈中的分离效应(Pothos & Busemeyer, 2009; Busemeyer & Bruza, 2012), 这便是四维标准量子模型的困难。

2.2 Pothos和Busemeyer (2009)对四维标准量子决策模型的改进

Pothos和Busemeyer (2009)认为, 决策者在决策过程中会产生认知失调, Wang和Busemeyer (2016)后来将其称为信念与行为的纠缠(belief-action entanglement), Shafir和Tversky (1992)则把这种个人的偏见表述为“一厢情愿”(wishful thinking), 即当决策者认为对手的策略为合作/背叛时, 他倾向于采取同样的行动(Festinger, 1957), 这种信念与行动间的关系可由式(4)所示的矩阵表示:

width=110.3,height=60.75(4)

Pothos和Busemeyer将认知失调矩阵加入薛定谔方程中, 构建出新的哈密顿矩阵width=65.25,height=15 代入薛定谔方程, 并据此计算出决策者在不同条件下背叛的概率, 进而对囚徒困境中的分离效应进行解释。为了更直观地展示, 本文使用Matlab的3D绘图技术绘制出分离效应量[2]以及p(背叛│对手合作) – p(背叛│对手背叛)与模型参数u(效用函数, 其值越大, 表示决策者的收益之差越大)和g (信念与行为的纠缠的参数, 其值越大, 表示在相同时间内, 这种纠缠的程度越大)之间的关系, 如图1所示。从图1(a)中可以看出, 当ug 在一定的范围内取值时, 模型便会产生明显的分离效应量(即图中冷色部分), 这样囚徒困境中的分离效应便得以解释。

width=197.5,height=397.8

图1 Pothos和Busemeyer (2009)量子决策模型中分离效应量以及p(背叛│对手合作) − p(背叛│对手背叛)与ug 之间关系的3D着色表面图(a-b)与有效区域的着色等高线图(c) (其中t =width=19,height=11)

虽然图1(a)表明, 在量子决策模型框架下, 分离效应是能够存在的, 即存在p(背叛)小于p(背叛│对手合作)和p(背叛│对手背叛)的平均值这一关系, 然而, 这一模型并不能很好地解释研究中两种确定情况下决策者背叛概率(p(背叛│对手合作)和p(背叛│对手背叛))之间的关系:图1(b)表示参数uwidth=9,height=12p(背叛│对手合作) − p(背叛│对手背叛)之间的关系, 可以看出在右侧区域中(g < 1), 存在p(背叛│对手合作) > p(背叛│对手背叛), 这不仅与研究结果不符, 也不符合常理(决策者在得知对手选择背叛时会更倾向于选择背叛), 这便是这一模型的第一个困难。

课堂是教学的主阵地,学生获取知识的主渠道。高效课堂是每位教师孜孜追求的目标,高效课堂是追求高效益、低成本的课堂。然而在现实课堂中追求面上的温度、形上的复杂度蔚蓝成风,看似很“枝繁叶茂”,其实“空洞无物”,预设多、生成少,课堂杂乱、冗繁、肤浅。美国心理学家布鲁纳说过:“任何学科的内容都可以用更为经济、富有活力的简约方式表达出来,从而使学习者易于掌握。”可见,高效课堂应从简约开始。

本研究所提出的量子决策模型, 立足于四维量子决策模型, 借鉴了齐当别思想对模型进行了重构。可以称之为一种计算式与启发式相融合的决策模型。而这种齐当别思想下的量子决策模型, 解决了先前量子决策模型中所存在的困难, 同时也为今后决策模型的构建添加了新的可能性。

Li, S., Taplin, J. E., & Zhang, Y. C. (2007). The equate-to- differentiate’s way of seeing the prisoner’s dilemma. Information Sciences, 177(6), 1395−1412.

Pothos和Busemeyer (2009)提出的改进模型在解释囚徒困境中的分离效应时仍存在困难, 究其原因, 主要有两点:一是决策者在不同决策条件下所参考的收益维度是不同的——决策者不仅考虑自己维度上的收益, 也可能在一定情况下考虑对方维度上的收益情况(Li & Taplin, 2002; 李纾, 2016), 而在四维标准量子模型中, 不同条件下薛定谔方程中哈密顿矩阵中所使用的效用函数都是基于决策者自身的收益维度的, 说明该模型并没有反映出决策者在不同决策条件下的差别; 二是效用函数width=12.75,height=15width=12,height=15的计算过度简化, 实际上两者并不一定相等(Kahneman & Tversky, 2013; Blanco, Engelmann, Koch, & Normann, 2014)。若从预期理论(prospect theory)的角度来看, width=142.9,height=14.95, 而width=59,height=15width=95,height=15, 由于效用函数一般是非线性的(Pleskac, Diederich, & Wallsten, 2015; Tversky & Kahneman, 1981), 此时width=12.75,height=15是不等于width=12,height=15的, 因此原先模型中关于效用函数的设定是不严谨的。本文的目标便是基于上述分析, 对四维量子决策模型进行改进。改进的重点与难点在于, 如何确定不同决策条件下决策者所参考的收益, 进而确定不同条件下表征收益的哈密顿矩阵HA, 而齐当别思想恰好提供了解决这一问题的思路。

3 一种齐当别思想下的量子决策模型

3.1 齐当别模型对囚徒困境中分离效应的解释

齐当别模型认为, 左右人类风险决策行为的机制不是最大限度地追求某种形式的期望值, 而是某种形式上辨察选择对象之间是否存在“优势性”关系, 并借助最好可能结果和最坏可能结果对问题进行表征。人们必须在一个或几个维度上将差别较小的可能结果人为地“齐同”掉, 而在差别较大的维度上选择出具有优势的选项(Li & Taplin, 2002; 毕研玲, 李纾, 2007; 李纾, 2005; 李纾等, 2009)。因此, 该模型认为, 在一次性标准囚徒困境实验中, 决策者在不同条件下决策所基于的“维度”是不同的。在两种确定条件下, 由于在“自己收益维度”上, 背叛明显优于合作, 因此决策者倾向于将“他人收益维度”上的差异“齐同”掉, 从而在“自己收益维度”上做决策, 选择对自己有利的行为(背叛); 而在不确定条件下, 由于在“自己收益维度”上, 背叛策略不再明显地优于合作策略, 而在“他人收益维度”上, 合作策略明显优于背叛策略, 这样, 决策者抑或倾向于将“自己收益维度”上的差异“齐同”掉, 而在“他人收益维度”上做决策, 选择对他人有利的行为(合作) (Li & Taplin, 2002; 李纾, 2016; 汪祚军, 李纾, 2008)。

表2 不同研究中决策者选择背叛的概率以及不同量子决策模型的拟合结果

注:括号内为先前的量子模型拟合结果/本研究提出的量子模型的拟合结果

据此可知, 当决策者处于两种对手策略确定的情况时, 他是基于自己的收益做决策的, 此时量子决策模型中的哈密顿矩阵可根据决策者自身维度上的效用函数进行定义。当决策者处于不确定的决策条件时(对手策略未知), 若决策者只处于“他人收益维度”上, 那么选择合作便是这一维度上的占优选项, 此时决策者选择合作的概率应大于选择背叛的概率, 而这与实际研究结果却不相符。以此观之, 此时决策者应该既考虑自己的收益, 又兼顾他人的收益, 因此, 在对手策略未知的情况下, 哈密顿矩阵需要根据决策者以及他人的效用函数进行定义。接下来, 本文将基于以上分析对量子决策模型进行修正与重构。

3.2 齐当别思想下量子决策模型的重构

3.2.1 确定条件下哈密顿矩阵的修正

首先, 在已知对手策略为背叛时, 决策者是基于“自己收益维度”做出决策的, 即在这种情况下决策者是以自己收益的效用函数为基准的。因此, 此时哈密顿矩阵可用width=13,height=15表示决策者在知道对手背叛的条件下, 做出背叛行为和做出合作行为自身所获收益效用之差。但是, 由于此时决策者已经认为对手采取背叛策略, 所以不会考虑对手选择合作的条件下自己不同行动收益的效用之差, 所以此时width=28,height=15, 那么在这种情况下, 表征决策者收益的哈密顿矩阵便修正为:

width=171.85,height=35.25(5)

接下来, 我们便需要解决2.1中效用函数过度简化的问题, 即如何定义一个能够有效反映决策者收益之差的效用函数。我们选择使用预期理论中的价值函数, 并对其做适当的归一处理, 使其取值在−1与1之间, 以满足量子决策模型对于效用函数取值范围的要求:

width=171.85,height=30(6)

对不同覆网遮荫培育1 a后的苗木随机不重复抽取50个样本,测量其新梢高和地径,进行对比分析[5],其检测平均值见表5。

其次, 当已知对手策略为合作时, 决策者也是基于“自己收益维度”做出决策的。此时哈密顿矩阵中width=12,height=15表示决策者在知道对手背叛的条件下, 做出不同行动(背叛或合作)所获自身收益的效用之差。与上一种情况类似, 这种情况下决策者不会考虑对手选择背叛条件下自己不同行动收益的效用之差, 故而width=29.25,height=15。此时, 哈密顿矩阵修正为:

width=169.85,height=35.25(7)

width=170.85,height=30(8)

其中,width=15.75,height=15表示当决策者已知对手合作时, 选择背叛行动所获收益width=18.75,height=15与选择合作所获收益width=18,height=15的价值之差。

3.2.2 不确定条件下哈密顿矩阵的修正

当对手策略未知时, 决策者会将“他人收益维度”列入自己的决策标准之内。此时, 决策者决策时除了会参考自己的收益维度, 也会考虑他人的收益维度。此时的哈密顿矩阵便可以通过两个分别代表自身收益和他人收益的哈密顿矩阵叠加而成。

其中, 代表决策者自身收益的哈密顿矩阵可表示为:

width=74.95,height=31(9)

Busemeyer, J. R., Wang, Z., & Townsend, J. T. (2006). Quantumdynamics of human decision-making. Journal of Mathematical Psychology, 50(3), 220−241.

width=188.2,height=71.5(10)

其中width=12.75,height=15width=12,height=15是他人维度上的效用函数, 分别表示当他人选择背叛/合作时, 决策者选择背叛时他人所获收益价值与决策者选择合作时他人所获收益价值之差的效用函数:

width=171.85,height=30(11)

width=170.15,height=30(12)

其中width=17.25,height=15表示当对手背叛时, 决策者选择背叛行动他人所获收益width=14.25,height=15与决策者选择合作时他人所获收益width=12.75,height=15的预期价值之差;width=15.75,height=15表示当对手合作时, 决策者选择背叛行动他人所获收益width=12.75,height=15与决策者选择合作时他人所获收益width=14.25,height=15的预期价值之差, 此时b为决策者在他人收益维度上的风险规避指数(risk- aversion parameter), 而相比于他人的收益, 决策者更加重视自身的收益, 即决策者在自身收益维度上效用函数的曲率(utility curvature)应小于在他人维度上的效用函数的曲率(Li & Taplin, 2002; Li, Taplin, & Zhang, 2007; 李纾, 2016), 由效用函数的曲率差异可知0 < b<a <1。那么, 在不确定条件下, 表征收益的哈密顿矩阵便更改为width=62.25,height=17.25

奶牛春秋两季配种受胎率最高,而夏季最低,这是由于热应激影响精子的成熟和精液成分,造成公牛性欲低下。另外,影响母牛卵细胞的分化、发育、着床,发情频率明显下降。

3.3 齐当别思想下的量子决策模型对囚徒困境中分离效应的解释

分别将修正后的哈密顿矩阵width=30.75,height=15width=15.75,height=15以及表征认知失调的哈密顿矩阵HB代入薛定谔方程, 可分别得出决策者在已知对手策略为背叛、已知对手策略为合作以及未知对手策略这三种条件下选择背叛的概率, 分别如下所示:

width=210.4,height=20.55(13)

width=212.55,height=20.55(14)

width=170.15,height=17.25(15)

width=69.75,height=30.75, 其中width=80.25,height=30.75,M的作用是将width=21,height=15中的第一第三元素width=21,height=15width=20.25,height=15选取出来。将Shafir和Tversky (1992)研究中的收益矩阵代入, 模型便构建完毕。接下来, 我们需要验证这种齐当别思想下的量子决策模型是否克服了之前量子决策模型中存在的困难。首先, 做出p(背叛│对手合作) − p(背叛│对手背叛)与参数ag 之间关系的3D着色表面图(图2(a)), 可以看出, 此时p(背叛│对手合作)总是小于p(背叛│对手背叛), 这样便解决了原量子决策模型中的第一个困难。接下来, 做出分离效应量与参数ag 之间的3D着色表面图(图2(b)), 从中可以看出, 当b=a/4时, 虽然模型可解释的最大分离效应量也为0.25, 但是其分布较为连续, 从而提升了模型对大分离效应量实验结果的拟合精度。特别地, 固定b=a/4, 使用最小绝对误差法进行拟合, 当ag 分别取值为0.73与0.13时, 便可得出与Shafir和Tversky (1992)研究结果基本相同的拟合数值(如表2所示)。使用同样的拟合方法, 本文进一步对比分析了本研究所提出的量子决策模型和Pothos和Busemeyer (2009)提出的量子决策模型对于一些分离效应研究结果的拟合性能。如表2所示, 可以看出, 当模型的自由参数的数量相同时, 先前的量子决策模型对于分离效应量较大的研究结果(Shafir & Tversky, 1992; Busemeyer et al., 2006)的拟合效果较差, 而本研究所提出的量子决策模型则展现了优异的拟合效果。

接下来, 便是验证这一模型能否解决原模型的第三个困难, 即能否正确地表示收益之差的效用与分离效应量之间的关系。按照相关研究的结论, 自己收益差距的增大, 会阻碍分离效应的发生, 即增大分离效应量的数值; 而他人收益差距的增大, 则会促进分离效应的发生, 即降低分离效应量的数值(Li & Taplin, 2002; Li, Taplin, & Zhang, 2007; 李纾, 2016)。因此, 根据定义, 增大自己的收益差距可看作增大式(6)中的width=13.95,height=15与式(8)中的width=13,height=15值; 而增大他人的收益差距可看作增大式(11)中的width=13,height=15与式(12)中的width=13.95,height=15值, 那么, 做出自己与他人收益增大量[3]width=13.95,height=11与分离效应量之间的关系, 如图3所示。从中可以看出, 当自己收益差距增大时, 分离效应量的数值变大, 分离效应减小; 而当他人的收益差距增大时, 分离效应量的数值变小, 分离效应增大, 这便说明本研究所提出的量子决策模型能够有效反映收益差距与分离效应之间的关系, 从而解决了原模型中的第三个困难。

width=227.75,height=327

图2 本研究所提出的量子决策模型中p(背叛│对手合作)−p(背叛│对手背叛)以及分离效应量与ag 之间关系的3D着色表面图(其中模型参数b=a/4,t=3π/8)

width=192.25,height=153.35

图3 本研究所提出的量子决策模型中收益增加量D p 与分离效应量之间的关系(模型其余参数为拟合Shafir和Tversky (1992)研究所得参数)

4 讨论

4.1 启发式与计算式的融合

自从Herbert Simon提出“有限理性”的概念以来, 在此基础上形成的启发式(Heuristic)决策模型已经在决策领域取得了许多重要的成就(Baron, 2007; Gigerenzer & Todd, 1999; Tversky & Kahneman, 1974)。大多数启发式决策模型, 例如齐当别模型, 以决策模型的三因素分类体系来看, 属于非补偿性和确定性的决策模型(Stevenson, Busemeyer, & Naylor, 1990)。由于存在非补偿性, 这类模型会对一些信息进行简化或剔除, 进而简化分析过程; 但由于该模型的确定性(Kubovy, Rapoport, & Tversky, 1971; 李纾, 2016), 使其无法精确描述决策者在不同条件下做出决定的概率。

量子决策模型, 属于计算式(Computational)或数学(Mathematical)决策模型, 从决策模型的分类体系标准来看, 属于具有随机性的决策模型。因为其具有随机性, 可以通过概率函数的形式表征决策结果, 所以这类模型可以定量描述分离效应(Busemeyer & Townsend, 1993; Payne & Bettman, 2004)。但是, 先前的量子决策模型, 过度简化了模型的构建过程, 并缺乏对实际决策过程中决策者策略的深入思考。因此, 在解释分离效应时存在困难。

进一步的分析可以发现, 这一区域正对应于图1(a)中存在明显分离效应的区域(冷色区域), 也就是说, 图1(a)中存在分离效应的冷色区域大部分是存在着p(背叛│对手合作) > p(背叛│对手背叛)这一奇怪关系的“无效”区域。将图1(a)中这些“无效”区域剔除后的有效区域如图1(c)所示(彩色部分为有效区域), 此时, 便出现了第二个困难——虽然这一部分能够解释的最大分离效应量的绝对值为0.25左右, 但这些极大值区域较少, 对于分离效应量较大的研究结果(如Shafir和Tversky (1992)的研究)依旧难以精确拟合(拟合结果见表2)。

4.2 囚徒困境中决策者信念与行为的纠缠

本研究所提出的量子决策模型中, 依旧保留了原量子模型中表示信念与行动纠缠的哈密顿矩阵HB。那么, 是否可以忽略这一纠缠效应, 进而完全按照齐当别思想来构建量子决策模型呢?本研究的结果表明, 当分离效应量较小时(如Li & Taplan (2002)的研究结果), 模型的最佳拟合参数中g =0, 说明此时HB是可以去除的; 但当分离效应量较大时, 若去除HB, 则会使拟合误差大幅提升, 如对Shafir和Tversky (1992)的实验结果进行拟合时, 绝对误差便会从原先的0.04上升至0.09, 增大了两倍, 可见此时去除HB是不合适的。综上所述, 信念与行为的纠缠对于解释分离效应量较大的研究是不可或缺的。

5 结论与展望

本文提出了一种结合齐当别思想的量子决策模型, 研究表明这一模型解决了先前量子决策模型中存在的困难。当然, 正如量子决策模型的奠基者Jerome R. Busemeyer教授所指出的, 类似量子决策模型这样的数学决策模型, 就像刚刚进入决策之城的小孩子一样(Busemeyer & Johnson, 2008), 需要不断地成长才能获得属于自己的一席之地。因此, 作为这些“小孩子”中的一员, 本研究所提出的这种量子决策模型, 也有值得进一步探讨与发展之处, 主要总结为以下几点:

现代城市不仅人口、资产密度加大,而且结构复杂化,防洪的特点一般是防护范围较小,防洪标准高,与航运、城建及其他经济部门关系密切,防洪安全保障需求多样化。因此城市防洪需要利用城市河道综合治理技术,城市雨洪蓄滞、渗透等工程处理技术,城市堤防的建造技术,城市建筑耐水化的处理技术,城市各类生命线系统的防洪应急保护技术,城市发展与防洪减灾相结合的综合规划技术,城市防洪工程的除险加固技术,城市防洪工程体系的优化调度技术以及一些行政管理手段,尽可能消除或减少洪水造成的人员伤亡和财产损失,保障城市的安全。

(1) 模型的扩展应用。本文提出的这种量子模型, 未来可以尝试解释诸如两阶段赌博任务中的分离效应, 以及分类−决策(Categorization-decision)实验中的干涉效应(Busemeyer et al., 2009; Townsend, Silva, Spencer-Smith, & Wenger, 2000; Wang & Busemeyer, 2016)等违背经典决策模型的问题。

系统通过激光二维扫描仪扫描塞规进而获取塞规相应截面轮廓处各个点的坐标,本文采用最小二乘法拟合塞规的轮廓曲线,从而获取塞规的轮廓最高点。最小二乘法理论较为简单,计算也比较简单,但必须选取适当的匹配函数模式,否则拟合的效果将会变差。本系统需要拟合的曲线为塞规圆截面上的一段圆弧,较易处理,因此使用最小二乘法。最小二乘法的基本原理为假设需要拟合的多项式方程为:

(2) 模型的动态化探究。在量子决策模型中, 由于薛定谔方程以及其解中存在时间参数t, 因此量子模型又是一种动态的(Dynamical)模型(Busemeyer, Wang, & Townsend, 2006)。但是, 目前大多数相关研究中, 为了简化问题探讨, 往往将时间t设为固定值, 而在实际问题中, 决策时间的不同会对决策者的最终决策产生影响, 而对于量子决策模型来说也是如此, 因此, 探究一种具有“动态化”的量子决策模型也具有重要的理论和现实意义。

(3) 更加“真实”的量子决策模型。包括本研究在内的大多数动态量子决策模型, 都是“理想的”模型。例如, 模型中决策者的信念行为状态(包括基态以及叠加态), 是一种“纯净的”、“理想的”量子态(纯态), 这就意味着决策者(被试)间的差异可以忽略, 模型可以通过平均行为倾向来描述被试群体行为特点; 模型中的测量是“完美的”, 即在测量时(或要求被试报告结果时)所测得的结果能够完全表示决策者所处的信念行为状态(Yearsley, 2017)。但是在现实中, 由于受到各种条件的影响(噪音), 决策过程往往不会如此理想化。在未来的研究中, 通过在模型中构建适当的噪音, 不仅可增强模型的真实性, 而且可以据此来判别在一定的情况下是否真的存在分离效应抑或仅仅是实验中存在的“噪音”。

其中width=17.25,height=15表示当决策者已知对手背叛时, 选择背叛行动所获收益width=14.25,height=15与选择合作所获收益width=12.75,height=15的价值之差, 采用一种类似于逻辑回归的双曲正切函数对width=17.25,height=15进行归一化处理。a为决策者在自身收益维度上的风险规避指数(risk-aversion parameter), 其值介于0到1之间。

(4) 启发式决策模型与计算式决策模型的融合。长期以来, 计算式的决策模型(如决策场模型与马尔科夫决策模型)由于其较为复杂的数学结构, 往往不能为大多数研究者所理解; 而计算式决策模型的研究者, 在其构建模型的过程中, 往往将重心放在数学结构上, 从而忽视了与其相关的启发式决策模型。通过本研究的结果, 可以看出, 启发式决策模型与计算式决策模型能够很好地融合, 通过启发式的思想对计算式的模型进行改进, 不仅能够解决计算式模型中存在的一些困难, 而且能使启发式的思想以较为客观的数学形式展现出来, 让其具有量化解释问题的能力。因此, 启发式决策模型与计算式决策模型的融合, 具有重要的理论意义与广阔的发展前景。

第一,企业集团的组建要科学,要充分把内部资本市场的优势发挥出来。随着我国改革开放的深入推进以及国企改革进程的进一步深化进程,目前我国政府对国有企业的干预仍然存在,政府需要进一步简政放权。另外,由于企业集团内部形成的小型资本市场对于我国外部资本市场的不足之处在某些方面可以进行一定弥补,达到对资源配置进行优化的作用。对企业集团进行科学组建,统一管理整合在一起的中小企业,不仅能够存在规模优势达到规模效益,还能对企业集团的整体效率有提高的作用。但是切记企业集团的组建一定要适度,在注重量的同时更要注重质的发展。

致谢:作者感谢两位匿名审稿专家对本文提出的严谨而富有建设性的意见。

参 考 文 献

Baron, J. (2007). Thinking and deciding. Cambridge University Press.

Bi, Y. L., Li, S. (2007). A comparison between two models of bounded rationality: Equate-to-differentiate and priority heuristic approaches. Advances in Psychological Science, 15(4), 682−688.

[毕研玲, 李纾. (2007). 有限理性的"占优启发式"和"齐当别"决策模型的作为——当Allais悖论杠杆撬动了期望效用理论. 心理科学进展, 15(4), 682−688.]

Blanco, M., Engelmann, D., Koch, A. K., & Normann, H. T. (2014). Preferences and beliefs in a sequential social dilemma: A within-subjects analysis. Games and Economic Behavior, 87, 122−135.

Blutner, R., Pothos, E. M., & Bruza, P. (2013). A quantum probability perspective on borderline vagueness. Topics in Cognitive Science, 5(4), 711−736.

在借鉴国内外流域管理联席会议制度成功经验的基础上,提出了汉江流域水资源管理与保护联席会议制度方案,包括联席会议的成员单位、主要任务、运行机制等内容。初步考虑,联席会议召集单位为长江水利委员会,成员单位包括流域内各省级行政区政府及相关部门、重要水利水电工程管理部门以及电网调度运行管理部门。

Bruza, P. D., Wang, Z., & Busemeyer, J. R. (2015). Quantum cognition: A new theoretical approach to psychology. Trends in Cognitive Sciences, 19(7), 383−393.

Busemeyer, J. R., & Bruza, P. D. (2012). Quantum models of cognition and decision. Cambridge University Press.

Busemeyer, J. R., & Johnson, J. G. (2008). Micro-process models of decision making. Cambridge Handbook of Computational Psychology. Cambridge University Press,(pp.302−321).

Busemeyer, J. R., Matthew, M. R., & Wang, Z. (2006). A quantum information processing explanation of disjunction effects. Paper presented at the Proceedings of the Annual Meeting of the Cognitive Science Society.

采用SPSS 22.0软件对实验所得数据进行统计处理,所有数据用表示,两两组间比较采用LSD检验,多组间比较采用单因素方差分析法。

Busemeyer, J. R., & Townsend, J. T. (1993). Decision field theory: A dynamic-cognitive approach to decision making in an uncertain environment. Psychological Review, 100(3), 432−459.

Busemeyer, J. R., & Wang, Z. (2015). What is quantum cognition, and how is it applied to psychology? Current Directions in Psychological Science, 24(3), 163−169.

Busemeyer, J. R., Wang, Z., Khrennikov, A., & Basieva, I. (2014). Applying quantum principles to psychology. Physica Scripta, 2014(T163), 014007.

Busemeyer, J. R., Wang, Z., & Lambert-Mogiliansky, A. (2009). Empirical comparison of markov and quantum models of decision making. Journal of Mathematical Psychology, 53(5), 423−433.

Busemeyer, J. R., Wang, Z. J., & Pothos, E. (2015). Quantum models of cognition and decision. The Oxford Handbook of Computational and Mathematical Psychology. Oxford University Press, (pp. 369−389).

而代表他人收益的哈密顿矩阵可表示为:

Croson, R. T. A. (1999). The disjunction effect and reason- based choice in games. Organizational Behavior and Human Decision Processes, 80(2), 118−133.

Denolf, J., Martínez-Martínez, I., Josephy, H., & Barque- Duran, A. (2017). A quantum-like model for complementarity of preferences and beliefs in dilemma games. Journal of Mathematical Psychology, 78, 96−106.

Festinger, L. (1957). A theory of cognitive dissonance (Vol. 2). Stanford university press.

Gigerenzer, G., & Todd, P. M. (1999). Simple heuristics that make us smart. Oxford University Press.

Kahneman, D., & Tversky, A. (2013). Prospect theory: An analysis of decision under risk. Handbook of the fundamentals of financial decision making: Part I (pp. 99−127): World Scientific.

为满足2003年后唐山市污染物排放总量控制试点工作,以控制污水排放为主,到2010年前后污水排放总量有明显减少,但至2017年污水排放总量基本恢复原有水平,近15年来全市污水排放总量没有明显增加或减少趋势。根据国家环境保护总局2003年11月7日下发的586号《关于确定杭州市、唐山市为污染物排放总量控制试点城市的通知》文件,要求唐山市开展污染物排放总量控制试点工作。工作开始后,由于污染物治理工作需要污水处理配套工程建设、资金和技术支撑,短期不可能完成,因此以控制污水排放量为主。到2010年前后,唐山市污水排放总量与2003年相比减少42.6%,有效减轻了水功能区污染负荷。

Kubovy, M., Rapoport, A., & Tversky, A. (1971). Deterministic vs probabilistic strategies in detection. Perception & Psychophysics, 9(5), 427−429.

Li, S. (2005). Choice reversals across certainty, uncertainty and risk: The equate-to-differentiate interpretation. Acta Psychologica Sinica, 37(4),427–433.

糖尿病在老年人群体中的患病率水平较高,当此类患者接受手术时,由于生理机能和抵抗力的下降,加之糖尿病合并症较多病情较重,麻醉管理较非糖尿病患者难度大,显著提高了围术期病死率水平。为了降低老年糖尿病手术患者的病死率水平,提高生活质量,必须重视围术期麻醉管理。为此,该研究选择该院2017年1月—2018年8月期间手术治疗的88例老年糖尿病患者为研究对象,按照随机数字表法将患者分为两组,对照组给予常规手术管理,研究组同时给予有效麻醉管理,观察比较两组患者围术期血糖检测值、血酮体阳性率和麻醉副反应发生率之间是否具有统计学意义,以保证麻醉效果和手术安全性。现将结果报道如下。

[李纾. (2005). 确定、不确定及风险状态下选择反转:“齐当别”选择方式的解释. 心理学报, 37(4), 427−433.]

Li, S. (2016). An equate-to-difference way of decision-making. Shanghai: East China Normal University Press.

[李纾. (2016). 决策心理:齐当别之道. 上海: 华东师范大学出版社.]

Li, S., Bi, Y. L., Liang Z. Y., Sun, Y., Wang, Z. J., & Zheng, R. (2009). Bounded or unbounded rationality? The implication of equate-to-differentiate theory in economic behavior. Management Review, 121(5), 143–154.

[李纾, 毕研玲, 梁竹苑, 孙彦, 汪祚军, 郑蕊. (2009). 无限理性还是有限理性?——齐当别抉择模型在经济行为中的应用. 管理评论, 121(5), 143−154.]

两下总算是谈妥了,冯一余每天出20块钱,周一到周五,大爷负责帮他占住车位。冯一余怕夜长梦多,提出先付一个月的钱。大爷却不要,说,占一天算一天,而且要先占后付钱。冯一余坚持先付钱后占位,左说右说,大爷才收下了头一次的20块钱,揣到口袋里,走了。

Li, S, & Taplin, J. (2002). Examining whether there is a disjunction effect in prisoner's dilemma games. Chinese Journal of Psychology, 44(1), 25–46.

若我们继续探究的话, 便会发现这一模型的第三个困难, 即无法解释决策者自身收益之差的效用函数u与分离效应量之间的关系。已有的研究已经证实, 当决策者的收益之差增大时, 会导致分离效应的减少(Li & Taplin, 2002; 李纾, 2016)。而从图1(c)中可以看出, 当u增大时, 分离效应量的绝对值反而呈现增加的趋势。

Payne, J. W., & Bettman, J. R. (2004). Walking with the scarecrow: The information-processing approach to decision research. Blackwell Handbook of Judgment and Decision Making, 110−132.

Pleskac, T. J., Diederich, A., & Wallsten, T. S. (2015). Models of decision making under risk and uncertainty. The Oxford handbook of computational and mathematical psychology. Oxford University Press, (pp. 209−231).

Pothos, E. M., & Busemeyer, J. R. (2009). A quantum probability explanation for violations of ‘rational’decision theory. Proceedings of the Royal Society of London B: Biological Sciences,276(1665), 2171−2178

Savage L J. (1954). The Foundations of Statistics. New York: Wiley.

“儿童的智慧在指尖上。”动手操作能让学生在体验的同时获得直接经验,促进思维的发展。数学活动经验,是学生不断经历、体验各种数学活动过程的结晶,只有在不断的“做”和“思考”的过程中才能积累起来。

Smith, J. M. (1982). Evolution and the Theory of Games. Cambridge University Press.

Stevenson, M. K., Busemeyer, J. R., & Naylor, J. C. (1990). Judgment and decision-making theory. Handbook of Industrial & Organizational Psychology. Consulting Psychologist Press.

Su, R. K. (2002) Quantum Mechanics (Second Edition). Higher Education Press

[苏汝铿. (2002). 量子力学-第2. 高等教育出版社.]

Townsend, J. T., Silva, K. M., Spencer-Smith, J., & Wenger, M. J. (2000). Exploring the relations between categorization and decision making with regard to realistic face stimuli. Pragmatics & Cognition, 8(1), 83−105.

Tversky, A., & Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185(4157), 1124−1131.

Tversky, A., & Kahneman, D. (1981). The framing of decisions and the psychology of choice. Science, 211(4481), 453−458.

Tversky, A., & Shafir, E. (1992). The disjunction effect in choice under uncertainty. Psychological Science, 3(5), 305−310.

Wang, Z., & Busemeyer, J. R. (2016). Interference effects of categorization on decision making. Cognition, 150, 133− 149.

Wang, Z. J., Li, S. (2008). The disjunction effect in decision making. Advances in Psychological Science, 16(4), 513– 517.

[汪祚军, 李纾. (2008). 行为决策中出现的分离效应. 心理科学进展, 16(4), 513−517.]

Xin, X. Y., Xu, C. H., Chen, H. Y., Li, Y. (2018). Quantum models for decision making. Advances in Psychological Science,26(8), 1365−1373.

[辛潇洋, 徐晨虹, 陈宏玉, 李瑛. (2018). 一种新决策模型——量子决策模型. 心理科学进展,26(8), 1365−1373.]

Yearsley, J. M. (2017). Advanced tools and concepts for quantum cognition: A tutorial. Journal of Mathematical Psychology,78, 24−39.

[1] 在量子决策模型中, 通常将薛定谔方程中的普朗克常数h设定为1。方程中,i表示虚数单位,e表示自然常数,t表示决策过程所需的时间, 但并非客观的绝对时间。

[2] 仿照Pothos和Busemeyer (2009)中的图1, 将分离效应量定义为决策者在不确定条件下选择背叛的概率减去两种确定情况下选择背叛概率的平均值, 即:width=183,height=23

[3] 即width=47,height=13.95自己收益维度下width=30.3,height=12; 他人收益维度下width=12,height=10width=21,height=12

Quantum decision-making model based on equate-to-differentiate method: Explanation for the disjunction effect in prisoner’s dilemma

XIN Xiaoyang; LI Ying; BI Yanling; YAN Bihua

(School of Psychology, Shaanxi Normal University & Key Laboratory of Behavioral and Cognitive Neuroscience of Shaanxi Province, Xi’an 710062, China)

Abstract

One of the most puzzling findings in decision research field is the disjunction effect. Several studies demonstrate that the disjunction effect exists in a two-person prisoner’s dilemma game. This effect violates the sure-thing principle and cannot be explained by classical decision-making models. During the recent decade, quantum decision making models have been established on the basis of the mathematical structure and methodologies of quantum mechanics. Owing to their special theoretical structures, quantum decision-making models are well suited for explaining the disjunction effect, although these models continue to encounter difficulties.

This study aims to overcome the difficulties in existing quantum decision-making models by developing a modified model. To achieve this goal, the deficiencies of the previous models were analyzed. We concluded three deficiencies: 1) Although previous quantum decision-making models can account for the disjunction effect, they can also obtain findings that defy the experimental results and common sense. 2) They cannot explain the disjunction effect with large values in certain experiments (e.g., the experiment of Shafir & Tversky, 1992). 3) They cannot properly illustrate the relationship between the utility of decision maker’s pay off and the scale of the disjunction effect.

The reasons for these difficulties were investigated. An important reason is that previous quantum decision-making models ignore that the decision maker may consider another’s pay off based on different decision conditions. Another reason is the over-simplicity of the utility function. With the above analyses as basis, we adopted the equate-to-differentiate method to rebuild the quantum decision-making model. In this new model, whether the decision maker considers another’s pay off or not based on a specific decision condition is determined with the equate-to-differentiate method. In addition, the utility function is redefined by value function and hyperbolic tangent transformation.

Results revealed that the new quantum decision-making model overcomes the difficulties in previous quantum decision-making models. The proposed model is an integration of heuristic and computational or mathematical models. This ideal model integration deserves much attention and has good theoretical significance and application prospects.

Key words quantum; decision-making; equate-to-differentiate; disjunction effect; prisoner’s dilemma

收稿日期:2018-05-30

* 陕西省科技统筹创新工程计划项目(2015KTZDSF02-02)以及陕西师范大学教师教育研究项目(JSJY2018002)。

通信作者: 李瑛, E-mail: liying@snnu.edu.cn

DOI:10.3724/SP.J.1041.2019.00724

分类号B841.2; C934

标签:;  ;  ;  ;  ;  ;  

一种齐当别思想下的量子决策模型:对囚徒困境中的分离效应的解释论文
下载Doc文档

猜你喜欢