生态智能:人类推理算法对频率的适应性_贝叶斯推理论文

生态学智力:人类的推理算法对频率的适应,本文主要内容关键词为:生态学论文,算法论文,智力论文,频率论文,人类论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号B848.5

1 引言

人类的视觉系统是与自然光线的波谱特性相适应的,例如:在黎明时略带蓝色的光线和黄昏时略带红色的光线下,我们所看到的同一物体的颜色保持不变。这种“颜色恒常性”表明,我们的知觉系统已经适应了我们祖先进化的环境,换言之,我们的知觉系统已为“进化适应的环境”或EEA[1]所塑造了。然而,正如我们所知道的那样,我们的知觉系统在某些人造光线如钠或水银灯下,则不再保持颜色恒常性。可见,当适应的环境发生稳定变化时,我们的视觉系统也会被欺骗。

人类的高级认知系统是否也具有与知觉系统相类似的特点呢?换言之,人类的推理算法是否象颜色恒常性一样,是为EEA中曾出现的一定格式的信息而设计的呢?本文通过考察贝叶斯推理(Bayesian Inference),即有机体从一个或几个指标中推论两个事件中哪一个是正确的简单说法,来对上述问题予以探讨。

2 贝叶斯推理

David Eddy(1982)曾让医生们基于下列信息做一个估计:

乳腺癌在病人中的出现概率是1%(医生的先验概率)。如果病人得了乳腺癌,放射线专家能够正确作出诊断的概率是79%(灵敏度或击中率)。如果病人乳房有一良性病变但不是乳腺癌,放射线专家将其误诊为癌症的概率是9.6%(虚报率)。

问题:乳房X片检查结果为阳性的妇女实际患乳腺癌的概率是多少?

Eddy的报告指出,在乳房X射线检查结果为阳性后,100个医生中有95个都把患乳腺癌的概率估计为75%[2]。这种推理来自于对疾病的观察(阳性的检验结果),或者更一般地说,从数据D到假设H的推理,通常被称为“贝叶斯推理”,因为它符合贝叶斯定理的数学模型:

方程1表明,妇女在乳房X射线检查呈阳性(D)后患乳腺癌(H)的概率p(H/D)是由病人患乳腺癌的先验概率p(H),放射线检查结果的灵敏度计算出来的。概率p(H/D)称为“后验概率”(p-osterior probability)。符号代表“病人未患乳腺癌”。方程1是关于一元假设和数据的贝叶斯定理。该定理是在英国人Thomas Bayes解决了如何从数据推论出假设的问题(即所谓的反转问题)之后命名的。

然而,值得重视的是,由方程1所得出的概率仅为7.7%,而大多数医生的直觉推理则是75%。换言之,乳房X片检查结果为阳性的妇女实际患乳腺癌的概率要低于医生们的估计值。这种结果似乎表明,人的推理并不遵循贝叶斯定理。近25年的许多文献都曾反复传送这样的信息:人的推理能力很差劲,在大多数时候都忽视了基本比率,忽视了虚报率,而不能按贝叶斯定理将基本比率、击中率和虚报率整合在一起[3]。类似乳房X射线照片的概率问题已成为教科书、讲座,以及聚会中常见的娱乐项目。指出别人有多笨保证能搞笑。然而,究竟是什么原因致使人们的推理与贝叶斯定理不吻合呢?

3 生态学的贝叶斯推理:对频率的适应

以颜色恒常性为例,如果一个人的视觉系统进入钠灯照明的环境中,颜色恒常性算法规则就会不起作用。但这并不意味着人的心智不是按颜色恒常性规则来建造和工作的。相反,它说明人的视觉系统已为进化适应的环境所塑造了。同样,当人的推理系统进入了一种与人类进化环境中遇到的统计信息的表征形式不同的环境时,推理算法规则(贝叶斯定理)也将不起作用,而这并不意味着人的心智不是按照贝叶斯方式进行推理的。它表明了归纳推理算法对它们的环境的适应。

人的推理算法是与哪种形式表征的信息相适应的呢?人类在其进化环境中遇到的数字信息的表征形式是什么?虽然大多数研究非理性判断的学者都采用概率和百分比来表征数字信息,但我们可以肯定,概率和百分比绝不是我们的祖先在其进化环境中遇到的信息形式。

概率和百分比是人类进化史上较晚出现的表征不确定性的一种方式。数学概率出现于17世纪中叶,而百分比则是到了十九世纪,在法国大革命期间引入公制之后,才为人们所使用。但当时百分比主要是用于表示利率和税收,而不是表征不确定性。直到20世纪下半叶,概率和百分比才在西方国家的日常语言中用来表示不确定性[4]。既然概率和百分比是用了上千年的时间才在文字和数字上演化为表征不确定性程度的一种信息格式,那么在此以前人类是以何种格式获得数字信息的呢?

最初的格式是由自然取样(natural sampling)获得的自然频率(natur-al frequencies)。以乳房X射线照片问题为例。设想在一个文盲社会中,当人们正受着一种新的、严重的疾病D折磨时,当时的医生既没有书,也没有统计调查报告,他必须完全依赖自己的经验。幸运的是,他发现了预示疾病的症状S。在他的一生中,他共看过1000个病人,其中10人有这种疾病D。在这10人当中,8人表现出了症状S;在990个未得此病的人中,有95人表现出了症状S。这样,共有8+95=103人表现出了症状S,而其中只有8人患有疾病D。现在来了一个新的病人,他有这种症状S,那么他实际患这种疾病D的概率是多少?

文盲社会的医生不会用计算器来计算贝叶斯后验概率。他所做的只是继续追踪症状和疾病案例的数目(8)以及症状和无疾病案例的数目(95)。新病人实际患病的概率可以容易地从这些频率中“看”出来:

p(H/D)=a/(a+b)=8/(8+95) (2)

方程2是关于自然频率的贝叶斯定理,其中a是有症状及疾病的案例数,b是有症状但无疾病的案例数。依据自然频率,文盲社会的医生很容易发现,新病人患病的可能性是100人中少于8人,或约为8%。从经验中学习的医生不可能那么容易被欺骗,去相信新病人患病的可能性是75%,象她的许多现代同行那样。

比较方程1和方程2,我们发现:当信息处于自然频率状态(方程2)而不是概率状态(方程1)时,贝叶斯推理在计算上非常简单(从所进行的操作数目来看)。值得指出的是,在方程2中,事件频率的基本比例(如1000中有10个)已不必保存在记忆中,它隐含在两个频率a和b之中。

那么,“自然取样”是如何与“自然频率”相关联的呢?Gigerenzer和Hoffrage[5]提出,自然取样是根据经验而对事件频率不断进行更新的序列过程。比如,一个觅食的有机体,在日复一日选择食物的过程中,逐渐学会了以其他物种的出现(线索)来预测食物出现的频率,从一次次地观察中,它不断地更新频率a(有线索也有食物)和b(有线索但无食物),由此进行自然取样。而系统的实验研究取样则与自然取样有所不同。在实验研究中,每个处理组的样本大小(基本比例)都是事先固定了的。例如,在临床实验中,研究者可能选择100个癌症病人和100个无癌症者进行对比测试。通过固定基本比例,这种实验设计中得到的频率便不再携带着基本比例信息。

自然取样的结果是由自然频率来报告的,而报告方式不止一种。在文盲社会的医生案例中,我们既可以将基本比例、击中率a和虚报率b直截了当地转换成自然频率:“在他的一生中,他共看过1000个病人,其中10人有这种疾病。在这10人当中,8人表现出了这种症状;在990个未得此病的人中,有95人表现出了这种症状。”我们也可以单独传递频率a和频率b:“在他的一生中,他共看过8个有这种症状和疾病的人,95个有这种症状但无这种疾病的人。”前一种自然频率是以标准菜单(standard menu)的形式来表述的,后一种自然频率是以简化菜单(short menu)的形式来表述的,二者得出的结果相同。

无论以标准菜单还是简化菜单的形式来表述,自然频率都与相对频率(如:基本比例是.01,击中率是.79,虚报率是.096)的表征有所不同。相对频率,如概率和百分比,是不再携带自然的基本比例的标准化数值[5]。相对频率对于人类的推理算法(贝叶斯类型的推理),就好比钠灯对于人类的颜色—恒常算法。所不同的是,人可以被教会按事件概率进行推理,尽管会有一些心理上的痛苦,但人不可能被教会在钠灯下保持颜色恒常性。

总之,从颜色恒常性到归纳推理,人的心理算法是在具有相当稳定特性的环境中进化来的。如果存在从数据到假设的贝叶斯类型推理的心理算法,那么这些算法一定是为自然频率而不是概率和百分比设计的。外行和专家的推理算法都应如此。

4 相关的研究证据

4.1 乳腺癌患病率

David Eddy关于医生的直觉推理研究是以概率格式呈现的数字信息。如果他们使用自然频率来表征信息,医生的直觉推理会有所不同吗?

Gigerenzer和Hoffrage[6]就乳房X射线照片问题测试了48个德国慕尼黑的医生。这些医生平均有14年的职业经验。其中24个医生阅读概率格式的信息,24个医生阅读自然频率格式的同样信息。当信息以概率格式呈现时,医生要回答的总是单个事件的概率。例如:“该妇女实际患乳腺癌的概率是多少?____%。”当信息以自然频率格式呈现时,医生要回答的总是对频率的判断。例如:“想象一些乳房X射线检查结果为阳性的40-50岁的妇女实例,这些人中实际有多少人患有乳腺癌?___人中有___人。”每个医生阅读并回答4个诊断问题(乳房X射线照片问题是其中之一),其中2个是概率格式的,2个是自然频率格式的。

研究发现,当信息以概率格式呈现时,24个医生中只有2个(8%)的回答符合贝叶斯推理;当信息以自然频率格式呈现时,24个医生中有11个(46%)的回答符合贝叶斯推理。全部4种诊断问题所得到的结果与此类似——符合贝叶斯推理的结果在概率格式中是10%,在自然频率中46%。对医生的非贝叶斯推理进行分析发现,当信息以概率格式呈现时,两种主要的非贝叶斯推理是:从灵敏度中减去虚报率;简单地采用灵敏度。这两种策略都忽略了基本比例。当信息以自然频率格式呈现时,这两种策略基本上消失了,医生的主要非贝叶斯推理都集中在了基本比例上——疾病的基本比例,或检测为阳性的比例。同时,在自然频率这种表征形式下,医生们也较少紧张,推理更为放松,且只需较少的时间即可完成任务。对在诊断推理方面无专业知识的外行进行的测试,也得到了类似的结果。

这些研究说明,医生或外行在贝叶斯推理上的失误与信息的表征形式有关。当信息以自然频率格式来表征时,贝叶斯推理会变得更加容易。当信息以概率格式来表征时,外行和有经验的医生都同样无助,他们都不会自发地将概率信息转化为自然频率信息。这就提示我们:不应指责专家或外行在概率问题上的失误,而应注重以自然频率,即与人类心智进化的环境中获得信息的方式相对应的形式,来表征教科书和医患人员之间交互作用的信息。

4.2 认知错觉

既然人们在日常推理上的失误与信息的表征形式有关,那么心理学中的许多“认知错觉”(cognitive illusions)现象是否也与它有关系呢?

以“自负偏见(overconfidence bias)”为例。让学生们回答一些问题,如:“哪个城市的居民更多些,Islamabad还是Hyderabad?”然后让学生们估计他们回答正确(自信)的概率是多少。典型的结果是,当学生们说他们100%自信时,他们回答正确的概率仅仅是85%。当他们说他们90%自信时,他们回答正确的概率是75%,依此类推[7]。这种主观概率和客观频率之间的偏差称为“自负偏见”。人类的许多灾难,从致命的工业事故到法律程序中的失误,都被归因于这种“认知错觉”。然而,当我们用频率判断来替换概率判断时,这种认知错觉则消失了[8]。我们让学生在每回答完50个问题以后,估计他们答对了多少题,结果这类频率判断不再出现高估现象。事实上,学生们估计得相当准确,甚至有低估的倾向。

再以"Linda"问题为例。让人们阅读一篇关于Linda的文字,文中暗示Linda是一位女权主义者。然后要人们回答下面哪种情况更有可能:(a)Linda是一个银行出纳员;(b)linda是一个银行出纳员并且在女权运动中很活跃。结果80%-90%的被试通常都选择了(b)。这是一种Tversky和Kahneman(1983)称之为“结合错误”(conjunction fallacy)的反应,因为二个事件(出纳员和女权主义者)结合在一起的概率不能比其中之一(出纳员)的概率更大。然而,当让人们改做频率判断时,Linda问题和相关任务中的“结合错误”则发生了变化:想象有Linda这样的200个女性。她们中有多少个是:(a)银行出纳员;(b)银行出纳员并且在女权运动中很活跃?将概率替换为频率以后,结合错误从80%-90%下降到了0-20%[9]。

可见,频率表征和判断不仅使日常推理更容易,而且也倾向于使实验室中的“认知错觉”大量消失。

5 结论

信息需要表征。如果一个表征在人类进化过程中反复出现并且很稳定,那么则可以认为,心理算法是设计在该表征上操作的。以此来理解人类对不确定性的推理可以得出:人类的推理算法是为自然频率而不是相对频率设计的。当我们遇到的信息不是现代的概率和百分比形式,而是与我们祖先进化的环境中反复出现的信息形式相同时,我们的推理则容易得多、简单得多。来自广泛日常生活情景和实验室实验的证据都表明,自然频率能使人的心智更聪慧。

标签:;  ;  ;  

生态智能:人类推理算法对频率的适应性_贝叶斯推理论文
下载Doc文档

猜你喜欢