法医学领域的决策_科学论文

法证科学领域的决策,本文主要内容关键词为:领域论文,科学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]D918.9 [文献标识码]A

[文章编号]1674-1226(2012)03-0370-13

一、现实生活中的法证科学**

目前,法证科学十分“火爆”。由于《犯罪现场调查》(Crime Scene Investigation)和《法证侦探》(Forensic Detectives)这类电视节目一直高居排行榜,法证科学课程的注册学生数量创下新高,大家在这一问题上的兴趣持续不减。在2002年到2004年仅仅两年时间里,英国大学开设的法证科学课程就翻了一番多,从150个增加至将近400个,并且还在持续增加。然而,虽然我们可以理解非专业的旁观者对这一现象有不同的判断,但是在法证科学的花园中并非一切都美好。在现实生活中,由于法证科学上的许多方法还没有经受科学仔细的审查,法证科学因缺少科学根据而日益遭到批评。而且,正如以下这些例子所显示,近期的深入观察表明,法证科学领域的决策充满困难性。

案例1.Stephan Cowans案

2004年1月23日,在马萨诸塞州波士顿监狱服刑的Stephan Cowans获释。因为DNA分析证明,一个身份不详的罪犯留下的棒球帽、运动衫及该人所使用的玻璃杯上残留的生物微量物证应该不是他留下的。虽然从这三个受检客体上的细胞检材中获取的DNA图谱相同。但却不能与Cowans的DNA图谱匹配。随后又发现,波士顿警方曾认定玻璃杯上残留的拇指指印来自于Cowans,现在看来并非如此。在他被定罪时,这枚指印以及两名目击证人——被害人和另一证人——的照片排队辨认,是定罪的唯一证据。Cowans案是第一个使用DNA证据重获自由的案件,这个因瑕疵指印证据而被定罪的嫌疑人随后被平反昭雪。Cowans这个被判定使用其自己的枪支对警察造成非致命枪伤的人,已经在监狱中度过了将近七年。①

案例2.Brandon Mayfield案

2004年5月6日,美国出生的37岁律师、穆斯林信徒Brandon Mavfield被以“重要证人”为由,在其家乡俄勒冈州波特兰被捕,并被单独囚禁于联邦监狱。根据1984年《重要证人法》,如果潜在证人的证言对刑事程序非常关键,并且能够证明不能确保该证人到庭,则公诉人就可以申请逮捕令。法官必须批准这一逮捕令,而证人则有权获得法院指派的律师的帮助。自9·11事件以来,人们认为使用这一法律所扣留的人并不是被视为潜在证人的人,而是(迄今为止)没有足够的不利证据的嫌疑人,因此,对之可以未经指控犯罪而加以扣留。

无论如何,在Mayfield被捕后不久,事实证明,他之所以被逮捕是因怀疑他参与了2004年3月11日马德里Atocha火车站爆炸案。该案导致191人死亡、接近2000多人受伤。经FBI综合自动指印识别系统(IAFIS)(该系统包含超过4400万人的4亿4千万份指印样本)的检索,三位FBI资深指印专家毫不含糊地(却是错误地)将装有雷管的塑料袋上的一枚指印与Mayfield的指印认定为同一。②该塑料袋是在袭击发生数日后,在火车站附近停放的一辆货车上发现的,遇袭的四列火车中有三列是从此站驶离的。根据Mayfield辩护律师的请求,法官指派了一位独立专家,他也做出了相同的结论。尽管早在Mavfield被捕前,西班牙当局就曾向FBI提出,Mavfield的参考指印与现场指印并不匹配,然而直到Mavfield已被拘禁两个星期,并且西班牙当局告知FBI,指印实际上是来自于一名阿尔及利亚人后,Mavfield这名在一起家庭纠纷案件中为被判有恐怖罪行的男子担任辩护人的律师,才最终被释放。

经FBI请求,某指印专家国际委员会就此案进行了审查,并得出了如下结论:“失误之所以发生,是因为在该特定检案中使用了ACE-V*这一特殊检验方法时发生的”(Stacey 2004)。这种试图通过归责于专家以维护该方法的分析的问题在于,方法和专家本身是密不可分的,因为在指印检验过程中,专家的一个基本作用即是作出判断和评测。

案例3.Sally Clark案

Sally Clark是一名沙律师(solicitor),在她被判定于1999年谋杀了她的两个男婴后被监禁了三年多。对她的指控,最初在一定程度上是根据错误的统计学证据进行的。在一个像Clark这样的家庭中发生两起婴儿猝死症(SIDS,或Sudden Infant Death Syndrome)的概率据称是7300万分之一,该数字是一个中产阶级家庭中仅发生一起婴儿猝死症的概率(大约85000分之一)的平方——这样计算是不合理的。然而,在一个家庭里发生第二例婴儿猝死症的概率后来被估计为大概是百分之一。儿科医生、教授Rov Meadow爵士曾在其《虐童犯罪指南》(ABC of Child Abuse)一书中归纳出了所谓的“Meadow法则”:一个婴儿死亡是一场悲剧,两个婴儿死亡则具有嫌疑,而三个婴儿死亡则是谋杀,除非证明有其他可能。自此以后,多个婴儿死亡受到高度怀疑。Meadow是第一位对被他称为“代性孟乔森综合征(Munchausen by Proxy)”的情况进行描述的人,在此症状中,母亲可能会将伤害甚至杀死自己的孩子作为一种引起自己注意的手段。Sally Clark于2007年3月15日去世。③

案例4.Schiedam公园谋杀案

Kees Borsboom,因强奸和谋杀10岁的Nienke Kleiss以及对她的朋友11岁的Maikel殴打并谋杀未遂而被判18年,2004年12月10日,35岁的他在服刑4年后,被有条件的释放,因为定罪后进行的DNA检测表明,在从小女孩牛仔布夹克上遗留的微量生物物质中提起的DNA图谱与26岁的Wik H.的图谱相匹配,Wik H.于2004年7月因涉嫌两起独立的性侵犯而被捕,案件涉及殴打、强奸和杀人。在随后的调查过程中,H.声称他就是杀害Nienke的凶手,Nienke的朋友Maikel是通过装死才侥幸活命。无任何痕量物证表明Borsboom与谋杀有关,而从受害人的指甲内残留物提取的部分DNA图谱和在其左靴上发现的痕量物证指向一名未知男性。

这份不完整的DNA图谱未能在荷兰国家DNA数据库中找到匹配项,当时该数据库仅仅录入了1000多人的参考DNA图谱。在2004年底得到了H.的DNA参考图谱之后,上述不完整的图谱被证明与他的图谱相匹配。尽管没有DNA证据指向Borsboom并且已有的DNA物证指向另一个男子,但是Rotterdam地区法院和Hague上诉法院都依然判决Borsboom谋杀罪成立,这很大程度上是依据他在被扣押期间向警方作出但随后又撤回的自白。在作出两次维持原判的判决后,荷兰最高法院于2005年1月撤销原判,暂缓了刑期的执行,并指令该案由Amsterdam上诉法院进行再审。

2005年4月27日,H.因对Nienke Kleiss实施强奸和谋杀以及对她的朋友Maikel进行殴打并谋杀未遂被判有罪,他被判处20年徒刑并附加强制精神治疗(terbeschikkingstelling)——这是一种住院医疗命令,即强制送入精神病院治疗的非惩罚性约束,这是对因精神失常而被认定为限制行为能力的罪犯施加的一种强制措施。这个案件有力地说明了收录有(性犯罪)累犯的DNA图谱的参考数据库具有重要价值。令人遗憾的是,由于该数据库仅关注已经作出自白的嫌疑人,警方和检控方所采用的调查方法有点使人联想到醉汉在路灯下寻找他的汽车钥匙。即使他想不起来他把钥匙丢在哪了,他依然坚持在路灯下寻找,因为路灯下的光线比较好。

案例5.Shirley McKie案

大概10年前,警探Shirley McKie被控伪证罪。苏格兰犯罪档案局声称在犯罪现场发现的指印痕迹是她的,但是她否认曾经进入过犯罪现场。McKie的否认导致其被控伪证罪。尽管并未认定她犯有伪证罪,但是苏格兰犯罪档案局依然坚称其鉴定结论的准确性,没有采取纠正措施。两年后,一些世界顶级指印鉴定专家指出,那个潜在指印并不能与这个警察的参考指印相匹配,因而不可能是她的。2006年2月12日,苏格兰行政当局向McKie女士赔偿了75万英镑。④

尽管法证科学在大众媒体当中有着良好形象,尽管DNA证据发挥着毋庸置疑的作用,法证科学,特别是法证鉴定学或刑事技术学,在近年来仍遭到了猛烈的抨击。⑤在过去的几十年里,各国曝光的一些更为严重的正义不彰事件,看上去至少在一定程度上与不足的法证科学专业标准或者对正确调查结果的错误解释有关系。像指印鉴定(指印检验)和可疑文件检验这类已经长期适用而值得信赖的法证鉴定程序,现在被认为缺乏充分的科学基础,而关于法证鉴定科学的传统说法被认为在逻辑上站不住脚而遭到抛弃。诸如Evett和Williams(1996)所做的研究,以及近期的一些案例,诸如苏格兰的Shirley McKie案、美国的Brandon Mayfield案、伦敦的Sally Clark案以及荷兰的Schiedam公园谋杀案和Lucia de B.案(见下文),都进一步印证了法证科学领域当前所面临的危机。

与此同时,法证科学正在迅速扩张。特别是DNA图谱可以说在很大程度上给法证科学带来了革命性的变化。它不仅自身就是强大的调查和证明工具,或许带有讽刺意味的是,在很大程度上因为人们越来越熟悉DNA证据所使用的科学范式,传统的鉴定科学现在处于严重的困境当中。更具体地说,可以说主要是通过定罪后的DNA检验暴露了许多证据的局限性,特别是目击证人辨认的局限性。对此,Barry C.Scheck和Peter J.Neufeld于1992年在卡多佐法学院(Cardozo Law School)建立的非营利性的法律诊所(“无辜者计划”)起到了主要作用。该计划仅仅办理定罪后的DNA测试能够提供无罪证明的决定性证据的案件。在诊所中,学生们在律师和诊所职员组成的团队的指导下办理案件。迄今为止(2008年4月),该计划已经为215起案件平反昭雪。⑥

二、法证科学的局限性

法证DNA分析的崛起,以及与它所使用的概率模型日益凸显,使对法证科学证据解释的兴趣被再次唤起,特别是对物理痕迹来源的检验结果的解释。对于这类问题的讨论最初发生在法证科学专家领域,但讨论的范围很快开始超出了这一范畴,扩展至那些发觉自己是法证科学专家所做结论接受者的人群:辩护律师、法官和公诉人。展现法证鉴定结果的不同方式,反映了各种方法背后的各种明示或者暗示的假设。各个法证鉴定科学领域是不同的,法证科学整体所使用的方法也是不同的。这些不同方法的存在,使得人们对于法证辨认证据的科学地位,以及更广泛意义上的刑事技术学和法证科学的科学地位的质疑日涨。有趣的是,这些质疑始终与法证证据扮演的下列角色密切联系,即减少刑事案件调查背景下的不确定性,在调查和证据活动中提供决策基础。这些调查和证据活动开始于罪案现场人员对痕迹的选取,一直到事实审判者对嫌疑人的罪行作出最终裁决为止。

刑事技术学作为一门科学,其背后的基本假设是存在差别的,这反映在它使用的方法上面,并对各类法证科学(鉴定)证据的解释和报告有重要的影响。除了对法证调查活动的科学地位和其背后的基本原则存在质疑外,有关法证科学领域的现状,也就专家的角色和职责——这种角色和职责不同于事实审判者,以及关于专家和法律工作者的交集提出了严重质疑。由于在法律领域,技术和科学知识的使用与日俱增,在法律工作者和科学工作者之间存在巨大的鸿沟,不能刻意夸大这些问题的重要性。

三、法证鉴定:个体识别

此时此刻,我们首先应当看一下法证鉴定学与其他法证科学的区别。实际上,这些区别可以使用Intoan和Rudin(2002)对不同的法证科学过程的称谓来描述,即鉴定、种属认定、个体识别、结联和重建。

个体识别过程,即来源识别的推论,是所有法证鉴定学的最终目标。⑦刑事调查人员和事实审判者都急于知道归罪性的痕量物质是不是来源于特定的人或物,从而有可能在特定的人或物与特定的犯罪行为之间建立联系。在尝试回答这一问题时,不同类型的法证鉴定科学就来源属性并没有使用同样的科学范式,因而并没有使用同样的模式报告其结论。这种情况可以总结如下:

很大程度上,因为DNA证据使用的科学范式日益凸显,传统的鉴定科学,例如指印鉴定以及其他鉴定领域,现在处于严重的困境当中。在这里,存在争议也就是法证鉴定科学的科学性问题。⑧批评者的批评提到了所采用的方法缺少科学上的严谨性、鉴定者存在的各种偏见以及许多传统的、稳固确立的法证科学程序所固有的检控取向等问题。⑨在其中的一个领域,即指印鉴定领域,从业者几乎一致支持所谓的“肯定主义”。它的前提是这样一个概念:摩擦嵴鉴定是绝对性的鉴定,不同程度可能性的鉴定都不能为摩擦嵴鉴定这一科学所接受。因此,在指印鉴定界,鉴定只能作出绝对性表述,否则就会被排逐于指印鉴定界外。可以说,这种做法在相当程度上助长了对科学证据性质的根本性误解。事实上,与普遍看法不同的是,科学证据本质上不是绝对性的或确定性的,而是概率性的。⑩

四、归纳问题

法证鉴定学的核心问题之一是关于比较研究成果的报告方式。正如Kwan(1977)在其开创性的论文及其他著作中指出的那样,任何形式的同一认定实质上都是一个归纳过程。尽管法证鉴定程序可以导致绝对的排除,正如DNA图谱分析这一例子所表明的那样,除非潜在来源的数量是有限的和已知的,否则没有一种法证鉴定程序可以做到绝对的同一认定。不仅如此,下面我们可以看到,甚至连概率识别都是很成问题的。

按照Popper的说法,对于某种假说的正确性的终极证明,并未大功告成。(11)对假说的确认、证实和确证都是有价值的测验过程,根据其本身或者属性,它们都不能提供一种终局的证明或绝对的确定性。我们可能做到的是这样一种方法,即形成一种可能成立的假说,对之进行检测,在它们没有获得充分支持的情况下,摒弃它们,从而减少不确定性。但是其余的还没被摒弃的部分假说,并没有获得科学事实的地位,它们实质上还只能以概率状态存在。从这个角度看,我们当成科学知识而接受的,充其量也不过是我们迄今为止还不能够加以摒弃的一系列经过反复测试的假设而已。

刑事调查和刑事证据收集与评估,可以被认为是减少不确定性的过程。认为这些过程与科学当中应用的过程颇为相似的观点,正快速占领市场。这在很大程度上是DNA证据面世的一个结果。对这种证据的阐释遵循着下文所列的模式。DNA证据的空前影响使得法律工作不能对此视而不见。或者,正如德国心理学家、柏林Max-Planck人类发展研究所主任Gigerenzer所说,DNA指印对法律界提出了新的要求,这包括抛弃对确定性的幻想,并学会就不确定性进行理解和交流。(12)

对于整个法证证据或者专家证据而言,这种模式意味着经过检验之后,某种似真的假说或者假设可能被直接排除掉,某些人或物也不会被视为特定痕迹的来源或者犯罪的实施者。(13)排除是基于演绎推理——它可以带来逻辑上的正确和必然的结论——如果前提正确则保证结论真实。排除是基于演绎推理的,也就是基于如下设计:如果A真则B真,如果B不真则A不真。在前提真实的情况下,演绎推理确保了结论的真实性。在进行排除的情况下,这意味着“A不真”的结论可以接受为正确的。这是基于这样的假设,即“A真则B真”这个前提条件正确,“B不真”这个检验标准,产生了真阴性结果,而不是假阴性结果。另一方面,真阳性结果“B真”并不能导致绝对的阳性结论,因为“如果A真则B真,因此B真则A真”属于无效的演绎推理。

另一方面,不能推翻假说并不能得出假说已被证明是正确的结论。肯定的证据包括肯定的鉴定不是演绎而是归纳的结果。归纳得出的结论不是绝对确定性的而是概率性的。正如除非我们看见了所有的乌鸦,在此之前我们不能得出所有乌鸦都是黑色的结论一样,只有在我们完成了痕迹与所有潜在来源的对比之后,我们才能得出某个痕迹出自于某个来源的确定性结论。(14)在现实的法证科学世界里,在绝大多数案件中,这种做法既不可行也不可能。

尽管如此,我们乐见事实审判者基于可得的、必然是概率性的证据,而对案件事实做出明确的决定。我们接受的是,从严格的逻辑角度看,事实审判者所得出的结论是不可辩驳的。在有罪判决中,在作出案件结论已经得到证明的时候,事实审判者最终会忽略归纳的问题。他们认可将他们的定罪判决转化为必然,从而出于各种目的而将存在的不确定性降低为零。

五、传统法证鉴定领域的决策

就种属问题,无论是作出确定性的报告,还是可能性的报告,都是存在问题的。尽管这种说法已经被普遍接受,但是实际的普遍做法与此相反,即使是物理痕迹的比对检验,比如将某枪弹与特定手枪发射的一组参考枪弹进行比对,表明可疑枪弹与参考枪弹在条纹痕迹上有高度相似性,并没有无法解释的不同之处,这也并不能为可疑枪弹很可能出自参考手枪的说法提供依据。如果潜在手枪群组中只有一只可能留下了与可疑枪弹相对类似的条纹痕迹——更不用说高度相似的条纹痕迹了——我们就不能仅根据火器比对检验做出一个概率性陈述。但是,传统的法证鉴定工作者常常就是这么做的。在回答对诸如特定嫌疑人是否开枪射击、是否留下指印、是否写了勒赎信或打了电话的问题时,他们常常刻板地回答这些问题,通常多多少少地按照下列模式,用言辞概率分级来表述他们的回答:

过去就法证科学检验结果进行报告的方式所进行的讨论,常常关注的是如何使用言词进行表示,而不是使用数字或者百分比进行表示。因为在大多数法证鉴定领域中,在比对过程中使用的特征频率的量化数据都是稀缺物。这个问题没有真正引起很多有意义的讨论,而是通常情况下将其作为唯一剩下的选项来解决问题。就一系列概率判断而言,我们在确定使用哪一个时,使用的是痕迹材料与潜在来源共有的(组合)特征的估算稀缺值(或频率)。如果该特征被估算为(非常)稀缺,并且任何差异都能够得以解释,(15)这将导致专家确信可疑材料与参考材料之间如此类似,以至于可以排除它们恰巧同时出现的可能性或概率。正如Huber(1959-1960)所说的那样:当任何两个物品共有特征的数量和意义能够排除它们恰巧同时发生的可能性,并且也没有无法解释的差异,那么就可以得出这样的结论,即它们同一,或有相同的来源。

对与传统法证鉴定工作者的实际做法,作出最准确描述的大概是Stoney,他将法证科学工作者作出同一认定的实际机制描述为“思维奔跃”。

在发现两个形态之间存在越来越多的相符特征的情况下,科学家和外行人都变得主观确信这些形态不可能是偶然重样。在此情况下,有些类似于“思维奔跃”。这是在对少数特征中变化多端的特点进行观察,进而考虑众多特征的情况之后,做出的跳跃、推论……在指印工作中,我们变得去主观地确信同一性;我们不是去证明(Stoney 1991,198)。

尽管传统法证鉴定领域的执业者通常知道,犯罪现场材料与参考材料相吻合的相对频率数据很重要,实践中很少能够得到数据,所使用的估计数也很少能够超过“约数”标准。系统的实证研究基础上所获得的数据常常缺乏,但是常染色体的DNA分型是个明显的例外。(16)

总之,我们可以说来源归属,即将某一痕迹归于某一唯一来源,不能仅仅基于科学证据,而是不可避免地要求就有关痕迹来源于有关来源的概率,作出明示或者暗示的先验概率假设。无论可疑的笔迹检材与特定的潜在书写者的参考笔迹多么相近,如果在可疑文件被书写时,潜在来源已经死了,则显然不能(仅仅根据观察到的相似性)说,可疑文件(非常)很可能为该人书写。(17)任何关于特定的来源归属假说的概率陈述,必然包括两个要素:第一个要素是,两个假说相互竞逐情况下,证据的概率;第二个要素是,各个假设的先验概率的估算值,即在作出科学证据之前,来源归属假说的概率值。

六、可能性尺度的替代方案

我们总是试图就可能性尺度找到替代方案,但是这并不总是能够带来术语上的更大的统一性,更不用说更高的精确度了。许多法证科学执业者最喜爱的术语是“与……相一致”。比如说,油漆和纤维的比对检验结果被随后报告为与痕迹和参考材料具有同一来源的假设相一致。此处特别不清楚的是,有多少其他痕迹(具体而言:多少其他纤维片段)能导致相同的结论。恰恰是因为最后这个因素没有明确,因此这个表述是具有高度建议性的,因而完全应当舍弃。有人提出替代这一表述的更好方法是“并非不一致”,因为这表达了这样的中心思想,即“不能被排除”来源的同一性。像“本可能来自”、“可能来自”这样的措辞看上去都有这样的缺陷,即它们也都没提到存在可能至少表明比较相似程度的其他来源,以及其可能的数量。所有这些情况都缺少的是对观测到的相似性和差异性的意义所进行的足够说明。最好是量化的说明。

七、DNA分型

还是法证DNA分型,因为它有着稳固的科学基础,它被作为法证科学鉴定程序的一个不言而喻的范例,越来越多被作为其他法证鉴定程序的标准。在法证DNA分型中,结论一般由两部分组成。第一部分说明比对的结果,第二部分指明其含义。如果将从犯罪现场样本中提取的DNA分型与来自一个已知的人(比如刑事调查中的嫌疑人)的样本进行比对(我们忽略了从任一或两个样本都没获取DNA分型的情况),则有两种可能的结果:

(1)分型(完全)不匹配(18)

(2)分型匹配

比较研究结果的报告需要辅之以一份关于其含义的说明。假设在从犯罪现场到实验室的任何一个阶段都没有错误发生,则结果1意味着嫌疑人可以被从犯罪现场材料的来源(或提供者)中排除,而结果2则意味着嫌疑人可能就是样本的来源。有趣的是,在后一种情况下,调查人员和事实审判者最想从专家那里得到回答的问题,即嫌疑人是否是犯罪现场材料的来源,却没有得到直接的答复。在匹配情况下,专家所报告的不是犯罪现场材料可能或几乎肯定来自于匹配中的嫌疑人,而是在相关嫌疑人群中具有相同DNA分型的任一成员的概率,即所谓的随机匹配概率。对于一个完整的SGMPlus分型(19)来说通常被认为远远小于十亿分之一,然而在法证科学实践中并不罕见的是,部分分型可能会被按照大约是千分之一的随机匹配概率来加以报告。

实质上,这种方式说明的是,专家会根据特定的假设就其研究结果的概率做出说明,但是他显然不准备说明该假设的概率是多少,即根据其研究结果,犯罪现场材料来源于嫌疑人(即匹配)的概率是多少。这种条件的转换在逻辑上是不正确的:如果A包含B,并不会得出B包含A的结论。严格来讲,后一种说明类型,即所谓来源归属说明,是专家不可能作出的。换言之,在证据(E)的概率(P)——根据匹配犯罪嫌疑人是犯罪现场细胞物质来源的假设(H)而观察到的DNA匹配的概率,即P(E|H)——与给出证据之后得出相同假设的概率(即P(H|E))之间,存在根本性的不同。同样,在-H——嫌疑人不是在犯罪现场发现的细胞物质的来源的假设的概率,即P(?H|E)——情况下发现匹配的E的概率常常微乎其微,不应当与匹配情况下嫌疑人不是犯罪现场细胞材料来源的假设概率——即P(E|H)——相混淆。这样做相当于“条件转换”,即将“A真则B不真”这样的条件命题转换成了“B不真则A真”。在刑事法律背景下,人们已经认识到这种有缺陷的推理是检控方的谬论。这个说法来源于Thompson and Schumann(1987)提供的一个案例。在该案中,一个检察官似乎相信,如果嫌疑人具有真凶的某种特征——即嫌疑人具有特定的血型,而这种血型在人群中的相对频率是10%,而真凶属于这10%,则嫌疑人就有90%可能就是真凶(即100%-10%=90%)。尽管嫌疑人如果清白的话,他具有此血型的几率应该说有10%,如果这意味着他具有此血型,则他无辜的概率只有10%,这就是错误的。

八、贝叶斯法(20)

一个简单的例子可以说明该问题。假如我们向窗外看,发现街道是湿的。这种观察就会引导我们假设一直在下雨。然而,街道是湿的这一发现本身,并不能提供充分的证据证明一直在下雨,甚至可能一直在下雨。在很少降雨的国家,降雨的先验概率很小,因此,另一种解释可能更说得通,可能有一场示威活动,即可能根据需要使用了水炮。在天天下雨的国家,下雨的几率很高。则街道因下雨而湿润的先验概率就很高。如果街道潮湿就是下了雨的实际概率,并不能仅仅以发现街道潮湿为据。同样,犯罪现场物质是嫌疑人留下来的概率,也不能仅仅以发现其DNA分型与现场物质相匹配为据。总的来说,专家可以基于特定假设,就研究结果的概率进行说明,但是他不能做那些事实审判者经常要求他做的那些事,即在给出证据的情况下,就假设的概率给出说明。

在证据解释的逻辑模型中,专家的作用被限定在就其研究结果的概率作出说明。诸如对特定嫌疑人留下犯罪现场物质、开枪、写勒赎信或打电话的先验概率进行评估,这是超出专家的能力的。这需要有专家通常没有掌握或不应当掌握的信息。在逻辑模型当中,应该是决策者或事实审判者根据专家提供的证据来更新其先验概率,来形成一个后验概率,即检控方的假设是正确的。这种模型是Robertson、Vignaux (1995)和Evett et al.(2000)提出来的,目前得到了许多权威法证科学工作者的大力提倡,尽管它实际上在DNA分型以外很少适用。

对于大多数其他类型的鉴定证据而言,并没有相关特征的频率统计数据,这一事实可以解释为什么很少在DNA分型以外使用DNA模式。然而,就此得出结论说,因为缺乏背景数据,所以这一模型不相关,这是错误的。相反,这一模式是一个有力的概念框架,这明确说明了需要什么样的数据才能得出一个来源归属说明,这还澄清了专家的独特作用,即就科学证据的概率和证明力作证。这还说明了事实审判者的作用,即将科学证据的证明力和非科学证据的证明力结合在一起,以得出一个全面的、必然是主观的但是绝对的裁判。

我们用一个基本的量化例子来说明这一方法。假设从犯罪现场提取的细胞材料中获取了一部分DNA图谱。假设该图谱与因犯罪已被拘捕的嫌疑人的图谱相同。我们假设随机匹配的概率——即人群中一个(无关的)随机成员,不能被作为犯罪现场样本的来源人而被排除的概率——是千分之一。这样,在以下两种假设情况下,证据的证明力就可以按照证据出现的可能性比率来计算:

(1)Hs:嫌疑人是供体

(2)Hr:人群中的一名随机人员是供体

则可得出:

我们可以把这种所谓的可能性比率输入贝叶斯定理所谓的概率格式的数据。这就是说,两个相互竞逐的假设的可能性比率,是在证据介入之前两个相互竞逐的假设的可能性比率,乘以在两个相互竞逐假设背景下证据的可能性比率。

用公式表示,即:

或者,假设除了嫌疑人之外,还有五百人(仅仅依据DNA证据)都同样可能是犯罪现场材料的供体,但是我们并不知道这些人的DNA图谱。在本案中,嫌疑人是犯罪现场材料供体的先验概率是五百分之一。可能性比率是千分之一。如果我们将这些数字输入公式,可以得出:

用语言来表达就是:当嫌疑人是细胞材料供体的概率是1 to 500(或者0.2%)时,在有了DNA证据以后,后验概率上升到了66.7%。如果另外只有五十个人同样可能是潜在供体,则嫌疑人是真正供体的后验概率将是:(1 to 50)×1,000=1,000 to 50=1,000/1,050=95.2%。如果另外只有五人可能是潜在供体,则嫌疑人是真正供体的概率是:1,000 to 5=1,000/1,005=99.5%。

所以很明显,后验概率不仅取决于证据的力度——正如在可能性比率所表现的那样,还取决于先验概率的力度。后者在这里是按照估算的可能供体的数量来界定的,但是这也可以根据嫌疑人是供体的主观估算来确定,这种主观估算是根据目前为止可以得到的所有证据——即在DNA证据介入之前——作出的。

案例6.Lucia de B.案

在荷兰护士Lucia de B.一案中,一名统计学家计算出,在三个医院里,护士轮班与大量死亡和复苏术同时出现的概率是三亿四千二百万分之一。他的结论是这不是巧合。不幸的是,他没有向法院说明,这个数字不论它数值是多少,代表的是巧合概率的计算结果,如果该巧合是出于偶然的话。更糟的是,他认为这相当于巧合出于偶然的概率。这种错误是检控方谬误(见上文)的一个实例。按照贝叶斯法,我们首先应当基于两种而不仅是一种假设来计算证据的可能性比率。它们是考虑到护士是杀手(我们把这设为1,或者100%)的情况下,证据——在三个月中发生的令人怀疑的死亡和濒死的概率,以及考虑到护士是无辜者情况下证据的概率。考虑到偶然性,我们假定后者相当于令人怀疑事件的概率。考虑到偶然性,如果我们接受统计学家关于证据的数字是三亿四千二百万分之一,可能性比率将是一除以三亿四千二百万分之一,等于三亿四千二百万。这是个庞大的数字。但是,为了计算证据的预测值,即谋杀假设的后验或者实际概率,我们需要考虑谋杀情景的先验概率:我们在多大程度上认为护士会去杀死她的病人?无论我们拿出什么数据,这种概率应该都非常的小。尽管也有像Harold Shipman案那样的案例,但此人是医生而不是护士,人们认为他在2004年自杀之前,杀死了215个人。还有Charles Cullen,他在1988年到2003年之间,杀死了45个病人。从统计的角度看,这些案件都非常罕见,但有趣的是,却并不引人瞩目。如果为了讨论,我们将谋杀的先验概率设定为一百万分之一,则谋杀的后验概率将缩减至1/324。如果我们像一些统计学家所提议那样修改偶然概率,我们所得到的后验概率会在1/48甚至1/5的范围内。这无论如何也不能接近排除合理怀疑的标准。(21)

九、一种新的言词形式

起初,为了避免以言词形式表述这种没有根据的后验概率结论,人们使用了这样一种表述,即“(有限的)证据支持假设……”,如下所示:

有两个问题。第一个是没有说明其他假设,因此可能很容易地低估或者高估证据。第二个问题是这种表述往往等同于说“(有限的……非常强的)证据支持……假设”,这即使不等于说假设(非常)可能,也存在被如此解释的严重危险。一个正确但可能相当繁琐的表述是检验结果构成了“一个支持假设的(……)增势”。

除了没有提及其他假设外,这种表述还有一贯正确的特点:对特定假设的很强的增势等同于以绝对的术语很强烈地支持该假设,这种危险——如果有的话——看似不太严重。然而,这种表述的过分准确性可能造成不必要的问题。

荷兰法证科学研究所(NFI)目前正在考虑一种报告模式,以求避免这两个问题:它明确提到了其他假设,以及它并不像后验概率那样易懂。这种模式主要是在各种法证鉴定学科中使用,如下所示:

十、特异性

在2007年2月,一群主要来自英国的法证语言检验人员和语音学家发表了一份立场声明,就法证科学结论的表达提出了一种新的概念框架。就像上面的格式4,所推荐的框架具有良好的贝叶斯概率理论基础,避免使用条件句。简而言之,新的框架包括两个步骤:第一步,要做出一个(明确的)决定,即已知样本和嫌疑样本是否相一致,即他们是否同出自一个话语者。在这一阶段有三种可能:一致、不一致和无结论。如果结论是样本被判定一致,则并不必然意味着它们出自同一个话语者。该决策程序的第二步是,评估两组样本共有特征的特异性。特异性特征被“默示”定义为“不同寻常”或者“不是人群中的大多数人所共有”。为了对有关的特异性进行分级,我们将其分为五级:

虽然这个框架成功地避免了倒序条件句,但是对该表最高级别的解释上还存在缺陷。将该表最高级别界定为“其他话语者具有这一结合特征的可能性”,就犯了双重错误(Stoney 1991(24))。相同的错误常见于DNA分型。与此相关的不是第二个人的分型与犯罪现场样本及匹配嫌疑人的分型相同,而是相同分型在人群中曾经(平均地)出现的概率。我们与掷骰子比较:第二次和第一次掷出相同点数的概率是六分之一,而不是三十六分之一。在识别话语者的背景下,正确标准应该是出现在随机人员话语体系中的结合特征的概率,而不是出现在两个人话语体系中的概率。换言之,与DNA分型匹配相比,也是要对人群中的话语者的话语的有关结合特征出现的频率进行评估。此外,这种对该表中的最高级别的表达方式,能否使读者不再将其读为一种传统的后验概率的陈述,这似乎是令人怀疑的。

十一、预期性偏差和认知污染

还有两个对传统法证科学的威胁仍然没有得到讨论。第一个是预期性偏差。通常情况下,要求专家就可疑材料和警方合理认为来自于相同来源的参考材料进行比较。此外,他们易被与本问题无关的信息干扰,从而使其结论易造成偏差。检验者可能被告知嫌疑人已经自白,或者另一法证鉴定结果已呈阳性。为了避免这种可能很强的认知污染,在分析人员和报告人员之间应有严格的隔离措施。与此同时,对于一个有效的证据调查方法而言,相关信息可能是至关重要的,正如Cook等人(25)主张的案件评估和解释模型的示例中说明的那样。

预期性偏差的问题可以通过一种证据排队方法来克服,即检验人员不仅仅要面对可疑材料和参考材料——这是对包括后者在内的材料的遴选结果,还要面对来自于所称的来源相当的来源的许多材料。该检验应当盲测,即分析人员在理想状态下应当不知道(1)哪个是可疑材料,(2)哪个是参考材料,(3)在证据排队中有多少不同的来源。比如,在一个弹壳检测中,会有一组痕迹材料提供给分析人员,这不仅要包括在犯罪现场发现的弹壳,以及用涉案手枪产生的参考弹壳——这是标准做法,还要包括许多相似口径手枪射击产生的弹壳。然后要求分析人员单纯依据材料中的信息,结合其作为专家的知识和经验,对材料进行分组。在视觉领域也有人提出了类似的模式,即目击证人不会在排队辨认中与一个嫌疑人面对面,而是同时展现许多人,包括嫌疑人在内,所有这些人都要与犯罪现场被看到的人的一般特征相符。(26)

十二、结论

在民事和刑事案件法律问题的解决上,专家报告扮演了一种至关重要的,有时甚至是决定性的角色。它们可能被法官或陪审团用来帮助其确定案件事实或者做出支持某一方而不是另一方的认定,但是它们也可能是支持或合理化建立在非科学证据基础上的、先入为主的信念。有这样一种危险,就是由于法证科学知识的所谓科学地位,它科学上受尊重的光环会被法律决策程序所借用,这不仅经常毫无根据,而且自始至终是不可取的。法律决策过程实质上是一种法律程序。法证科学家不仅不应当被允许或者亲自去僭越法官的作用,而且应当始终明白其作用是就法证科学的证明价值发表意见而不是要解决最终问题。与传统报告模式不同,DNA证据解释中所使用的模型是理想的,适于这么做:迫使专家在一系列特定假设基础上,就研究结果的概率进行报告,将就(检控方)概率作出决断的任务留给了事实审判者。

(收稿:2012-05-10;修回:2012-06-10)

本文原文Ton Broeders,Decision-making in the Forensic Arena,H.Kaptein,H.Prakken & B.Verheij(eds.),Legal Evidence and Proof:Statistics,Stories and Logic,Ashgate,71-92.本文已经获得原作者简体中文翻译授权。

注释:

**有学者将forensic或者forensic science翻译为“法庭科学”,这是目前使用较为广泛的译法。而在lexisnexis英汉法律词典中,将forensic译为“法证科学”,指在调查任何罪行的过程中,应用科学方法分析收集所得的证据;或应用科学方法比较及诠释有关罪行的法律程序。对于犯罪行为而言,发现、提取、保全和分析证据的过程中均有借助科学方法的需要,“法庭”只是这其中的一个阶段,而非全部。如果采用“法庭科学”的译法,其含义可能被片面地理解为仅将科学方法的使用于法庭调查或者法庭审判阶段。Forensic的本意是将科学方法服务于法律程序各阶段的证据调查与证据适用的科学。因此,译者认为采用“法证科学”比“法庭科学”的译法更为贴切,表达的意思更为全面。——译者注。

*ACE-V是指对潜在指印辨认的分析、比对、评估和确认过程。——译者注

①Loftus,E.F.and Cole,S.A.,Contaminated evidence,304 Science,959(2004).

②关于法证科学的含义参见Rudin,N.and Inman,K.,Fingerprints in print-the apparent misidentification of a latent print in the Madrid bombing case,4 CACNews,14-21(2004).有关答辩方对案件的描述,参见Wax,S.T.and Schatz C.J.(2004),A multitude of errors,The Chamoion,September/October,6.有关美国司法部门提供的FBI处理Brandon Mayfield案件的最终评估参见Fine,G.E.(2006),A Review of the FBI's Handling of the Brandon Mayfield Case-Unclassified Executive Summary,Office of the Inspector General,US Department of Justice,Washington,DC.

③详情参见www.sallyclark.org.uk.

④详情参见www.shirleymckie.com.

⑤更多详细讨论,参见Broeders,A.P.A.,Of earprints,fingerprints,scent dogs,cot deaths and cognitive contamination-A brief look at present stare of play in the forensic arena,159 Forensic Science International,148-157(2006).有关官方对于法证科学领域适用的简要权威评论,参见Saks,M.J.and Koehler J.J.,The coming paradigm shift in forensic identification science,309 Science,892-895(2005).

⑥www.innocenceproject.org.

⑦Kirk,P.L.,The ontogeny of criminalistics,54 Journal of Criminal Law,Criminology and Police Science,235(1963).将刑事技术学定义为“个体识别科学”。

⑧Saks,M.J.,Risinger,D.M.,Rosenthal,R.and Thompson,W.C.,Context effects in forensic science:A review and application of the science of science to crime laboratory practice in the United States,43 Science & Justice,77-90(2003).与这一文章几乎相同的文章更早见于Risinger,D.M.,Saks,M.J.,Thompson,W.C.and Rosenthal,R.,The Daubert/Kumho implications of observer effects in forensic science:Hidden problems of expectation and suggestion,90 California Law Review,1-56(2002).

⑨McRoberts,A.L.,Scientific working group on friction ridge analysis,study and technology,52 Journal of Forensic Identification,263-348(2002).

⑩Broeders,A.P.A.(2003),Op zoek naar de bron:Over de grondslagen van de criminalistiek en de waardering van het forensisch bewijs(Deventer:Kluwer).

(11)Popper,K.R.,The Logic of Scientific Discovery(London:Hutchinson).或者,就像Champod and Evett(Champod,C.and Evett,I.W.(2001),'A probabilistic approach to fingerprint evidence',51 Journal of Forensic Identification,105(1959).所说的:“如果我们希望着手的是数量未定的人群,则不可避免地要使用概率性表述。确实,这是整个统计学界的看法。”De Groot(De Groot,A.D.(1994),Methodologie,12th Edition(Assen:Van Gorcum).)也指出,所谓的单一确定性假说,即“所有的A都是B”,“所有的乌鸦都是黑的”,“所有的指印/耳廓/书写特点/声音都是不同的”。都可以被一个相反的但不能严格证明的例子所驳倒:“只有检查了关于A的例证的全域,我们才能确定每个A都是B。(表示为APAB)”,在实践中,只有在面对小规模封闭人群,或者在法证科学背景下,面对小规模潜在来源/嫌疑人人群的情况下,这才是可能的。

(12)Gigerenzer,G.(2002),Calculated Risks:How to Know When Numbers Deceive You(New York:Simon & Schuster),183.

(13)只要我们处理的是分类的、离散的或名义的变量(Broeders,A.P.A.(2003),Op zoek naar de bron:Over de grondslagn van de criminalistiek en de waardering van het forensisch bewijs(Deventer:Kluwer)。对于连续变量,通过显著性实验的手段排除假说也有概率基础。

(14)尽管如此,即使这样,不会总是有可能得出痕迹的确定来源是什么。

(15)换言之,差异是否与共同来源假说相符。

(16)常染色体DNA、核DNA、染色体DNA或基因DNA位于人类细胞核的22对染色体上,它们具有同样的结构。第23对染色体是性染色体,女性的性染色体具有相同的结构即XX,但男性性染色体是XY的组合。在法证科学中,如果细胞材料不充分,经常使用其他两种DNA分型技术,即线粒体DNA(mtDNA)——它存在细胞核之外的细胞质中,以及Y染色体DNA。第一个,线粒体DNA来自母系,是不变的;第二个,性染色体来自于父系。与常染色体DNA相比,这两种DNA分型的区分能力相当低。

(17)参见Champod,C.and Evett,I.W.,Commentary on A.P.A.Broeders:Some observations on the use of probability scales in forensic identification,6 Forensic Linguistics,228-41(2000),7 Forensic Linguistics,238-243(1999).

(18)自从基因向我们表明近亲属会拥有相同的分型,不完整但是接近匹配的情况可能暗示,嫌疑人也许有一个近亲属与犯罪现场的样本具有相同的分型。尽管如此,这种相似可能纯粹是偶然,例如,意外。尽管如此,近年来英国和威尔士国家DNA数据库的所谓“家族搜索”,已经在一些案件中利用近似匹配最终引导警方找到嫌疑人,比如在20岁的Craig Harman的案子中,他从交通搭桥上扔了一块砖害死了一个卡车司机〈www.forensic.gov.uk/forensic_t/inside/news/list_Dress_release.ohp? case=23&y=2004〉.开始利用这种低严格性搜索的案子,是一些旧案:于2003年解决的1998年Lynette White谋杀案,以及1973年“Saturday Night Strangler”实施的谋杀案,其鉴定是2001年其死后才作出(Broeders,A.P.A.(2003),Op zoek naar de bron:Over de grondslagen van de criminalistiek en de waardering van het forensisch bewijs(Deventer:Kluwer),346-7.

(19)二代复用之SGMPlus分型标准中的SGM,包含同时录入十个所称的DNA基因座或者基因标记。

(20)1763年,在Rev.Thomas Bayes死后出版的其著作An Essay towards Solving a Problem in the Doctrine of Chances中,命名了所描述的这一方法,作为对“Bayesian”的替代,在证据解释的语境中,相当广泛地使用“logical”,来对集中于证据概率陈述的范式方法与对假说概率陈述做出报告的传统方法进行区分,这暗示了对有缺陷推理的明显忽视。

(21)Buchanan,M.,Conviction by numbers,445 Nature,254-255(2007).

(22)Broeders,A.P.A.,Foreword and Some observations on the use of probability scales in forensic identification,6 Forensic Linguistics,211-13 and 228-241(1999).

(23)Sjerps,M.and Biesheuvel,D.B.,The interpretation of conventional and "Bayesian" verbal scales for expressing expert opinion:A small experiment among jurists,6 Forensic Linguistics,214-27(1999).

(24)Stoney,D.A.,What made us ever think we could individualize using statistics?,31 Journal of the Forensic Science Society,197-199(1991).

(25)Cook,R.,Evett,I.W.,Jackson,G.,Jones,P.J.and Lambert,J.A.,A model of case assessment and interpretation,38 Science & Justice,151-156(1998).

(26)Wells,G.L.,Small,M.,Penrod,S.,Malpass,R.S.,Fulero,S.M.and Brimacombe,C.A.E.,Eyewitness identfication procedures:Recommendations for lineups and photospreads,23 Law and Human Behavior,603-647(1998).

标签:;  ;  ;  ;  

法医学领域的决策_科学论文
下载Doc文档

猜你喜欢