视频案件中语音的真实性检验研究论文

视频案件中语音的真实性检验研究*

刘满良1邵冬梅2焦娇2

1.广东省东莞市公安局 2.中国刑事警察学院

摘 要: 针对视频案件中的语音资料真实性进行检验分析,探究公安机关实践过程中语音资料真实性检验的应用价值。针对常见的语音被加工编辑痕迹,提出语音真实性检验依据和检验方法。分别对实验语音中的复制粘贴篡改、本底噪声编辑、剪切删除抹除部分等几类典型的语音信号编辑情况,基于文件属性、听觉和声学检验等方面进行语音的真实性检验;并针对案件中的被加工痕迹进行听觉鉴定,对能量图、波形图、频谱图和宽带语图等声学图谱进行比对,测量部分基频及共振峰数值,分析语音编辑的痕迹特征。

关键词: 视频案件 真实性 语音检验 痕迹特征

引言

随着技术侦查走向法治化进程,视频和语音的真实性问题就成了其是否能够成为有效证据的前提[1,2]。但由于通信技术的普及和不断发展,数字视听资料的特性导致其极易被不法分子利用进行篡改并使人难以察觉,以满足其自身的需求。视频案件中语音的真实性问题是目前公安实践中急需解决的难题之一。

视听资料在记录过程中反映客观事实和数据信息等方面不会受到任何记录人和案件参与人的主观操控。从某一个角度说明由其记录的数据信息情况真实,能够反映事实的原始情况,同时能够原声原貌情境再现由音视频证据中所提供的数据信息。在语音的同一性和真实性检验过程中,能够直观真实的给侦查人员和其他涉案人员提供清楚直接的信息。在认定事实、提供线索方面获取较传统物证书证、证人证言等,视听资料能够更加有说服力,但前提是需要做到收集真实准确的原始材料、提交的视频语料和证据信息存储与实际情况一致、操作处理时方法得当[4-5]

本文针对视频案件中的语音资料真实性进行检验分析。针对出现常见语音被加工编辑痕迹,设计语音被篡改后的真实性检验分析实验,总结语音被编辑后的痕迹特征。

通过对企业集团成本管理工作的分析,在部分企业发展中会强调企业的形象,在集团扩张中会重视“量”的增加,在某种程度上忽视了“质”的效果,导致企业在发展的过程中,出现盲目跟风的现象,增加企业运行中的成本支出,为企业竞争力的提升带来限制[2]。

一、语音真实性检验依据

(一)常见的篡改工具

1.Adobe Audition

Adobe Audition是一个专业音频编辑和混合环境。其最大程度能够混合128个声道,用45种以上的数字信号处理效果,提供灵活便捷的操作程序[2],图1为其用户界面图。

(2)剪切类痕迹。此类痕迹指将长短的语音片段中某一小部分语音片段进行剪切操作,将前后的语音片段进行连接[4]

2.Wave Pad

Wave Pad是一款功能强大的多格式支持音频编辑软件,可进行录音、去噪处理、格式化等操作处理,并支持广泛的输出文件格式[6-9]。图2为其用户界面图。

(二)语音被编辑加工的主要方式

(1)抹除类痕迹。此类痕迹会出现频谱图的间断,被抹除区域能量缺失明显,与前后频谱图存在明显断裂分界;在听觉上可能会出现前后文不通顺,语言内容突兀,与正常语言交流逻辑不符,出现非正常的听觉中断或异常情况[3]

此外,还通过数值计算进行了检验。例如,Cupillard和Capdeville(2010)揭示出:在考虑球状地壳构造的情况下,当噪声源在地表呈空间均匀分布时,就可以正确推定其衰减,但当噪声源为局部存在时,就无法进行正确推定了。相同的数值验证也经Weaver(2011)得出了结论。

(5)解决酸性废水处理底泥废弃物的出路问题,避免大量堆置带来的土地占用、污染和安全问题;同时,开发的修复新技术能够从源头防控重金属污染,避免矿区周边土壤和水体污染,改善生态环境,维护人们的身体健康,对于资源节约型社会、绿色矿山建设均具有十分重要的意义。

2.听觉检验

(4)插入拼接痕迹。若插入时语音片段来自同一设备在不同时间段所录制的语音或其他录音设备所录制的文件,那么由于其本地噪声和背景噪声的不同,在图谱表现为噪声的大小和分布差异存在明显整齐边界;在听觉上经过背景噪声的增强可进行区分[3,5]

(5)录音暂停痕迹。若在录音过程中有暂停录制的行为,也就说明得到的材料是不具备真实性的,并且也表明出现暂停按键动作会遗留下暂停按键声音痕迹[6]

二、常用语音真实性检验方法

(一)文件属性检验

实验音频的录音长度为1分31秒57。录音开始即为正常电话交谈,以女性“喂,在家么。”开始,以一男一女交谈对话为主,对话过程双方通过对话对其身份进行阐述并得到确认,包括“张子、大哥、嫂子”,对话内容主要涉及“二百万”几年还钱“三分利息”等内容。实验检材语音内双方对所谈论话题熟知,对涉及事和关键点清楚,双方谈话自然,话题集中。

(二)听觉检验

在对语音文本反复审听的情况下,首先理解语义后对语音中是否出现异常的声音进行检验分析,包括对话语义的连贯性和逻辑性,比如前言不搭后语情况、对话语音的连续性和同一性[13]。若在剪辑中出现不合理背景音不连贯现象则可直接确定检材被剪辑的情况等,另外在听觉检验中最重要的是判断话者说话的内容和语法情感是否出现异常情况[8]

(三)声学检验

在声学检验方面主要包括波形分析和频谱分析。从本地噪声频谱图中各个形态分布情况和数值的连续分布,查找与正常言语情境变换断续、空白或突变的现象,探究语音信号的连贯性[9]

因此,诸如示例1,若采用方案三,信号路由的复杂程度与方案一相同。差别在于,所有的控制过程均发生在DCS中。

三、语音真实性检验分析

通过录制与实际案例相似的语音片段,在进行复制粘贴篡改、本地噪声编辑,删除剪切抹除语音片段后,通过听觉检验、声学检验和文件检验方法对其进行语音的真实性检验。

(一)实验设计

(1)首先将实验录制语音利用格式工厂转化为WAV格式。

(2)分别使用Cool Edit、PRAAT软件对其进行图谱分析,截取语音中出现异常现象图谱并测量记录数据。

(3)结合对语音多处被编辑情况,得出语音被编辑后特征。

在语音10秒568到11秒848中出现疑似剪切痕迹,如图11、图12所示。

(二)检验分析论证

1.文件属性检验

文件格式类型“*.AMR”,单声道,录音时长分别为:1分31秒570,文件大小为:5.59 MB(5,866,888字节)。

(3)频响范围更改痕迹。此类痕迹在检验时主要使用比对法是在相似语音环境下使用原始录音设备录制一个语音样本,对比两者频响范围。

“只要自己不懒,就可以通过劳动来换取积分,而且是多劳多得,用积分就能换取爱心超市里面的产品。”9月13日,沁县段柳乡西河底村贫困户曹保庆手拿一张50分爱心超市积分卡,在村里的爱心公益美德超市,用部分积分兑换了一桶醋、一袋盐、一块香皂。“这个法子确实好,以前村里公务劳动喇叭喊破也不来几个人,现在只要大家没事,听到喇叭都是抢着出来,都想多挣积分,多换些生活用品。”包乡领导沁县县委常委、组织部长、统战部长张东文说。

指利用一定软件对数字语音文件属性信息进行检测分析。包括文件名、格式、时间、大小、采样率、声道数等属性信息,检验其MD5值等判断,与送检方所称原始语音文件属性信息是否一致。所有数字录音文件都可以通过查看“属性”中的“摘要”选项卡获取时长、采样率、声道数、位速等文件属性信息,此外还能获知音频格式信息[7]

在语音24秒262到24秒967中出现语音缺失现象,如图13~15所示。

实验语音的语言衔接较为紧密,所使用的口头语和俗语、语气、语速、音量与情绪状态以及谈话气氛较为吻合,没有听到游离于话题之外的话语,语音片段中出现两百万三分利息经过正常计算可知应还金额为两百万,而非两百五十万,在此数值方面存在不合理情况。在反复审听语音后发现在结束尾端男性“我跟我哥”之后语音缺失,不符合正常电话交流结束用语,实验语音表明检材语料在录音时即为录音不完全,证明其完整性不足。

假设两个观测点的位置分别为r1、r2,这时频率域的波动场用u(r1,ω)、u(r2,ω)表示。这两点的波动场的标准化交叉谱C1,2(r,ω)可定义如下:

3.声学检验

将录音文件由“*.AMR”格式利用格式工厂转化成“Windows PCM(*.wav)”格式。

(1)噪声分析

如:根据不同地质类型进行砂、石取样,以上、中、下三层为主进行等量分层样品,合并后作为试样,避免仅以下层或某一层为试样,导致实验室样本缺乏代表性,增加检验结果与真实情况的差异。

大学生作为创业浪潮的主力军之一,应该注重提升自身创业融资能力,多方了解互联网融资渠道及融资现状,快速识破“挂羊头卖狗肉”的无良互联网融资平台。大学生还应找到创业项目的核心发展命脉,结合当今时代的发展趋势,正确客观评估项目的价值,投资规模以及行业特性。其次,大学生应提高自身沟通表达能力及高效执行能力,在面对互联网融资相关问题时不至于措手不及。

经过实际调查发现,在小学体育教学活动中经常会出现一些学生身心发展速率过慢的问题,在此类状况之下,推广使用分层教学法,不单单可以尊重每个学生个体的差异性,同时更能够辅助教师掌握学生最近的身体状况、个性特征以及学习动态。因此,作为一名合格的小学体育教师,其核心使命在于根据每个学生的身体素质和学习状况,设计出相互贴合的教学目标、评价体系、训练内容,借此引导学生持续提高个人的体育技能、拓宽体育知识范畴,最终落实身心健全发展指标。

本地噪声编辑痕迹情况:分别提取实验语音片段中的随机时间点的本底噪声频谱图并进行分析。如图4、图5所示表明:大部分语音片段从低频到高频的整个分布区域内,本底噪声声谱图表现出极大的相似性,说明在大部分录制音频时,录制设备及型号、使用时间及环境等内部录制变化一致,谈话室内空间环境分布和变化表现一致性,在噪音方面未检测出疑似编辑篡改痕迹。但在实验语音12秒501到14秒747时间段内,发现与其他时间段本底噪声声谱图不一致情况,表明此语音片段在录制语音时所使用的录制设备及型号、环境等与其他时间段不一致,存在疑似被编辑情况。

(2)语音信号分析

①复制粘贴痕迹编辑情况

在实验语音中,17秒596到18秒239语音段中和29秒414到30秒267语音段中两端语音高度相似,如图5、图6所示。

前者的基频值为196.880Hz,后者的基频值为196.314Hz,基频值高度相似,图谱观察发现两者基频曲线变化高度相似,发言人为同一女性。

测出17秒596到18秒680语音段中各共振峰数值分别为F1:534.661Hz,F2:1872.056Hz,F3:2697.892Hz,F4:3039.20Hz;29秒814到30秒267语音段中各共振峰数值分别为F1:540.661Hz,F2:1849.927Hz,F3:2702.882Hz,F4:3041.119Hz,在17秒596到18秒680语音段中0.189秒后与29秒814到30秒267语音段中0.074后的共振峰走向高度相似,在数值方面也具有极高的相似度,经分析认为两者属于复制粘贴痕迹。

选取2017年3月~2018年3月我院收治的早发冠心病患者240例作为研究对象,按照患者年龄将其分为对照组与实验组。其中,对照组年龄60~80岁,平均年龄为(72.14±1.58)岁;实验组年龄30~50岁,平均年龄为(40.14±1.06)岁。男113例,女127例,两组患者一般资料比较,差异无统计学意义(P>0.05)。

②剪切语音片段编辑痕迹分析

在侦查成本与侦查效益的运行关系中,如果侦查决策正确、恰当,那么侦查成本与侦查效益将会呈现出一种同向运行状态;而如果侦查决策不恰当,那么侦查成本与侦查效益将会出现一种异向运行状态。

通过分析本语音段,涉及到本语段中比较关键的借钱数值,截取相应的图谱后发现在“那”和“两”中间11秒006疑似前后剪切不连贯导致的冲直条现象,属于疑似篡改痕迹。

洛马的紧凑型核聚变反应堆属于开端磁力线类型,能较好解决这一问题。如图1所示,该堆由一个近似柱形的反应堆外壳、内部超导线圈、外部封压线圈和两端的磁镜线圈、中性束流注入器以及其他辅助的冷却、供电、控制设备等组成。它的外壳由内包层和外包层组成,内包层由Be、FLiBe等材料制成,外包层由铁或钢之类的低活化材料制成,通过FLiBe或LiPb等液态金属介质进行冷却。

③删除语音片段编辑痕迹分析

猪肺疫俗称“锁喉风”。 该病是由巴氏杆菌引起的一种急性、热性、败血性传染病。各种年龄的猪均易感染,但以仔猪和架子猪发病率较高。(1)急性呈败血症变化,咽喉部肿胀坚硬,呼吸高度困难。呈犬坐姿势,伸长头颈,口吐白沫,皮肤上有淤血和出血斑,很快死亡。死亡率达100%。切开颈部皮肤,有大量胶冻样淡黄或灰青色纤维素性浆液流出。肺水肿,气肿,坏死,纤维素性肺炎。淋巴结肿胀、出血。(2)慢性型主要表现为肺炎和慢性胃肠炎。咳嗽、呼吸困难、脓性鼻液、关节肿大、食欲不振、腹泻、营养不良、消瘦等。

经截取图谱后分析,在24秒262到24秒967语音片段内24秒459到24秒660出现图谱缺失现象,24秒459出现竖直整齐边缘,结合声觉分析,表明出现删除痕迹。

四、真实案例分析

(一)案情介绍

由送检人处可得知:2011年8月至2012年2月期间,xxx以能帮xxx、张xx等人承揽污水处理厂土建、管网工程为由,收取其人民币共计一百余万,涉嫌诈骗。案件要求为送检音频内部是否被编辑加工,即检验语音的真实性。

(二)检验论证

1.文件属性检验

文件格式类型“Windows PCM(*.wav)”,单声道,录音时长分别为:2分44秒555、23分16秒658,文件大小分别为:3.77 MB(3,963,392字节)和32.0 MB(33,636,864字节),分别被命名为REC001和REC002。

2.听觉检验

检材音频“REC001.wav”的录音长度为2分44秒555。录音开始即为一女性的发音:“刚才说两个月三个月咱就招标……”,之后即谈话双方的对话过程,对话过程主要由一女性发言。对话过程中话者对自己及对方身份做了表述和确认,包括“张大哥、梅子、弟妹”等人,对话内容包括“‘话者女’不干、谁干谁拿钱、‘说话人’和小代拿了25万、按招标的1200万给三个点”和分钱等问题。检材语音的语言衔接较为紧密,所使用的口头语和俗语、语气、语速、音量与情绪状态以及谈话气氛较为吻合,没有听到游离于话题之外的话语,语音片段中对话双方交谈符合正常人语言逻辑。但两段语音开头和结束部分均不符合正常双方对话开始结束语言逻辑,表明检材语音在录音时即为中途录音,证明其完整性不足。

3.声学检验

(1)噪声分析

经随意选取等时间各任意点时长分别为3秒到6秒的语音片段进行实验表明,整体语音片段从低频到高频的整个分布区域内,本底噪声声谱图表现出极大的相似性,说明在整体录制音频时,录制设备及型号、使用时间及环境等内部录制变化一致,谈话室内空间环境分布和变化表现一致性,在噪音方面未检测出疑似编辑篡改痕迹。

(2)语音信号分析

命名为REC001的音频文件在4秒124到5秒493的语音片段中,对话女性的谈话内容为:“从今年七月份转化到就完了是。”中间无过渡语言,上下文不连贯,在图谱中表现为4秒761到4秒844和4秒930到5秒010中存在不完整现象,宽带语图显示能量明显缺失,结合听觉不符合言语情境的变化,表明出现间断现象,如图18、图19所示。

在1分03秒583到1分05秒866的语音片段中,对话女性内容为:“去,我啥时候跟他,对我的意思跟他”前后表达内容突兀,不符合正常谈话现象语言表达,在图谱中1分04秒459时间上有明显疑似剪切痕迹,频谱图边缘过于齐整,不符合正常图谱表现,从1分04秒459到1分04秒617出现图谱缺失现象。

五、结语

从语音证据的三要素为入手点,运用专业的软件对视频中语音的分析和各种属性的检验,深入研究了视频中语音是否有被抹除、剪切和篡改的痕迹,在文件属性上、听觉上、声学上和噪声的检验方法对视频中语音的真实性进行确定,使其更加系统化和严谨化,为公安工作的侦查和破案提供依据,使其在刑侦工作和话者鉴别研究中更加实用与简便。

参考文献

[1]王志飞.数字音频司法鉴定技术研究[D].厦门大学,2014.

[2]邵松年.数字音频的真实性鉴定[D].上海交通大学,2010.

[3]王华朋.常见语音被编辑加工痕迹的检验方法[J].警察技术,2017(3):54-56.

[4]孟建国,等.编著.视听资料检验[M].中国人民公安大学出版社.

[5]廖翔,赵志龙,庞业光.声像检验鉴定技术概述[J].警察技术,2006(06):46-47.

[6]岳俊发,王英利.编著.声纹鉴定[M].警官教育出版社,2000:134-140.

[7]王英利.声纹鉴定技术[M].群众出版社.

[8]刘琦.数字视听资料分析及检验技术[M].法律出版社.

[9]孟建国.视听资料与器材的司法鉴定技术[M].北京:警官教育出版社,1996:196-202.

*基金项目: 科技部国家重点研发专项项目(编号:2017YFC0821000);中国刑事警察学院教研项目(编号:2018QNZX19)

标签:;  ;  ;  ;  ;  ;  

视频案件中语音的真实性检验研究论文
下载Doc文档

猜你喜欢