云录音声纹检验实验研究
刘世杰 王 虹
(中国刑事警察学院,辽宁 沈阳110000)
摘 要 声纹检验技术是针对声音的检验,声音载体的变化也带动了声纹检验技术的发展进化。从最初的没有载体,到模拟录音时代的磁带,到数码录音时代的各种数码录音设备,再到“互联网+”时代的“云录音”,声音载体在发生着变化,声纹检验技术也随之向前发展。本实验以新兴的“云录音”为对象,从声纹检验技术的角度对其能否进行语音同一认定进行探究。
关键词 云录音 声纹 声纹检验 语音同一认定
1 声纹检验
声纹检验技术是指利用语音学、声学、语言学、信号处理等多学科知识,对涉案语音进行检验鉴定的一项专门技术。包括语音同一认定、语音人身分析、语音内容辨识、录音真实性检验、降噪及语音增强、噪声分析、音源同一鉴定和录音器材鉴定。
现代意义上的声纹检验技术起源于语图仪(声谱仪)的发明,这个仪器是一个动态的声波分析仪,能够对输入的语音信号进行时间、频率、强度(t-f-a)三维的动态分析,从而将听觉的声音转化为视觉可见的声纹图谱(Spectrogram),并对其各项参数进行分析。
每个人的生理发声结构也具有各自的特点,同时每个人不尽相同的成长及受教育环境也导致了每个人的发声动作及习惯上的差异,这些都能转化为各种声纹特征(如共振峰频率值特征、共振峰走向特征、音节间过渡音征)展现在声纹图谱上,为通过语音进行个体识别、语音同一认定提供了基础[1]。
温度、NaCl和PEG对石竹种子萌发的比较研究……………………………………………………… 刘 佳,马 楠,贺学勤(110)
2 云录音概述
云录音(Cloud Recording)是互联网时代的产物,不同于模拟录音时代的磁带载体和数字录音时代的数码载体,云录音的载体是基于互联网云计算的网络云存储。在一只脚踏进5G时代的今天,各大互联网巨头均开始了自己的云布局,在可预见的未来,随着网速的提升,万物联网,各种基于云计算的方案将会层出不穷,云录音是基于云计算,通过本地录音设备(智能手机、固话、电脑)将声信号转化为电信号经由互联网上传存储至网络服务器的新兴的录音方式。目前市场上较为成熟的云录音系统有3种:
一是适用于政企用户的云录音管理系统,以“VAA先锋音讯”为例。客户端可实现自动录音功能,录音结束时自动将录音文件转码上传至服务器(根据需求可建立私有云存储服务器,更加安全,避免隐私泄露)存储,客户端无法更改录音文件,同时可以对上传的录音进行分类整理归档,进行分析,后台通过大数据处理,形成相关报表。这一类云录音系统突出在一个管理,将某一特定系统内部的录音通过互联网集中在一个云端服务器进行管理,以录音记录为基准,通过大数据算法,为管理者获取有价值的信息。
二是适用于个人用户智能手机的云录音软件,以“匹诺曹通话录音软件”为例。该软件兼容目前大多数“安卓”和“ios”智能手机,在使用时需下载相应的APP,获取权限后软件会接管手机本身的录音功能,实现通话自动录音和现场录音功能,并可在录音结束时实时上传至云端服务器,不占用用户手机内存,该公司的安全机制可有效保证录音在上传之后不被篡改,在用户需要时可通过APP申请,对录音进行保全公证,提高录音文件的证明力。这一类云录音系统旨在为需要取证或记录某些时刻的个人用户提供云端存储及必要时的保全公证服务。
三是由电信运营商开发的云录音功能,不同于第二种使用的第三方软件的做法,这一类云录音系统,由电信运营商协同开发。以“音证宝”为例,这是中国电信联合安存科技开发的录音证据取证平台,不用下载额外的软件,直接通过拨打电话时加上相应前缀号码即可实现录音保全,并可在音证宝官方网站下载相应录音文件。这套系统同样在后台同公证机构对接,可对录音进行公证,提高证明力。
不管是哪一种云录音系统,都在想办法提高其录音文件存储的安全性,以确保录音文件不会被篡改或丢失,同时,为提升其证明力,与公证机构合作,对录音文件进行公证。但是,在录音真实性、完整性有一定保障的情况下,又会存在对录音文件中发音人身份的质疑,这时候就需要对涉案语音文件进行语音同一认定,以确认录音中发音人的身份。云录音系统获取的录音文件与常用录音设备(智能手机或录音笔)获取的现场录音文件在声纹图谱上是否发生变化,声纹特征是否改变,是否具备进行语音同一认定的条件,本文将通过实验探究来回答这些问题[2]。
3 实验
3.1 实验器材[3~4]
3.1.1 录音机具
索尼(Sony)线性录音笔(型号为PCMD100 LINER PCM RECODER,根据实验需要,将采样率设为48kHz)。
3.1.4 其他工具软件
4.3.1 音节内过渡音征
“匹诺曹通话录音”APP(安卓端)、Microsoft Office Excel、HprSnap6(抓图软件)。
VS8.0语音工作站(网络版)。
3.1.2 通话设备
3.1.3 语音分析软件
3.2 实验设计
在分内外两间的录音室中,外间放置录音笔B和安装有“匹诺曹通话录音”APP的手机B(OS105),内间放置手机A(A1586)和录音笔A,两部手机互相打电话,并同时打开录音笔进行同步录音,手机安装的云录音软件获取主被叫云录音文件,录音笔获取同步现场录音文件。如图1所示。
本实验以适合个人用户的“匹诺曹通话录音”云录音系统为例,进行实验探究。
图1 实验设计示意图
3.3 录音样本
对样本中无动程单元音韵母形成的直线型共振峰以及大量复合元音韵母形成的曲线形态的共振峰进行了频率值的测量(如图2所示,以单元音“ɿ”为例)。除部分音节因录音设备的问题导致共振峰显示不完全,几乎所有测量音节的共振峰频率值特征均可作为进行语音同一认定时的符合特征来使用。说明共振峰频率值特征在本实验中非常稳定,未发生变化,该特征可运用于针对云录音文件进行的语音同一认定[7]。
[1]Laufer,B.&P.,Nation.(1999).A Vocabulary Size Test of Controlled Productive Ability,Language Testing,16(1).33-51.
4 实验结果
将云录音文件从网络云服务器下载至本地,并把现场录音文件和云录音文件同时导入语音工作站进行比对分析。通过细致比对共振峰频率值特征、音节间过渡音征、音节内过渡音征、共振峰走向特征等声纹检验实践中常用特征,发现云录音与现场录音相比,声纹特征无明显变化,可用于语音同一认定。
未来一周, 台风活动频繁, 受其影响华北南部、东北地区中南部、黄淮北部、江南东部、华南及西南地区等地累积降雨量有50-80 毫米, 其中华南南部、江南东部、黄淮西北部、东北地区中南部及云南南部等地的部分地区有100-180 毫米, 局部地区有200-400 毫米降雨; 上述大部地区降雨量较常年同期偏多3-8 成,局地偏多1 倍以上。
回顾整个诊断维修过程,正是由于上述原因,维修人员使用试灯进行控制电路的诊断时,由于试灯没有点亮,所以将诊断引入到控制电路和ECM故障的方向去了。再加上维修手册上的电路图标注错误,线色与实际不符,让诊断变得“复杂”。不过,这也让笔者对汽车故障诊断有了更深的认识:
4.1 共振峰频率值特征
共振峰频率值是在进行语音同一认定时最常用的特征之一,反映的是发音过程中某一时刻或时间段声道的形状特点,跟每个人声道的生理结构紧密相关,不同的结构形状,使发声过程中气流共振的频率不一样,故此特征在诸多声纹特征中偏重于生物特征[5-6]。
常用电话对话词汇、数字0~9、长篇语料:《北风和太阳的故事》。
4.2 共振峰走向特征
共振峰走向反映了语音的动态特性,由发音过程中发音器官的运动情况及其本身的形态特性决定,因而,此特征不仅能够反映个人发音器官的生理结构特征,又能反映其发音动作、习惯特征。在多种特征中,共振峰走向特征既是生物特征,又是行为特征,只是不同的情况下侧重不同。
大部分教师沿用传统的数学教学方法,在课堂上以讲理论知识和做大量的练习题为主要内容,尚未意识到对学生思维能力培养的重要性,导致学生思维能力不足,学习成绩下降。教师要积极响应新时期素质教育的理念,教学方法也要与时俱进。每位学生都有不同的思维方式,在课下教师要和学生多交流,对学生的思想进行大概了解,对其进行总结,然后转变传统的教学模式;以学生为主体,让学生对习题或知识点进行自我学习,教师起引导作用;尊重学生的思维,并对学生存在的错误耐心纠正,鼓励学生利用创新思维解决难题,保持学生的个性,增强学生对数学学习的积极性。
对样本中的单元音韵母、二合/三合元音韵母以及多元结构的共振峰进行了细致的观察比对,共振峰走向特征均呈现出较好的符合,没有明显的差异。如图3所示,a中的单元音“i”的F1、F2呈平直状态,F3稍降,F4稍升,同样的,这些走向特征在b中显示出符合;图4是多元音群“太阳”的宽带声纹图,从图中看出,a的F1呈现下凹状,F2、F3呈上凸状,这些在b中也显示出一样的走向特征,而且拐点的数量、位置也一致,可以作为语音同一认定时的特征符合点使用。经过实验的观察比对,云录音文件中,不论是单元音韵母还是多元音群,其共振峰走向均未发生变化,可以用来进行语音同一认定。
图2 单元音“ɿ”共振峰频率值特征
图3 单元音“i”宽带声纹图
图4 “太阳”的宽带声纹图
4.3 音素间过渡形态特征
发音是一个动态的过程,在日常讲话语流中,两个相邻音素之间并不是机械连接的,前后两个音素会发生协同音,形成过渡段。同样的,每个人在学习发音的过程中,对于每一个音素的理解和掌握并不相同,就会出现不同的舌位、动作,这就决定了不同人在发相同音素时,音素间的过渡状态不可能完全相同。这个特征又是兼具个人生理结构和行为动作习惯的特征。
安卓智能手机(型号为OS105);IOS智能手机(型号为A1586)。
音节内过渡音征主要看一个音节内部的辅音、元音之间的过渡音征走向和过渡方式。实验中对云录音样本和录音笔录制的现场录音样本进行了全面的比对检验。以图5为例,云录音样本a中“先”音节内部的辅音-元音过渡段T2、T3基本呈现出平渡,在过渡方式上,声韵母之间有明显的边界,呈清晰过度。录音笔样本b中,过渡音征走向以及过渡方式表现与a一致,在语音同一认定时可以作为符合点特征来用。
但是,很多招牌、广告仍然使用不规范字。究其原因,主要有以下几点:商家缺乏语言文字法律法规知识;相关部门对使用不规范字的行为监管不到位,没能及时督促商家整改;更换招牌、广告需要耗费大量人力、物力、财力,商家不愿意整改。《重庆晚报》曾报道重庆三峡宾馆因为宾馆两个字使用了繁体字,被有关部门勒令更换的新闻。三峡宾馆将所有广告、设施、用品上印制的繁体字都改成简体字,花费了十多万元[15]。由此可见,有关部门应该完善管理和监督流程,在商家制作招牌、发布广告之前对其用字进行审核,及时纠错,而不是等到商家已经使用了不规范字再勒令整改。
通过以上分析,可知接收机链路的绝对时延和时延波动由通道中带宽最窄滤波器决定的,因此在实际设计中要减小电路的绝对时延与时延波动,应满足以下设计原则和措施:
在法律完善的条件下如何让教师使用《教师法》来维护自己的合法权益成为当务之急。增强教师权利意识成为关键。首先,可以加大宣传力度,综合运用各种传播渠道如:网络、电视、新媒体等多种方式宣传《教师法》,扩大《教师法》的影响力。除此以外,可以定期组织教师培训宣传,讲解《教师法》的相关内容,让教师充分了解《教师法》并学会运用它维护自己的权利。
图5 “先”的宽带声纹图
4.3.2 音节间过渡音征
音节间过渡音征看的是相邻不同音节之间,前一个音节的元音和后一个音节的辅音之间的过渡段特征。以图6为例,云录音样本a中过渡段L3呈平渡,L4呈降渡,两个音节间界限模糊,呈模糊过渡。录音笔样本b中过渡段展示出相同特征,在语音同一认定时可作为符合点特征使用。
图6 “有事”的宽带声纹图
5 讨论
经过以上实验,对语音同一认定中高频使用的几项特征进行了细致的比对检验,同时进行了除通话云录音之外的现场云录音的比对实验,发现云录音样本相比录音笔录制的语音样本共振峰频率特征、共振峰走向特征、音节内和音节间过渡音征均未发生变化。语音同一认定并不是单纯的看某一个特征就可以得出结论,需要多项特征相互印证,经最后综合评断,方可得出结论,经过多项特征的多次重复检验,并未发现云录音对个人声纹特征产生明显影响或者改变。可以得出结论:云录音样本可以像普通数码录音设备录制的语音样本一样,进行语音同一认定检验[8]。
传统的声纹检验为避免原始检材的损坏,在规范提取检材语音时,需要采用网侦技术手段或使用数据只读接口进行传输,相对复杂,而且数码录音易于剪辑,很难保证录音真实性和完整性。云录音在录制阶段不可中断,录制完成后会自动上传云端服务器,本地的临时缓存文件为不可编辑的加密文件,即使别有用心之人将录音下载至本地进行重新编辑也无法对云端服务器的原始录音文件进行覆盖,这从录制及存储的过程中尽可能的避免了对录音文件的剪辑[9]。
多媒体手段和多模态方式结合能够产生语境,使它与情景语境、互文语境等因素一起在语篇教学中发挥综合作用,有助于学生增进理解形式与意义之间的关系, 提高语篇分析能力。语境化教学原则主要有以下几点。1)坚持语篇教学语境化和英语学习程序化相交互。2)坚持语境与外语习得过程因素的交互,根据学生的以往经验和认知发展过程促进语言的有效输入与输出,切实培养学生的语言能力。3)坚持学习程序中语音、词汇语法、语境与意义之间的体现关系,有效开展语篇语境化教学[4]。
云计算是未来的发展方向,云录音依托于此诞生,使录音文件在存储和传输方面更加安全、便捷。对于声纹检验技术的发展来说,云录音的存在无疑有利于推动基于云计算的远程网络声纹检验协作平台的诞生和发展。
参考文献:
[1]王英利.声纹鉴定技术[M].北京:群众出版社,2013:1-6.
[2]刘贝,汤斌.云存储原理及发展趋势[J].科技信息,2011(05):470-471.
[3]王虹.基层公安机关声纹鉴定语音检材和样本提取技术[J].警察技术,2012(04):57-60.
[4]王虹,许炜炜,金阳天,等.戴口罩语声声纹鉴定的实验研究[J].中国刑警学院学报,2008(04):49-51.
[5]林焘,王理嘉.语音学教程[M].北京:北京大学出版社,2015:16.
[6]岳俊发,王英利.声纹鉴定[M].北京:警官教育出版社,1996:146.
[7]陈维娜,李同,张肖肖.长时平均功率谱在声纹鉴定中的应用研究[J].中国人民公安大学学报(自然科学版),2017,23(02):25-30.
[8]陈维娜.语音同一性鉴定意见阐析[J].中国司法鉴定,2015(05):111-115.
[9]曾锦华,施少培,杨旭,等.数字录音真实性司法鉴定研究现状[J].中国司法鉴定,2014(04):57-61.
标签:云录音论文; 声纹论文; 声纹检验论文; 语音同一认定论文; 中国刑事警察学院论文;