关键词:声纹鉴定 声纹特征 潮汕地区 方言发音
1 前言
声纹鉴定设计生理学、物理学、语音学、计算机学等学科,是一项综合性很强的技术鉴定工作。它是随着刑事侦破,司法审判而发展起来的,在我国司断案具有十分深远的影响。由于声纹是根据人类的声波进行判断的物理量,所以具有客观性与科学性。声纹鉴定是将人类的声波绘制成声纹图谱,检验时只需将可以的声纹图谱与嫌疑人的进行对比就可判断此人是否是嫌疑人。
当前一些诈骗、恐吓、勒索等犯罪活动都会进行言语的沟通,这就会留下犯罪分子的视听数据。这些录音可以通过声谱仪等工具将其量化,制作出声音变化的图像,即声纹图谱。潮汕地区具有自身的方言,随着文化的融合和反哺,潮汕地区人们的普通话多多少少也存在一些方言母语的发音特点。探讨和研究潮汕地区普通话发音的特点能够进一步为警察提供犯罪嫌疑人的家乡信息,进一步明确案件侦查方向,缩小排查范围,节约侦查时间。
2 实验
本文通过采集大量的潮汕地区人们的普通话音频以及持有二甲以上普通话证书的相同文本的音频。通过分析其声音图谱的共振峰,从而发现其中的本质性差异点。
本实验共对比观察了三组词语的声纹图谱,每组词语均在一整句话的中间,再通过音频软件截取出该词语对应时段的音频,将音频制作成声纹共振峰的图谱进行必对。最后对所有的实验结果进行整理个分析,研判出其声纹的本质性差异点。
2.1实验步骤
在安静的环境下,为了使每一个字的共振峰数据客观,要求发音人每个词读3 遍。使用ASUS FX80G笔记本电脑,声卡为Realtek High Definition Audio,麦克风为Audio Technica XM5S;使用Adobe Audition CC 2018录音软件进行录音,采样率是22 050Hz,采样精度是16 bit,单声道,并用Praat 软件进行分析。
选取录音效果较好的6个声源作为采集数据的样本,对每个样本的元音逐一进行标注,并用Praat 软件逐一提取第一共振峰(F1)、第二共振峰(F2)、第三共振峰(F3)的数据。
2.2实验结果
通过大量的实验,在剔除了特殊样本等不合格样本后,选取了“拿来”一词发音的共振峰图谱,大部分的共振峰图谱如图1所示。其中,“拿”字的K1、K2线波动尤为明显,“来”字的K1线呈轻微起伏状。
图1
而“拿来”一次标准发音的共振峰图谱如图2所示,除“拿”字发音K2线中间有个小峰外,其余的均较为平整。
图2
2.3实验分析
通过图1图2的共振峰谱图,我们可以得知,潮汕本地人关于“拿来”一词的发音较标准发音之间的差别主要存在于K1及K2线上,对于该词K1共振峰波动较大的可初步认定为非标准普通话发音。
3 总结
通过本实验基本可以分辨出潮汕地区普通话重点词语的发音与标准普通话发音之间存在的本质性差异,为公安工作中的信息研判等工作提供强有力的技术支持。但受经费、实验样本等现实条件的限制,本实验无法通过庞大的数据支持来针对常用的词汇及语句进行细致的研究。
参考文献:
[1]熊洁.声纹鉴定理论与实验[J].电声技术,2018,42(04):73-75.
[2]杨璐铭,蓝常山,张学海.声纹鉴定中语音样本采集的问题分析[J].广东公安科技,2018,26(01):49-50.
[3]贾丽文.音量增大时语音的长时共振峰分布特征变化及其对声纹鉴定的影响[J].山西大同大学学报(自然科学版),2017,33(01):24-28+46.
[4]李高翔.数字声纹识别技术在刑侦工作中的实践运用探讨[J].科技展望,2016,26(36):133.
[5]李红普.言语识别中声纹鉴定的进展与反思[J].科技展望,2016,26(21):280.
[6]夏碧婷,邱添.声纹鉴定及其在诉讼中的运用[J].法制与社会,2014(34):127-128+130.
[7]曹洪林,孔江平.长时共振峰分布特征在声纹鉴定中的应用[J].中国司法鉴定,2013(01):62-67.
论文作者:庄丹杰, 陈昱文, 蔡耀东,,余立鑫, 林哲涵,
论文发表刊物:《工程管理前沿》2020年1期
论文发表时间:2020/3/25
标签:潮汕论文; 发音论文; 鉴定论文; 图谱论文; 普通话论文; 地区论文; 样本论文; 《工程管理前沿》2020年1期论文;