年龄增长与语音特征变化初探论文

年龄增长与语音特征变化初探

杨璐铭 蓝常山 张学海

(广东省公安厅刑事技术中心,广东 广州510050)

摘 要 采集4名成年人前后两次间隔19~26年的语音样本,输入语音工作站,分别对每个人前后时间段所发的相同音节的宽带声纹图谱进行分析比对。结果显示,同一人在所处不同年龄阶段所发生的相同音节能量分布状态表现前后一致,符合点的数量占绝对优势,均反映了同一人发生这些音节时的发音器官特点和发音习惯特点不变的稳定性。因此得出,一个人从壮年期至中年期发音习惯、语音本质特征不存在显著变化。

关键词 声纹 特征 共振峰 时间 变化

语音可以进行同一认定的客观依据在于客体的稳定性和反映性。语音的反映性是指语音反映讲话活动,暴露发音器官和发音习惯特点的必然性。语音的个体稳定性是指一个人的言语习惯形成以后,语音在一个较长的时间内本质特征的不变性。一般认为,一个人青年期和壮年期的不同时间说同样话的语音是稳定的,具有可比性。[1]本实验的目的主要是为了研究一个人从壮年期(25~44岁)到中年期(45~59岁)的语音特征是否存在显著的变化,为语音同一认定提供更客观的判断依据。

1 实验设备及采样

1.1 设备

VS-99语音工作站及讯飞智能声纹鉴定工作站V4.0。

1.2 取样

选择4名成年人,提取他们以正常用粤语交谈方式录制的语音样本,每个人采样前后时间间隔19~26年不等。

采样的成年人具体情况如表1所示:

表1 采样的成年人具体情况

1.3 方法

将上述样本输入VS-99语音工作站及讯飞智能声纹鉴定工作站V4.0。采用IFSC-11-01-01-2015的方法,将每个人前后时间段所发的相同音节的宽带声纹图谱进行分析比对。采样率为8000Hz、带宽300Hz。

实验中发现同一人在所处不同年龄阶段所发出的相同音节能量分布状态表现前后一致,符合点的数量占绝对优势,均反映了同一人发出这些音节时的发音器官特点和发音习惯特点不变的稳定性。具体表现在以下几个方面:

2 结果

当前,我国北京、广东、河北等省市已经建立或正在筹划针对个人消费端的、政府牵头的碳普惠机制。结合各地特点,它们涵盖的低碳行为方式、采用的核算方法、激励机制及商业模式也各有不同,见表1。在民间层面,以支付宝旗下的“蚂蚁森林”为代表的各类碳普惠产品也受到公众关注。

图2 中,周某A前后2次发音节men时,F1、F2、F3、F4共振峰的走向特征基本一致,发鼻音m时,能量强弱聚散在图谱上的分布大致相同;发biao音时,F1基本呈单调上升,F2、F3、F4呈单调下降。

2.1 形态特征稳定

通过同一人前后19~26年所发相同音节的宽带语谱图可以看出频谱特征具有很强的稳定性。

图1中,刘某前后2次发音节dai时,F1、F2、F3共振峰的走向特征基本一致,F4因为一些客观因素造成了微小的差别,其中的音节内辅音-元音过渡段共振峰端点频率特征一致,不存在显著差异;发元音jiu时,F1呈先上升后平直,F2单调下降,F3呈上升,第二次发音中的F4由于客观原因没有呈现出明显的趋势。

图1 刘某相隔26年语音图谱

第三章,党建博览。写作的手法是探索的形式。从面上看,全省的老干部基层党组织建设现场会开在了忻州,市县两级组建老干部党工委的探索,跑在了全省的前面。从点上看,持续不断地开展“老干部特色党支部”创建活动,各县(市、区)家家都有选树和培育的示范点。所有这些实践,为我们全面铺开“点上突破、线上拉动、面上覆盖、质上提高”的党建“立体推进”战略提供了充分准备。

图2 周某相隔19年语音图谱

从图6可以看出,周某A发音节men时,2次发音中的F1相差约40Hz,F2相差约90Hz,F4相差约30Hz;发音节biao时,2次发音中的F1相差约40Hz,F2、F3相差约60Hz,F4相差约50Hz;发音节yiu时,2次发音中的F1相差约20Hz,F2相差约60Hz,F3相差约50Hz,F4相差约70Hz。

图3 成某相隔26年语音图谱

图4 中,周某B前后2次发音节a时,F1、F2、F3、F4共振峰的走向特征基本一致;发ma音时,F1、F2基本呈平直,F3先上升后平直。

盒马鲜生方面没有公布相关的量化数据,但作为一家零售企业,盒马鲜生卖的货和其他超市有很大区别,绝大多数是海鲜和高档食品,包括帝王蟹、波士顿龙虾、进口零食饮料等。

图4 周某B相隔25年语音图谱

通过上述4人的宽带频谱图可以看出,前后2次采样所发的相同音节对应的共振峰斜度、弯曲方向、弯直变化情况、能量分布等均保持一致,共振峰的形态、能量按时间的分布状态、音素间的过渡形态等特征均相同,频谱特征具有很强的稳定性。

2.2 数值特征稳定

美国的语音鉴定标准中认为成年人个体语音在6年内可以看作相对稳定的。本实验的结果显示,4组间隔19~26年不等的录音,每组语音中3对相同音节的共振峰频率均呈现相对稳定一致的特点。

图5 刘某发dai、jiu、qi音共振峰频率关系图(相隔26年)

从图5可以看出,刘某发音节dai时,2次发音中的F1两者相差约70Hz,F2相差约40Hz,F4相差约60Hz;发音节jiu时,2次发音中的F1、F2两者数值基本一致,F3、F4均相差约40Hz;发音节qi时,2次发音中的F1、F4数值基本一致,F2、F3分别约相差40Hz和50Hz。

图3 中,成某前后2次发音节gi时,F1、F2、F3、F4共振峰的走向特征基本一致;发zhou音时,F1呈先小斜率单调上升后平直,F2呈单调下降,F3呈先降后升,第二次发音中的F4形态不清。

由于人的行为包括言语是神经系统控制的结果,不具备精确的可重复性。因此,同一人不同时间发出相同音的声纹在宏观特征反映一致的前提下,必然会表现出微观差异。本实验也有同样发现,周某A发音节men中的F3、成某发音节zhou中的F4、周某B发音节ma中的F4等均存在部分差异,经反复研究认为产生细微差异的主要原因在于:

1.2.1 标本采集 该孕妇接受检测前的遗传咨询并签署同意书,根据孕周行羊膜腔穿刺,在B 超探头引导下行羊膜腔穿刺术抽取羊水30ml进行培养以及染色体微阵列分析(chromosomal microarray analysis, CMA)。

通过图5至图8可以看出,前后2次采样所发的相同音节共振峰频率总体差异程度未超过同一人发相同音该项特征正常差异或测量误差的阈限。

从图8可以看出,周某B发音节a时,2次发音中的F1、F2相差约50Hz,F3、F4相差约20Hz;发音节ma时,2次发音中的F1数值基本一致,F2相差约40Hz,F3相差约50Hz;发音节nei时,2次发音中的F1相差约50Hz,F2、F3数值基本一致,F4相差约50Hz。

从图7可以看出,成某发音节gi时,2次发音中的F1、F2、F3数值基本一致,F4相差约30Hz;发音节zhou时,2次发音中的F1相差约30Hz,F2数值基本一致,F3相差约100Hz;发音节wui时,2次发音中的F1相差约30Hz,F2相差约30Hz,F3相差约70Hz,F4相差约20Hz。

目前学界对动态逻辑的研究比较多,但从人工智能视角研究动态逻辑则相对较弱。人工智能的动态逻辑研究拓展了经典逻辑的研究范围,人工智能的应用验证了非经典逻辑的合理性和发展的必然性。因此,从人工智能角度研究自然语言的动态逻辑具有重要意义。

图6 周某A发men、biao、yiu音共振峰频率关系图(相隔19年)

图7 成某发gi、zhou、wui音共振峰频率关系图(相隔26年)

图8 周某B发a、ma、nei音共振峰频率关系图(相隔25年)

2.3 听觉特征稳定

随机抽取5名成年人作为被试对象,分别给他们播放上述4组录音,让5名被试对象从听觉上分辨每组录音中的两段声音是否是同一人的语音。经听辨,5名被试都认为每组录音中2段声音听觉上差异不大,音质、纯度、音高、音域等方面的特征均稳定一致。

3 分析与讨论

“精神富有”是一个理论问题,更是一个实践问题。省十三次党代会将现代化浙江定位为“物质富裕、精神富有”之后,绍兴也迅速做出呼应,并赋予“精神富有”以绍兴内涵加以传播和实践。正是在这样的背景下,本文试从实践的层面,将精神形态特征明显的文艺创新置于“精神富有”的视域之中,开展若干问题的调查与思考。

3.1 不同的录音器材

每种录音器材的性能、频响特性、失真率、动态范围等方面均有差异,前后两次采集语音样本相隔年份久远,录音设备不同,导致有些特征比如总体强度按频率的分布状态会受到影响。如图2中men的图谱在2500Hz~3500Hz之间的频段、图3中zhou的图谱在3000Hz以上的频段能量强度存在差异,但共振峰的走势却基本相当,说明两者差异是由于不同录音器材该频段频响不同等原因造成的。

3.2 不同的环境

由于采集样本中的录音环境均为日常生活场景,存在环境噪音、背景音乐的影响,引起共振峰强度产生变化,如图4中ma的图谱在约2000Hz的区域存在部分差异。

(4)地质灾害是自然与人为因素共同作用下引发的,包括地质背景、自然地理条件、水系等,而本文中只考虑到了害点密度、坡度、坡高、坡型、岩土类型、冻土、植被、降雨、断层和人类工程活动10项因素。在今后的其他地区评价工作中可选取更多与地质灾害发育相关的因素作为分析指标,在此基础上再做易发性分区和危险性评价,其结果会更准确和全面。

3.3 交谈对象的不同

语言主要用于交流,同时伴随着心理的变化,与不同对象交流产生的情绪不同、语境不同,不可避免地产生细微的语音差异。情绪激动时,音量较大,语速较快;情绪舒缓时,语速音量正常,在图谱上会产生不同程度的细微差异,如图4中nei的图谱。

上述对应的共振峰存在一定程度的微观差异,是该人在不同环境、不同录音器材与不同对象讲话等原因造成的,是语音动态性的表现。

4 结论

上述实验结果可以初步证实一个人从壮年期到中年期发音习惯、语音本质特征不存在显著变化。成年以后,在相当长的时间内,个体言语习惯、发音方式等生理、心理机制已经定型为一个相对稳定的模式,这是语音同一认定稳定性的重要因素。

由于时间跨度大的样本采集存在困难,因此采样人数较少,如果加大样本量,应该可以得到更客观全面的结论。

参考文献:

[1]王英利.声纹鉴定技术[M].北京:群众出版社,2013:165-168.

标签:;  ;  ;  ;  ;  ;  

年龄增长与语音特征变化初探论文
下载Doc文档

猜你喜欢