普通话两字组的音量比分析,本文主要内容关键词为:音量论文,两字论文,普通话论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一 引言
汉语这种典型的声调语言,关于其词重音各个方面的讨论已经有很多了。有的学者认为汉语没有词重音,而近些年来越来越多的学者认为汉语有词重音。在对汉语普通话重音的语音学研究中,林茂灿等(1984)对带正常重音的两字组的声学分析表明,普通话两字组的正常重音在声学上的表现是具有较长的时长和较完整的音高模式。陈肖霞(2002)发现,重读音节常常伴随着频谱高频部分的音强增加,即所谓的频谱倾斜,而在低频部分,音强的作用是可以忽略不计的。仲晓波等(2002)的研究显示,普通话词重音的声学相关物至少包括时长、音高、频谱倾斜和音强这四个参数。汉语轻声语音性质的研究与此情况相似,对于各个声学参量的相互关系以及它们作用力的大小,学者们进行了很多探讨,但尚未达成共识。
从语音学的角度说,重音节与非重音节在许多方面表现不同,如更大、更长的发音动作,不易协同发音,更长的时长,更大的强度和响度,元音空间的扩展以及音高变化的出现。(Van Heuven & Sluijter,1996)下文我们从新的角度,运用新的方法对普通话后字为轻声和非轻声两字组的语音表现重新进行了探讨,提出了幅度积和音量比的概念,以期对汉语轻重音声学性质的讨论提供新的思路。
二 幅度积与音量比
(一)语音信号数字化
语音是典型的模拟、连续信号,计算机要对它进行处理,必须将它转换成为数字声音信号,即用二进制数字的编码形式来表示我们听到的声音。最基本的声音信号数字化方法是采样一量化法。采样(sampling),即在特定的时间段内对连续变化的模拟信号进行不断地测量。采样得到的信号实质上就是连续变化的幅度值中的一个值,再用数字表示这个幅度值,那么所得到的信号就是数字信号。这里还需要解释一个相关概念,即采样频率(Sampling Frequency),是指在1秒钟内对声音信号的采样次数。比如我们语音研究中常用的11025Hz采样率的声音就是要用11025个数据(采样点)来描述1秒钟的声音波形。采样频率越高,声音的还原就越真实、越自然。
(二)幅度积和音量比
我们看到的语音软件中的波形图就是由各个采样点相连得到的。各采样点的绝对值对应于波形图的振幅。每个声音样本若用目前语音学研究中最常用的16位(16bit)表示,则其取值范围是0~65536,请见图1。
图1 语音数字化波形示意图
那么,某段语音的平均振幅可以由下面的计算得到:
某段语音的平均振幅=各采样点绝对值之和/(采样率×时长)
(注:时长为所选段的语音时长,单位为“秒”)
公式中的“采样率×时长”表示的就是所选语音段内采样点的个数。我们这里引入一个新的语音参数——幅度积。所谓幅度积,即所选音段内各采样点幅度的总和,综合考虑了幅度和音长两个语音参数。计算公式表示为:
某段语音的幅度积=平均振幅×时长
(注:时长为所选段的语音时长,单位为“秒”)
综合以上两个公式,也可以说一段语音的幅度积是由所选语音段每个采样点的绝对值之和除以采样率得到的,这样,幅度积就把采样率的因素排除了。但是,每个采样点的绝对值之和这一项本身是隐含时长因素的,因为采样点越多,则表明时长越长。而波形的幅度,决定了语音的音强。因此我们可以说,幅度积只和所选语音段的强度和时长成正比。
但是,采样点的值是由很多因素决定的,如发音人声音本身的强弱、发音人离麦克风的远近、录音设备的增益等设置情况。进而,我们提出音量比的概念,即:一个两字组的两个音节之间幅度积的比值,我们称其为E值。具体算法为:
音量比(E值)=后字幅度积/前字幅度积
这样,我们就把受多因素影响的幅度积转化为具有可比性、相对化的音量比。下面报告我们对普通话两字组进行的音量比分析。
三 实验过程
(一)发音人
实验所分析语料来自四位发音人。两位为天津电视台的播音员,两位是南开大学中文系的学生。这四人都能说标准的普通话。下文分别用M1(男播音员)、F1(女播音员)、M2(男学生)、F2(女学生)依次代表以上四位发音人。
(二)实验材料
普通话所有可能的声调组合形成的两字组对子,即其中一个两字组包含轻声,另一个为两个正常音节。两个两字组除了唯一的轻声/非轻声音节区别外,其他特征全部相同,比如说普通话中的“包含/包涵”这样的组合。
(三)录音和分析软件
录音是在南开大学中文系语音实验室中,将发音人所发的实验语料通过麦克风直接录入电脑,保存为分析软件中wav格式的数字声音文件,采样频率12800Hz。每位发音人的三遍发音被录音并用于分析和数据统计。
我们的实验分析采用南开大学中文系与计算机系的专家合作开发的语音分析软件“桌上语音工作室专业版”(Mini Speech Lab)。
(四)实验项目
对两字组中的轻声音节及其前字进行测量和统计。重点在于分析轻声音节和非轻声音节的幅度积。幅度积与音长的数据从软件波形图窗口可同时测量得到,图示如下:
图2 幅度积和音长测量示意图
四 实验结果分析
(一)普通话两字组音量比
下面为我们的实验数据以及分析结果。
表1 普通话两字组音量比统计表
两字组后字为非轻声的音量比平均值为1.05,表明其前后字的幅度积基本相等,后字稍大,可以认为等重。① 许多研究已经表明,跟其他声调相比,轻声音节的音强不一定弱,音长有时也不短,但我们的研究表明:其发音的幅度积相比要小得多,两字组后字为轻声的音量比平均值为0.49,无疑为前重。经T检验,后字非轻声与后字轻声音量比具有显著性差异(p=0.00)。这就有效地区分了轻声字与非轻声字。
下面表2~5分别为四位发音人不同声调前字加不同原调轻声后字的两字组音量比统计表。
从以上统计结果,我们可以看到:在轻声两字组中,前字为阴平、阳平和去声的音量比差异较小,四位发音人的平均值在0.49~0.13(表中用灰色底纹标示)之间,表明后字轻声的幅度积远小于前字;而前字上声的音量比则明显表现不同,四位发音人的平均值在0.99~1.40(表中用下划线标示)之间,表明前后字的幅度积基本相等,后字稍重。
为了更加清楚、全面地分析,我们又进一步把四位发音人后字轻声两字组的音量比数据平均值汇总在表6中。
表6 四位发音人后字轻声两字组音量比汇总统计表
经过T检验,四位发音人的1+0,2+0,4+0与3+0之间均存在显著性差异。(*表示在0.05水平上差异显著,p<0.05;**表示在0.01水平上差异显著,p<0.01。下同)曹剑芬(1986)的研究也曾发现,前字音节为上声时,轻声音节的音强几乎都大于前字。这个现象该如何解释呢?
首先,我们来看后字为轻声时,不同声调前字的幅度积情况。
表7 后字为轻声的前字幅度积统计表
经过T检验,四位发音人的阴平、阳平、去声与上声之间均存在显著性差异,可以看出,前字上声的幅度积本身是四个声调里最小的。
其次,关于普通话轻声的音高表现已经有很多学者进行过探讨,比如赵元任(1968)提出轻声在阴平、阳平、上声和去声后的调值分别为半低、中、半高和低。我们基本可以概括为轻声在阴平、阳平、去声后的音高为低降调,在上声后为中升调,而其终点音高明显表现为上声后轻声最高,请参看图3。
图3 普通话轻声在四声后的音高表现(引自梁磊,2002)
我们认为,上述现象表明音高和音强/音量有高相关度:音高较高,则音量也较高。因此上声这个接近发音人调域底线的低调与其后音高表现为中平调的轻声之间的轻重关系不能仅看音量比。②
(二)与以前研究的比较
林茂灿等(1980、1984)分别讨论了北京话轻声和正常重音两字组的声学性质,他们的研究也考察了前后字的能量,认为:字音振幅与时间轴所包围的面积S,跟产生这个字音所消耗的能量成正比。具体来说,就是用面积S(单位为平方毫米)来代表能量。其结果表明,两字组正常重音中多数前字能量大于后字。他们的研究还对同一字音在重读和轻读时的强度和能量作了相对的比较,轻读字音除以重读,把重读字音的音强和能量记作1。结果表明,同一字音的能量轻读时毫无例外地比重读时减弱了。这里的能量与我们提出的幅度积可以认为有一致性,而相对化的方法不同,结果也有所不同。其研究也是具有重要意义的。
五 结论
我们认为,语音的轻重是个由复杂因素决定的特征,同语音的四个要素都有关系,应当是各个参量综合作用的结果,而不是仅同某一个声学参量相对应。进一步说,轻重音节之间的关系就表现为相对凸显性,在语音上的对应值可以用音量比表示。音量比是研究重音问题的有效参数,特别是对于非低调的音节组合轻重对比有很好的区分作用,而对于研究语调等韵律问题也有重要的参考价值。
当然,以上所得结论是基于单独朗读两字组的实验语料,尚需考察语流中的两字组以进一步验证、完善我们的发现。
注释:
① 这里需要说明,关于汉语词重音是左重还是右重已经有许多学者从诸多方面进行了讨论,尚未达成共识。我们的这个研究结果只是表明单独发音的两字组的情况。左重、右重问题,我们另外撰文讨论。
② 虽然上声的幅度积小于其后的轻声,但是这并没有让我们感觉轻声比上声更重。关于重音与轻声的知觉特征及其与声学特征之间的关系问题也很复杂,需要进一步深入研究。相关的讨论,可参看王韫佳(2004)。