从声谱分析角度看现代汉语普通话的平仄区分论文

从声谱分析角度看现代汉语普通话的平仄区分

郭二辉¹，许倩倩²

（1.中国电子科技集团公司第三十八研究所，安徽合肥230088；2.合肥市葛大店小学，安徽合肥230000）

［摘要］选取现代汉语普通话拼音教学中的12 个韵母，每个韵母包含阴平、阳平、上声、去声四种发音，用Matlab 作出这12 个韵母的声谱矩阵，并求同一韵母四种声调发音的声谱矩阵之间的相关系数，发现阴平、阳平两种声调的声谱矩阵相关系数明显大于其他声调之间的相关系数，可作为判别四声平仄区分的依据以及现代汉语普通话的古典样式诗词赏析或楹联创作。

［关键词］现代汉语；普通话教学；平仄；声谱矩阵；矩阵相关系数

一、引言

所谓平仄指的是将汉语的声调分为两类，“平”的意思是平直、“仄”的意思是不平。经过历代学者研究，一般认为平仄是声音音调的高低和音量强弱的综合形成效果，平声韵的发音音调和音量都基本保持不变，仄声韵的发音则要么上升、要么下降、要么先降后升。将音调分为平仄的原因可从发声和聆听两方面分析。对听者来说，语音中或交错或对称的规律能够造成错落的听觉美感，就像乐曲，要由不同音调、不同强弱的音符组成，如果一个音符直到一曲终了，就不称其为曲子了；从发音特点看，人类的声带不同的紧张程度造成了不同的声调，平仄交错地发生，也能使声带在不同的紧张程度之间切换，从而让发声者觉得舒适，而不至于声带一直紧张或松弛。古代汉语分平声、上声、去声、入声四种声调，古代汉语中的“平声”归类为“平”，其他三种声调归类为“仄”。在现代汉语普通话的拼音中，声调分为阴平（一声）、阳平（二声）、上声（三声）、去声（四声）4 种声调。现代汉语中的平仄归类争议则较多，有人认为“阴平”和“阳平”归类为平声，“上声”和“去声”归类为仄声；也有人认为阴平归为平声，其他三个声调归为仄声；还有人认为阴平、阳平、上声归为一类，去声单独归为一类，等等。柯继红^[1]综合前人研究后认为：从语言规律看，声调的本质是“音高走向”或曰“调形”，即声调的特点体现在发声频率的高低变化趋势，而不是发声频率本身。周晓琴^[2]研究了汉语普通话单音节词的四声规律，选取女播音员普通话发声的10 个音节，每个音节四种声调进行了量化分析，其结论支持文献^[1]的观点。朱光潜^[3]通过研究各地方言，提出声调应综合考虑发音时间长短、音量强弱、音调高低变化趋势三种因素。但关于现代汉语普通话的平仄区分，仍缺乏能够取得普遍共识的分类依据。

力争水利管理改革实现新突破。进一步完善水利规划体系、法治体系和科技支撑体系，全面推进依法治水和科技兴水；加快水资源管理体制、水利建设与运行管理体制、水利投融资机制、水价形成机制、基层水利服务体系等重点领域和关键环节改革攻坚，建立水资源有偿使用制度和水生态补偿制度；继续推进首批30个节水型社会建设重点县建设；全面推进农业水价综合改革等工作。

二、平仄的物理基础

既然平仄是将四种声调归为两类，而声调的特点又与发音时间长短、音量强弱、音调高低趋势等因素相关，则可以考虑一种囊括上述三个因素的统一表示方法，利用这种统一表示方法，求出不同声调之间的相似程度或相异程度，选取相似程度最大的两种或三种声调归为一类，或选取与其他声调相异程度最大的一种声调归为一类，其他声调归为一类，即可作为平仄分类的依据。

本次研究的病死猪无害化处理系统主要采用BS结构开发，开发环境基于SqlServer 2005数据库、微软Visual Studio 2008、AJAX技术、Silvrelight技术、Css+Div控制技术、PS设计[2]。整个系统采用可视化操作平台和多种应用相互兼容，能实现二次开发，整个结构体系体现了模块化功能，容易推广应用，拓展性更强。

声谱是一种将声音在时间和频率上二维展开的表示方法，这种表示方法在二维平面上用x 、y 轴分别代表时间和频率、用点（x ，y ）处数值的大小代表声音音量的高低，恰好符合平仄分类所需。当用离散化的方法表示时间有限的声谱时，声谱就是一个矩阵，行、列分别代表时间和频率，矩阵元素的数值大小代表音量高低。

三、声谱矩阵

既然数字声谱是展开在时间和频率维度上的矩阵，那么就可以用矩阵的相关系数来衡量同一韵母的不同音调声谱之间的相似程度，如果能发现显著的相似性规律，就可以作为判别平仄的依据。相关系数是衡量矩阵之间元素变化规律相似性的特征值，设有大小为m *n 的矩阵A 、B ，A 、B 的均值分别为A ^¯、B ^¯，相关系数r 为：

经窗口傅立叶变换，让频率的变化和声音强度的变化均能够在时间维度得以量化表示，即得到声谱矩阵，如下图所示。下图是韵母ɑi 从一声到四声的四种声调声谱矩阵的图形化表示，在时间、频率二维平面上，红颜色越深，代表该处声音的强度越大；反之，绿颜色越深，代表该处声音的强度越小。由图可见，一声情况下，语音的各频率分量幅度在发音时段内基本保持不变；二声情况下，在发音时段的后半部，有明显高于前半部的高频分量出现，说明二声情况下声调升高；三声情况下，发音时段的中间位置高频分量强度偏低，说明声调中的高音成分在发音时段中部存在减弱现象；四声情况下，则各个频率分量从峰值直接衰减，越靠近高频段，衰减越快。韵母ɑi 的四声声谱特点与惯常歌诀“一声平、二声扬、三声拐弯、四声降”相符，正确反映了四声音调的特点。

韵母ɑi 的四种声调声谱图

四、声谱矩阵的相关系数

选取mp3 格式、小学拼音教学的ɑ、o、e、i、u、ü、ao、ou、iu、ai、ei、ui 共12 个韵母发音，进行窗口傅立叶变换。

对于实矩阵，相关系数越接近于1，说明两个矩阵的相似程度越大，一个实矩阵和它自身的相关系数等于最大值1。相关系数主要反映两个矩阵各个元素之间的变化趋势，而与元素数值本身的大小关系极弱，恰好符合上文所要求的声调“音高走向”或“调形”的特征。以下列出ɑ、o、e、i、u、ü、ɑo、ou、iu、ɑi、ei、ui 这12 个韵母、每个韵母四个声调声谱矩阵之间的相关系数，表中纵向表示12 个韵母，横向的“x 声y 声”表示该韵母的第x 声声谱矩阵与第y 声声谱矩阵的相关系数，如韵母“ɑ”那一行，“1 声2 声”那一列即对应韵母ɑ 的第一声声谱矩阵与第二声声谱矩阵的相关系数，其数值为0.89。

十二个韵母的声谱矩阵之间的相关系数

由上表可见，不考虑同一韵母、同一声调的情况，12 个韵母的一声（阴平）和二声（阳平）之间的相关系数全部大于等于0.85；而其他声调之间的相关关系则较弱，除ɑ 的第一声和第三声之间、o 的第一声和第三声之间、o 的第二声和第三声之间，其他声调之间的相关系数全部低于0.85。

目前，国内区块链技术场景应用尚未成为主流，主要集中在金融领域、智能合约、智慧交通、供应链物流、网络安全等方面，在阅读应用领域基本是空白。基于区块链技术打造安全开放共享的高校联盟在线阅读互动平台，从具体应用出发，通过信息技术解决创新应用和社会实际问题也同样需要一段探索过程。

五、小结

由四声音调声谱矩阵相关系数分析结果可知，一声（阴平）和二声（阳平）之间的相关关系最为显著，因此在现代汉语普通话平仄区分问题上，应将一声和二声归为一类、将三声和四声归为一类。

参考文献：

［1］柯继红.中国诗歌形式研究［D］.北京：北京师范大学，2011.

［2］周晓琴.汉语普通话单音节词声调识别分析［D］.广州：南方医科大学，2009.

［3］朱光潜.诗论［M］.桂林：漓江出版社，2011.

［中图分类号］ H102

［文献标志码］ A

［文章编号］ 2096-0603（2019）25-0282-03

◎编辑赵瑞峰

标签：现代汉语论文; 普通话教学论文; 平仄论文; 声谱矩阵论文; 矩阵相关系数论文; 中国电子科技集团公司第三十八研究所论文; 合肥市葛大店小学论文;