基于计算语音方法的朝蒙单元音对比研究
王桂荣, 金小峰
(延边大学 工学院, 吉林 延吉 133002)
摘要 : 为了从计算语音学角度比对朝鲜语与蒙古语单元音的相似性, 提出了基于共振峰参数的对比分析方法。首先在提取朝鲜语与蒙古语的单元音前两个共振峰频率F 1和F 2的基础上, 分别计算其均值、 标准差和离散度; 其次分析了两种语音单元音共振峰频率分布的差异情况; 最后采用t -检验方法对两种语言单元音共振峰参数进行了相似性比对。对比分析结果表明, 采用F 1和F 2参数可以明显区分不同单元音之间声学特征的差异; 另外通过对比发现朝鲜语与蒙古语中有5对单元音存在声学特征的相似性, 该结果与这5对单元音发音过程中舌位和圆唇度分析是一致的。该朝鲜语与蒙古语单元音声学特征相似性对比分析方法, 可以为进一步采用计算语音学方法研究朝鲜语与蒙古语的语音相似性提供依据。
关键词 : 语言信息处理; 声学特征分析; 元音; 共振峰频率
0 引 言
随着国家对少数民族语言研究的重视, 近年来对少数民族语言的语音信息处理研究越来越引起研究者的广泛关注, 并取得了一定的成果[1-6], 但少数民族语音信息的基础性研究成果薄弱的现状仍然是制约少数民族语言信息处理进一步深入发展的瓶颈之一。内蒙古大学的研究者们从实验语音学的角度分别研究了蒙古语标准音、 方言和土语, 进一步扩展了蒙古语的语音实验研究领域[7]。与国内其他少数民族语言研究进展情况相比, 目前国内对朝鲜语的语音信息分析和处理技术的研究仍处于起步阶段[8]。
笔者从语音声学特征着手, 采用共振峰的F 1和F 2参数对比研究了朝鲜语与蒙古语单元音的相似性。研究结果可以为进一步研究朝鲜语与蒙古语的语音相似性提供基础依据, 同时对开展少数民族语音信息处理研究具有一定的学术价值。
1 朝鲜语与蒙古语的单元音发音特点
所有的元音都是肺部呼出气流,使声带发生颤动而形成的, 按照舌位位置和唇形圆展程度分类。按照舌位前后可以分为前元音、 央元音和后元音, 按舌位的高低可以分为高元音、 次高元音、 半高元音、 中元音、 半低元音、 次低元音和低元音, 按唇形圆展可以分为圆唇元音和不圆唇元音。
朝鲜语是一种无声调但音韵多变的音节语言, 朝鲜语是表音文字, 元音辅音相结合构成音节。朝鲜文字以音节为单位拼写, 一字一音。根据音节结构划分为19个辅音(声母)、 21个元音(韵母)以及27个韵尾, 另外朝鲜语元音系统按嘴唇的形状和舌位是否改变分为11个双(复合)元音和10个单元音[9], 单元音分别是、
, 它们的发音及特点如表1所示。
式中: tr——发射信号与回波信号之间的时间差;k——回波的衰减系数;R——目标与雷达间的距离;c——电磁波传播速度。
表1 朝鲜语10个单元音发音及特点
Tab.1 Pronunciation and characteristics of 10 pure vowels in Korean
自秦汉以来,广州都是中国对外开放的重要窗口,是海上丝绸之路的发祥地和具有千年港市贸易传承的“商都”,因而广州人历来具有敢为人先的开放意识和行为勇气。正因为广州人具有这样的品格和勇气,所以才有在改革开放的伟大实践中勇于“吃螃蟹”的担当。然而,能把这样的精神品格转化为投身伟大实践的强大力量,又是与广州率先解放思想所形成的文化引领分不开的。换而言之,在改革开放过程中广州率先实施了以解放思想为主题和内容的文化建设工程,为改革开放的创新实践提供了精神动力、智力支持和文化引导。
表2 蒙古语7个单元音发音及特点
Tab.2 Pronunciation and characteristics of 7 pure vowels in Mongolian
(6)
自动化电网调度系统对于网络的要求较高,一旦网络安全出现问题后果不堪设想。当前仍然存在对网络安全重视不够的现象,有的仅凭借防火墙来维护网络安全,而没有采用硬件上的隔离,有的甚至于防火墙的安全等级都很低。对网络安全的认识不够和隔离措施的不到位,使得系统很容易被病毒侵袭和被黑客攻击,这种事情一旦发生,对于电网调度来说无疑将会是致命的打击。
表3 朝鲜语与蒙古语单元音发音舌位与圆唇度对应关系
Tab.3 Correspondence of tongue-position and lip-rounding of pure vowels in Korean and Mongolian
2 朝鲜语与蒙古语单元音声学特征对比分析
“李倩倩呢?”易非问,李倩倩是大弟弟的女朋友。易非把母亲接过来后,弟弟自然跟着过来了,然后弟弟的女朋友也跟着过来了。一般情况下,这个点儿,她应该跟妈一起窝在沙发上看电视的。
蒙古语是古老的民族语言之一, 它在形态学方面以词根或词干为基础, 后接附加成分派生新词和进行词形变化; 名词、 代词、 形容词、 数词、 副词、 后置词和形动词, 都有人称、 数或格的语法; 动词都有时、 体、 态和式等语法。蒙古语标准读音是以内蒙古方言的正蓝旗蒙古语为代表的察哈尔土语作为标准。蒙古语隶属于阿尔泰语系蒙古语族分支, 具有黏着语和严格的元音和谐律等特点, 共有7个单元音。同一个词中的元音必须是阳性或阴性, 包括各种语法后缀, 因此所有的后缀都有阴性和阳性两种形式。其中阳性元音(a//
)、 阴性元音(e/o/u)和中性元音(i)可以出现在任何阳性和阴性的词中[10], 分别是
, 它们的发音及特点如表2所示。
2.1 基于LPC的共振峰提取
通常来说,期刊的出版周期越短对重要科学发现和热点研究论文的吸引力越强。清华大学教授刘立就曾撰文指出,在向SSCI期刊投稿时,以获得研究的优先权(Priority of Discovery)为“天”,[3]高于影响因子,期刊的审稿及出版周期才是最为重要的。荷兰《合成》(Synthese)期刊,年发文量177篇,一年出版12期,是所有SSCI科史哲期刊中出版周期最短的刊物。论文出刊较多的刊物是美国ISIS期刊,年论文量高达3206篇,远远高于其他同类刊物。而出版周期最长的期刊如德国的刊物《质素》(Hyle),一年只出版一期。
LPC法首先借助模型对声道函数(声道传递函数)包络进行估算, 然后根据求根的方法对共振峰的频率和带宽进行估计。因为语音信号是时变的且极点和零点阶数事先无法确定, 因此求解模型参数是一个逼近过程[16]。不考虑鼻音和摩擦音时, 语音的声道模型就是一个全极点模型。在此模型中一个时变的声道传递函数
元音系统的对比是从元音共振峰频率、 松紧度以及和谐律等方面进行分析研究, 研究结果发现不同的语言的元音之间既有共性也存在差异[11]。其中共振峰是一个十分重要的特征参数, 它是准周期脉冲激励进入声道时产生的一组共振频率, 它反映了声道谐振特性也代表了发音信息的最直接来源, 而且人在语音感知中利用了共振峰信息, 因此共振峰是区别不同元音的重要参数[12]。现代声学分析表明, 元音的特性主要取决于其前两个共振峰频率F 1和F 2及其相互位置关系。F 3一般用于分析元音的儿化、 圆唇、 咽化等音色改变的情况[13]。文献[14] 对舌位和共振峰的关系研究结果表明, F 1与口腔开度相关,F 2与舌头整体的后缩前伸和圆唇度相关。即F 1频率值与开口度成正比;F 2频率越低舌位越后圆唇度高, 频率越高舌位越前圆唇度低。因此笔者只对朝鲜语与蒙古语单元音的前两个共振峰频率F 1和F 2进行分析对比。

(1)
其中p 为线性预测阶数, {a i }(i =1,2,…,p )为p 阶线性预测系数,C 是增益常数。求解预测系数{a i }和C 的过程称为语音信号的线性预测分析。由于语音信号的时变特性, 预测系数的估计值必须在语音的平稳短时窗内中进行, 即按帧进行处理。因此一帧语音信号x (m )转化为一个p 阶的线性预测模型时, 它的全极点模型线性预测系数的频谱为
目前的提取语音共振峰的方法比较多, 常用的方法有带通滤波器组法和倒谱法和线性预测编码(LPC: Linear Prediction Coefficient)法等, 但每种方法各有利弊。其中LPC是相对比较有效的语音分析技术之一, 它作为语音信号特征参数用于语音合成和识别等领域[15], 因此笔者采用LPC法提取共振峰参数。

(2)
其中A (ejω )表示预测误差滤波器, 可采用牛顿-拉夫逊(Newton-Raphson)算法求解。 H (ejω )给出了语音信号的频谱的包络谱, 反映了声道的共振峰的结构。利用离散傅里叶变换可对任意频率求得其功率谱幅值响应, 并从幅值响应中找到共振峰参数。另外, 包络谱中一些局部段落出现远离正常轨迹的偏离点, 这些偏离点称为野点, 所以在提取共振峰参数之前可采用中值滤波、 线性以及动态规划等平滑处理方法消除包络谱中的野点[17]。
2.2 单元音相似性对比
单元音共振峰参数提取后, 它们的相似性可以采用文献[18,19] 提出的双总体t -检验进行衡量。用t 检验法检验具有相同方差的两个正态总体均值差的假设。设x 1,x 2,…,x n1 是来自正态总体N (μ 1,σ 2)的样本,y 1,y 2,…,y n1 是来自正态总体N (μ 2,σ 2)的样本, 且设两样本独立。分别记它们的样本均值为记样本方差为s 1,s 2。设μ 1,μ 2,σ 2均未知, 并假设两总体的方差
则检验问题:H 0:μ 1=μ 2,H 1:μ 1≠μ 2的拒绝域, 取P 为显著性水平。两个正态总体均值差的t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。独立样本的双总体t -检验统计量定义为

(3)
为验证笔者所提算法的有效性, 在Intel(R) Corel(TM)i5-3470计算机上进行了测试, 编程工具采用Matlab R2014a。笔者实验采集的语料来源于20名朝鲜族测试者(男女各10名)和20名蒙古族测试者(男女各10名), 测试者年龄20~35岁, 无地域限制。每位测试者每个单元音常态语速标准音发音10遍, 共计3 400个语料样本。录音环境R SNR<45 dB, 采样率为16 kHz、 精度为16 bit, 采用wav文件格式存储。进行了两组实验, 分别单元音共振峰参数提取实验和两种语言单元音相似性对比实验。

(4)
/n (5)
在微信群里留言:“我先起个头,用自己名字入联,以抛砖引玉。稚拙不要紧,编得不像样也没关系,权当文字游戏。水平有限而不怕献丑,只是想邀孩子一起试着写对联。”
将表1和表2的单元音的舌位和圆唇度进一步整理和对比后发现, 两种语言的5对单元音具有相似性(见表3), 这5对单元音分别是: 。
该统计量t 在零假设H 0为真的条件下服从自由度为n -1的t 分布。当为真时, 拒绝域为

(7)
若t 的值不落在在拒绝域内, 则接受认为测量结果并无显著差异。其中t P (n 1+n 2-2)值查t 分布表获得。通常情况下, 实验结果达到0.05水平或0.01水平, 才可说数据之间具备了差异显著或是极显著。在作结论时, 应确实描述方向性(例如显著大于或显著小于)。通常用显著性水平P >0.05表示差异显著(不相似); 0.01<P <0.05表示差异不显著(相似, 近似); P <0.01表示无差异(相同)。
3 实验结果及分析
式(3)中i =1,…,n , 参数s w , 样本平均数样本s 1,s 2方差的计算公式如下
通过对智慧校园的内涵特征和架构分析可以看出,目前绝大部分高校信息化建设仍处于从数字校园向智慧校园过渡的阶段,而这个渐进的过程将很漫长并且逐步完善。作为普通高校,应根据学校实际和技术发展程度,制定智慧校园的建设蓝图。从实际来看,众多高校都需面对以下几方面的挑战。
3.1 共振峰参数提取实验
该实验提取所有语料的F 1和F 2共振峰频率, 并按照男声、 女声和男女声混合等情况分别统计出各个单元音共振峰参数的均值、 标准差和离散度等数据。其中离散度是标准差与均值的比值, 用来衡量个体发音与均值之间的差异[20]。统计结果如表4和表5所示。
表4 朝鲜语单元音共振峰频率统计
Tab.4 Statistics of formant frequencies for pure vowels of Korean
(续表4)
表5 蒙古语单元音共振峰频率统计
Tab.5 Statistics of formant frequencies for pure vowels of Mongolian
从表4和表5可以看出: 统计的男声、 女声和男女声混合的F 1和F 2各单元音的离散度均值小于0.15, 表明采集的语音样本不同个体(测试者)发音的差异较小, 都接近于标准音, 因此样本数据对于朝鲜语和蒙古语单元音声学特征的对比是有效的。使用表4和表5中男女声混合的F 1和F 2均值绘制的频率分布曲线参见图2。朝鲜语与蒙古语各元音的F 1和F 2差别较大, 表明它们之间具有不同的声学特性, 如图1所示。
a 朝鲜语的单元音 b 蒙古语的单元音
图1F 1和F 2频率分布
Fig.1 Frequency distribution of F 1andF 2
图1a中朝鲜语10个单元音相互之间的共振峰参数差异显著, 说明不同的单元音发音时舌位与圆唇度是不同的。与朝鲜语类似, 蒙古语7个单元音也体现出共振峰参数的差异性(见图1b)。
3.2 朝鲜语与蒙古语单元音相似性对比实验
从单元音的共振峰参数对比朝鲜语和蒙古语的相似性, 本实验采用2.2节的t -检验方法对比计算了两种语言单元音之间的差异程度。实验结果表明朝鲜语和蒙古语单元音中以下5对单元音具有声学特征的相似性。实验过程中抽样样本数n =20, 并用P ≥0.05表示两种元音不相似(-), 0.01≤P <0.05表示两种元音相似(±),P <0.01表示两种元音相同(+), 实验结果如表6所示。
表6 朝鲜语与蒙古语单元音相似性对比分析
Tab.6 Contrastive analysis of similarity for pure vowels of Mongolian and Korean
图2 两种语言5个相似元音的F 1和F 2频率分布
Fig.2 Frequency distribution of F 1andF 2 of similar pure vowels in two languages
表6中5对单元音t -检验结果没有出现不相似的结果, 说明这5对单元音声学特征具有相似性, 与表3所揭示的发音相似性(舌位和圆唇度对比)是吻合的。进一步采用男女声混合的均值绘制的F 1和F 2分布曲线也反映出5对单元音的相似性, 如图2所示。从图2可知朝鲜语与蒙古语的5对单元音的F 1和F 2频率分布相似, 与表6分析结论一致。
4 结 语
笔者采用共振峰中的F 1和F 2声学特征, 从计算语音学角度对比分析了朝鲜语与蒙古语单元音相似性, 研究发现两种语言中有5对单元音具有明显的声学特征参数的相似性, 这个结果与此5对单元音发音相似性是吻合的。但是笔者只对朝鲜语和蒙古语的单元音进行了相似性对比, 没有考虑辅音和复合元音等音素, 需要在今后工作中继续研究其他音素的对比分析, 以便全面对比朝鲜语和蒙古语的语音相似性。
参考文献 :
[1] 刘双君, 金小峰, 崔荣一. 基于基频的朝鲜语方言辨识方法的研究 [J] . 中文信息学报, 2017, 31(2): 55-60.
LIU Shuangjun, JIN Xiaofeng, CUI Rongyi. Research on Korean Dialect Identification Based on Pitch Feature [J] . Journal of Chinese Information Processing, 2017, 31(2): 55-60.
[2] 徐荣. 汉韩元音对比与韩语语音教学 [J] . 高教学刊, 2017, 65(17): 81-83.
XU Rong. Vowel of Chinese and Korean Contrast and Korean Phonetics Teaching [J] . Journal of Higher Education, 2017, 65(17): 81-83..
[3] 张鹏远, 廖建乐. 韩语与汉语粤方言的语音对比研究—兼论粤方言区学习者的韩语语音教学 [J] . 湖北科技学院学报, 2017, 37(5): 42-45.
ZHANG Pengyuan, LIAO Jianle. A Comparative Study of Phonetic Sentences in Korean and Chinese Yue Dialects-On Korean Phonetics Teaching by Learners in Cantonese Dialect Areas [J] . Journal of Hubei University of Science and Technology, 2017, 37(5): 42-45.
[4] 宝音, 雍洪. 喀喇沁土语词首与非词首音节短元音对比研究 [J] . 内蒙古民族大学学报: 社会科学版, 2016, 42(6): 102-105.
BAO Yin, PEI Hong. A Comparative Study of Short Vowels in the Syllables of Non-Preposition and Non-Digraph of Karasaic Language [J] . Journal of Inner Mongolia University for Nationalities: Social Sciences, 2016, 42(6): 102-105.
[5] 陈小莹. 藏语拉萨话元音时长与能量声学分析[J] . 西藏科技, 2015(9): 26-29.
CHEN Xiaoying. An Analysis of Tibetan Vocabulary Duration and Energy Acoustics [J] . Tibet Science and Technology, 2015(9): 26-29.
[6] 呼司乐土, 巴图格日勒, 格根塔娜, 等. 基于语音声学参数数据库的东乡语元音/i/音位分析 [J] . 西北民族大学学报: 自然科学版, 2015, 36(4): 28-32.
HU S, BATUUGERI, GEGENTANA, et al. Analysis of Dongxiang Vowel /i/ Phoneme Based on Speech Acoustic Parameters Database [J] . Journal of Northwest University Nationalities: Natural Science, 2015, 36(4): 28-32.
[7] 德格吉呼, 巴图格日勒, 金雅声. 保安语短元音声学特征研究 [J] . 西北民族大学学报: 自然科学版, 2014, 35(4): 27-33.
DERGIJHU, BATUUGLI, JIN Yasheng. Study on Acoustic Features of Short Vowels in Baoan Language [J] . Journal of Northwest University for Nationalities: Natural Science, 2014, 35(4): 27-33.
[8] 金哲俊. 关于朝鲜族男生的朝鲜语单元音共振峰的特征研究 [J] . 东疆学刊, 2010, 27(2): 74-77.
JIN Zhejun. On Characteristics of Korean Monophthong Formats Articulated by Korean Male Students [J] . Dongjiang Journal, 2010, 27 (2): 74-77.
[9] LEE H, JONGMAN A. A Diachronic Investigation of the Vowels and Fricatives in Korean: An Acoustic Comparison of the Seoul and South Kyungsang Dialects [J] . Journal of the International Phonetic Association, 2016, 46(2): 157-184.
[10] 好琳. 察哈尔蒙古语松紧元音的声学分析 [J] . 西北民族大学学报: 自然科学版, 2017, 38(3): 25-29.
HAO Lin. Phonetic Analysis of Standard Mongolian Lax/Tense Vowels [J] . Journal of Northwest University: Natural Science, 2017, 38(3): 25-29.
[11] 李如龙, 陈瑶. 从语音特征出发设计语音教学 [J] . 学术研究, 2015(3): 132-135.
LI Rulong, CHEN Yao. The Design of Phonology Teaching with Speech Features [J] . Academic Research, 2015(3): 132-135.
[12] 赵尔平, 王聪华, 党红恩, 等. 藏语孤立词语音识别技术研究 [J] . 西北师范大学学报: 自然科学版, 2015, 51(5): 50-54.
ZHAO Erping, WANG Conghua, DANG Hongen, et al. Research on Tibetan Isolated Word Speech Recognition Technology [J] . Journal of Northwest Normal University: Natural Science, 2015, 51(5): 50-54.
[13] 方香玉, 尹铁超. 朝鲜语元音i,a,u的实验语音学分析 [J] . 齐齐哈尔大学学报: 哲学社会科学版, 2017(2): 12-14.
FANG Xiangyu, YIN Tiechao. Analysis of Experimental Phonetics on Korean Vowels ‘i,a,u’ [J] . Journal of Qiqihar University: Philosophy & Social Science Edition, 2017(2): 12-14.
[14] DELATTRE P. The Physiological Interpretation of Sound Spectrogram [J] . Publications of the Modern Language Association of America, 1951, 66(5): 864-875.
[15] 卓嘎, 董志诚. 藏语拉萨语LPC语音参数提取研究 [J] . 现代电子技术, 2017, 40(18): 20-22.
ZHUO Ga, DONG Zhicheng. Research on Speech Parameter Extraction of LPC in Tibetan Lhasa Language [J] . Modern Electronics Technique, 2017, 40(18): 20-22.
[16] LV G, ZHAO H. Developments of the Research of the Formant Tracking Algorithm [J] . Computer & Information Science, 2010, 3(1): 68-71.
[17] 木合塔尔·沙地克, 布合力齐姑丽·瓦斯力, 李晓. 基于维吾尔语单词清、 浊音组成结构特征的连续语音单词切分算法 [J] . 西北师范大学学报: 自然科学版, 2013, 49(4): 34-37.
MUHETAER S, BUHELIQIGULI W, LI Xiao. Research on Word Segmentation Algorithm Based on Uyghur Phoneme Acoustic Feature [J] . Journal of Northwest Normal University: Natural Science, 2013, 49(4): 34-37.
[18] 姜玉宇. 闽、 吴方言区英语学习者元音声学实验研究 [J] . 外语研究, 2010(4): 36-40.
JIANG Yuyu. Research English Learner Vowels Acoustical Experiments of of Min and Wu Dialects [J] . Foreign Languages Research, 2010(4): 36-40.
[19] CHOI Y L. Fundamental Acoustic Investigation of Korean Male 5 Monophthongs [J] . Archives of Microbiology, 2010, 10(6): 395-408.
[20] 王昆仑, 张贯红, 吐尔洪江·阿布都克力木. 维吾尔语元音的声频特性分析和识别 [J] . 中文信息学报, 2010, 24(2): 122-128.
WANG Kunlun, ZHANG Guanhong, TURHOUNJAN A. Analysis of Acoustic Frequency Feature for Uighur Vowels and Their Identification [J] . Journal of Chinese Information Processing, 2010, 24(2): 122-128.
Comparative Study of Pure Vowels in Korean and Mongolian Based on Computational Phonetic Method
WANG Guirong, JIN Xiaofeng
(College of Engineering, Yanbian University, Yanji 133002, China)
Abstract : In order to compare similarity of pure vowels in Korean and Mongolian using computational phonetics method, this paper proposes an approach of comparative analysis based on formant parameters. Firstly, F 1andF 2 formant frequency is extracted from Korean and Mongolian pure vowels, the mean value, standard deviation and divergence factor of F 1andF 2 parameters are computed respectively. Secondly, analyze the distributing differences of formant frequency for each of the two languages are analyzed. Finally, similarity of Korean and Mongolian pure vowels are compared by t -test method with formant frequency. Comparative analysis results show that the divergence between different acoustic features of pure vowels can be clearly distinguished by F 1andF 2. And the total 5 pairs pure vowels are similar in acoustic features, and the 5 pairs pure vowels are in correspondence with analysis of tongue-position and lip-rounding in pronunciation process. The proposed approach can provide a basis for further study on similarity between Korean and Mongolian by using computational phonetics.
Key words : language information processing; acoustic characteristics analysis; vowels; formant frequency
中图分类号 :TP391.42
文献标识码: A
收稿日期 :2018-04-02
基金项目 : 延边大学青年基金资助项目(延大科合字201703号); 延边大学外国语言文学世界一流学科建设科研基金资助项目(18YLPY14)
作者简介 : 王桂荣(1981— ), 女(蒙古族), 内蒙古通辽人, 延边大学硕士研究生, 主要从事语音信息处理研究, (Tel)86-13043392233(E-mail)37783474@qq.com;
通讯作者: 金小峰(1970— ), 男, 黑龙江东宁人, 硕士, 延边大学教授, 硕士生导师, 主要从事智能信息处理研究, (Tel)86-13944386020(E-mail)xfjin@ybu.edu.cn。
文章编号: 1671-5896(2019)01-0068-07
(责任编辑: 刘东亮)