普通话语音的统计分析,本文主要内容关键词为:统计分析论文,普通话论文,语音论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
普通话语音一般分为辅音(声母)、元音(韵母)、声调、音节以及汉语拼音字母五部分。在以往的教学和研究中,在论述它们的特点时,一般是只凭感觉和印象概而言之,缺乏必要的翔实的统计与分析;在具体讲授和训练时,一般也是不分轻重缓急地逐一讲解和训练。至于每个音素、音节等在语言实际使用中的分布情况,出现频率等都不甚了然,这就使教学和研究在很大程度上带有一定的盲目性。本文在已有研究成果的基础上,试对普通话语音系统中的各级语音单位的静态和动态呈现做统计分析,为普通话语音教学和研究提供一点翔实的材料。用统计的方法研究语音并不能解决和说明所有问题,但它至少能使我们的教学和研究符合实际,言之有据,具有针对性和实用性;它对语音合成、语音自动识别等语言通讯的研究也具有重要意义。
一、辅音和声母
(一)辅音和声母的静态统计
1、辅音。普通话语音系统共有辅音即辅音音位22个,按发音部位从前到后排列为:b、p、m、f、z、c、s、d、t、n、l、zh、ch、sh、r、j、q、x、g、k、h、ng。
2、声母。普通话语音系统共有辅音声母21个(此外还有零声母)。《汉语拼音方案》规定,声母排列顺序按发音部位从前到后和从后到前排列:
从前到后:b、p、m、f、d、t、n、l、g、k、h。从后到前:j、p、x、zh、ch、sh、r、z、c、s。
辅音声母一般从发音部位和发音方法两个方面进行分类和描写。
按发音部位,普通话辅音声母可以分以下七类:(1)双唇音:b、p、m(3个);(2)唇齿音:f(1个);(3)舌尖中音:d、t、n、l(4个),(4)舌根音:g、k、h(3个);(5)舌面音:j、q、x(3个);(6)舌尖后音:zh、ch、sh、r(4个);(7)舌尖前音:z、c、s(3个)。
按发音方法,一般从阻碍方式、声带是否颤动和气流强弱等三个方面来分析。
根据阻碍方式,可把普通话辅音声母分为五种:(1)塞音:b、q、d、t、g、k(6个);(2)塞擦音:j、p、zh、ch、z、c(6个);(3)擦音:f、h、x、sh、r、s(6个);(4)鼻音:m、n(2个);(5)边音:l(1个)。
根据声带是否颤动,分为清音和浊音两类:(1)清音17个:b、p、f、d、t、g、k、h、j、q、x、zh、ch、sh、z、c、s。(2)浊音4个:m、n、l、r。
根据气流强弱,把普通话辅音声母中的塞音和塞擦音分为送气音和不送气音两类:(1)送气音6个:p、t、k、q、ch、c。(2)不送气音6个:b、d、g、j、zh、z。
(二)辅音和声母的动态统计
平均每100个音节(字)出现的辅音、声母列于表1-1和表1-2①。
表1-1普通话辅音出现频率表
表1-2普通话声母出现概率表(%)
序号
1 2 3 45 6 7 8 9 1011
声母零声母
d shzhj l g b x hm
概率12.45 12.00 7.66 7.18 6.98 5.69 5.50 5.15 4.86 4.42 3.74
12
13 14151617
18192021
22
tq z chn f r kc s p
3.53 3.11 3.01 2.75 2.53 2.45 1.94 1.83 1.15 1.08 0.98
(三)简要分析
上面的静态和动态统计至少可以给我们提供下列信息:
1、辅音和声母的关系。辅音和声母虽然角度不同,辅音是语音学术语,是就音素的性质而言的,声母是汉语音韵学术语,是就音节而言的,数量有异,辅音22个,声母21个。但仅从普通话语音系统看,辅音和声母有着密切关系。第一,从声音性质上说,辅音和声母一样,普通话声母全部由辅音充当(零声母除外)。第二,在使用范围和数量上虽然大小有异,但只要记住两个特例即可。(1)辅音ng只作韵尾不作声母,如bang(帮)。(2)辅音n既可作声母也可作韵尾,如nan(南)。从表1-2可以看出,剔出零声母和后鼻音ng后,声母的位次与辅音的频序大体相同,这也反映了普通话声母与辅音在很大程度上具有一致关系。前鼻音n从辅音表中的首位退到声母表中的第16位,说明辅音n之所以高频出现,是它既可以作声母,也可以作韵尾的结果,而它作韵尾的频率为16.58%,作声母只占2.53%,说明它在语言中是经常作韵尾出现的。
2、辅音和声母在普通话语音中的地位和作用。22个辅音在100个词中和100个辅音中各自出现的频率虽然不同,但频序却惊人的一致;声母出现的概率也与辅音的频序大体相同,这就基本上反映了它们在语言实际使用中的情况,人们可以根据这个排列顺序确定教学和研究的重点。据此,可以得出普通话语音10个高频辅音是:n、ng、d、sh、zh、j、l、g、b、x。10个高频辅音声母是:d、sh、zh、j、l、g、b、x、h、m。
3、浊辅音作用很大。普通话语音共有清辅音17个,浊辅音5个。从理论上讲,某一发音部位、发音方法既然有清辅音,就应该有相对应的浊辅音。但事实上各种方言中这种情况并非都整齐地两两相对。在普通话语音系统中,清辅音的数量超过浊辅音的三倍多,清浊辅音真正成对的只有sh和r一对②,这种“清”“浊”没有严整地对应出现的现象说明,“清”“浊”在普通话中的辨义作用并不很明显。但是,普通话语音系统中尽管只有n、ng、m、l、r五个浊辅音,但它们在100个辅音中出现频率竟占39.07%,说明它们在语言中的作用很大,在教学和研究中,切不可因它们数量少而轻视它们。尤其是前鼻音n和后鼻音ng的出现频率占29.6%,稳居前两位。前鼻音n和边音l的出现频率占20.54%。它们的高频出现提醒我们必须加强它们之间的辩异教学和训练,尤其是n-ng、n-l不分的方言区教学更是如此。
4、送气与不送气具有明显辨义作用但并不平衡。在普通话辅音中,由于塞音、塞擦音的除阻阶段特别明显,所以它们各有3对送气与不送气音。送气与不送气音的成对出现,说明送气与否在普通话中具有明显的辨义作用,“肚子饱了”和“兔子跑了”的意义不同正在于此。但是,bp、dt、gk;zhch、zc、jq虽然成对出现,但它们在语言中所起到的作用并不平衡一致,不送气音的出现频率为32.98%,送气音仅占11%,不送气音的频率远远高于送气音。我们切不可因为它们在静态中成对地对应出现而忽略它们在语言的动态使用中所呈现的作用不平衡现象。
5、零声母音节出现率较高。从表1-2可以看出,零声母稳居首位占12.45%。这就提醒我们要切实加强零声母音节的教学和训练。切不可因声母是“零”③而不予重视。
6、要加强平、翘舌音之间的辨异教学和训练。对声母按发音部位统计,双唇音为9.87%;唇齿音为2.45%;舌尖中音为23.75%;舌根音为11.75%;舌面音为14.95%;舌尖后音为19.53%;舌尖前音为5.24%。这里需要引起我们注意的是,平舌音z、c、s和翘舌音zh、ch、sh、r的出现率占24.77%,几近1/4。由于许多方言区二者不分,这就要求我们要切实加强它们之间的辨异教学和训练,由于z、c、s出现的概率较低,我们可以利用以少推多的办法,只记住z、c、s所辖字、词即可。
7、在艺术语言发声中,要加强塞擦音、擦音的发音训练。从发音方法看,塞音占28.99%,擦音占22.41%;塞擦音占24.18%,鼻音占6.27%,边音占5.69%。擦音和塞擦音占46.58%,几乎一半。这个数字提醒我们,在艺术语言发声教学和训练中,如说唱表演艺术、播音、教师口语等的发声训练中,要切实加强擦音、塞擦音的教学和训练。艺术语言发声讲究吐字技巧,而吐字训练中的所谓字头一般是声母或声介合母,由于塞音、鼻音、边音是阻碍部位接触形成的,人们较易掌握;而擦音和塞擦音是阻碍部位接近或接触后又转为接近形成的,人们在发声时往往是“擦”的部分时值过长或过于松懈,缝隙留得过宽,这就难以带响整个音节,影响声音效果。
(四)普通话声母所辖汉字字数及简要分析
为与前面的动态统计相对照,同时也为声母辨正等提供科学的依据,对普通话声母所辖汉字字数的情况做如下统计和分析。统计对象:1、上海交通大学汉字编码和上海汉语拼音文字研究组编著的《汉字信息字典》,该书收字11254个,其中正体字7785个,繁异、别体字3469个,具有概括性和代表性。2、现代汉语3500常用汉字。计算方法:对字有多音者分别各计数一次。统计结果分别见表1-3和表1-4。
表1-3普通话声母所辖字数表④
序号
12345678910
11
12
声母 零jlxzh
hdqbgtsh
字数 986 667 585 511 508 411 419 400 398 374 370 368
1314
15
16
17
18
19
20
21
22
chmpfkszncr
364 352 301 249 245 212 204 192 165 120
表1-4普通话声母所辖常用汉字字数表
序号
12345678
91011
声母
零
jlzh
xsh
dhbch
g
字数 490 312 276 235 233 214 203 203 202 169 165
12
13
14
15
16 17
18 19 20
21 22
m qtpf
kz
sn
c
r
164 159 157 141 123 99 93
93 85
76 52
这两个表可以提供下列信息:
1、这两个表声母的序位大体一致,并与前面的辅音和声母的序位也大体一致,这就基本上反映了普通话声母在语言中尤其是书面语言中出现的实际情况。据此,可以得出普通话辅音声母所辖字数最多的前10个是:j、l、x、zh、h、d、q、b、g、t。
2、由于声母所辖字数不平衡、在声母辨正和记字音时,可以充分利用它们的不平衡采取记少推多的办法,具体是:(1)记n不记l。(2)记z、c、s不记zh、ch、sh。(3)记f不记h。可以分别排出n、f、z、c、s所辖字表,以此推知l、h、zh、ch、sh所辖字的读音。(4)有些方言把零声母字读成有声母字。虽然零声母所辖字数最多,但它们分属“四呼”,若分解开来,每“呼”的零声母所辖字数并不多,其中开口呼分别是173和69;齐齿呼分别是426和209;合口呼分别是245和117,撮口呼分别是142和95。我们可以据此排出零声母字表。在发音时,去掉在其前面加的各种声母即可。
二、元音和韵母
(一)元音和韵母的静态统计
1、元音。普通话语音系统中的元音分单纯元音和复合元音两类。单纯元音简称单元音,有10个,它们也就是普通话的10个元音音位。即:舌面元音7个:a、o、e、ě、i、u、ü。舌尖元音2个:。卷舌元音1个:er。复合元音简称复元音,有13个,它们是:ai、ei、ao、ou、ia、ie、ua、uo、üe、iao、iou、uai、uei。
2、韵母。普通话中的韵母一共有39个,它们的各种类别是:
(1)结构类
A、单韵母10个,同单元音。
B、复韵母13个,同复元音。其中二合元音9个,又分前响元音韵母4个:ai、ei、ao、ou;后响元音韵母5个:ia、ie、ua、uo、üe。三合元音即中响韵母4个:iao、iou、uai、uei。
C、鼻韵母16个,它们是:元音+n:an、ian、üan、uan、en、in、uen、ün(8个)。元音+ng:ang、iang、uang、eng、ing、ueng、ong、iong(8个)。
(2)“四呼”类
A、开口呼韵母15个:-i〔2〕、-i〔Z〕、a、o、e、ě、er、ai、ei、ao、ou、an、en、ang、eng。
B、齐齿呼韵母9个:i、ia、ie、iao、iou、ian、in、iang、ing。
C、合口呼韵母10个:u、ua、uo、uai、uei、uan、uen、uang、ueng、ong。
D、撮口呼韵母5个:ü、üe、ün、üan、iong。
(3)韵尾类
A、开尾韵母15个:-i〔2〕、-i〔Z〕、a、o、e、é、er、i、ia、ie、u、ua、uo、ü、üe。
B、元音尾韵母8个:ai、ei、ao、ou、iao、iou、uai、uei。
C、鼻音尾韵母16个:an、ian、uan、üan、en、in、uen、ün、ang、iang、uang、eng、ing、ueng、ong、iong。
(二)元音和韵母的动态统计
平均每100个音节(字)出现的元音和韵母列于表2-1和表2-2。
表2-1普通话元音出现频率表(%)
表2-2普通话韵母出现概率表(%)
(三)简要分析
上面的静态和动态统计可以提供下列信息:
1、元音和韵母的关系。元音是汉语音素中与辅音相对的另一大类,它也是就音素的性质而言的;韵母和声母一样,也是汉语音韵学上的术语,是就音节而言的,是音节中除声母外所剩下的部分。组成韵母的音素绝大多数是元音,但二者不能等同,它们的区别主要有两点:第一:角度不同。元音是就音素本身的性质而言的,而韵母是就音节结构而言的。第二、范围不同。韵母的范围大于元音,元音固然充当韵母,但韵母不只由元音构成。韵母中除单元音韵母外,还有复元音韵母和鼻韵母,它们都是几个元音或元音加上辅音的组合。
2、普通话10个元音音位和39个韵母在语言实际使用中的地位和作用。普通话10个元音音位在语言使用中的频率并不一致,其中舌面元音在100个元音中出现频率为94.78%,舌尖元音是4.74%,卷舌元音是0.21%,39个韵母的出现概率也不平衡。其中单韵母是41.21%,复韵母是26.18%,鼻韵母是32.64%。开口呼韵母是45.58%,齐齿呼韵母是27.87%,合口呼韵母是21.98%,撮口呼韵母是4.60%。人们可以根据这个排列顺序确定教学和研究的重点。据此,得出普通话五个高频元音是:i、a、u、e、o,它们出现频率为89.16%,其中i、a占46.79%,几近一半。普通话前10个高频韵母是:e、i、u、-i〔Z.2〕、uo、ong、ian、a、en、an。
(四)普通话韵母所辖汉字字数及简要分析
统计目的,对象及计算方法同声母辖字表。
表2-3普通话韵母所辖汉字字数表
表2-4普通话韵母所辖常用汉字字数表
上面两个表可以提供下列信息:
1、韵母所辖字数不平衡。所辖字数最多的前10个韵母是:i、u、an、ao、ian、a、iao、uo、ing、e。这与前面所列韵母的序位大体一致。在韵母所辖常用汉字字数中,开口呼辖字1545个,齐齿呼辖字1195个,合口呼辖字944个,撮口呼辖字264个。与前面所列“四呼”韵母出现的频序是一致的,这就基本上反映了韵母在语言中尤其是书面语言中的实际使用情况。
2、由于韵母所辖字数不平衡,在韵母辩正和记字音时,也可以采取记少不记多的办法,如记o不记e;记ü不记i等。
三、声调
(一)声调的静态统计
普通话的声调有四种基本类型,也就是普通话的四个调位。如表3-1。
调类 调值 调值说明调号例字
阴平(第一声) 高平调55 起音高高一路平-
妈mā
阳平(第二声) 中升调35 由中到高往上升/
麻má
上声(第三声) 降升调214生降后升曲折起
√
马mǎ
去声(第四声) 全隆调51 高起猛降到低层
\
骂mà
(二)声调的动态统计 平均每100个音节(字)出现的声调列于表3-2。
普通话声调出现概率表(%)
序号 1 2
3
4
声调去声阳平阴平上声 轻声
概率35.78 19.3718.71
17.51 8.63
(三)普通话声调所辖字数的统计
统计目的、对象及计算方法同声母、韵母辖字表。
表3-3普通话声调辖字表
序号1 2 3 4
声调 去声阳平
阴平
上声 声调不固定
字数 27522210
2158
1419 58
表3-4普通话声调所辖常用汉字字数表
序号 1 23 4
声调 去声阳平阴平 上声轻声
字数 1330
967 933
685 39
(四)简要分析
1、四种声调在语言中出现的频率不一致。几种统计的结果顺序基本一致,这表明四种声调在语言中出现的频序是:去声、阳平、阴平、上声。
2、四种声调的频序如实反映了普通话声调与古声调的对应演变关系。古汉语平、上、去、入四声的分合演替轨迹与普通话四声的频序和所辖字数的序位完全吻合,具体是:
(1)古汉语平声字在普通话里按声母清浊分化为阴平和阳平两大类,凡中古清声母的平声字在普通话里念阴平;中古浊声母(包括全浊和次浊)的平声字在普通话里一律念阳平。由于普通话的阴平和阳平是对古平声字按声母的清浊平分秋色,所以,它们的语言中出现的频率大体相同,所辖字数也相差无几,阳平字之所以多于阴平字,是因为古全浊入声字也分流到普通话阳平的结果。
(2)古上声字的演变。凡古清声母的上声字和次浊声母的上声字普通话中仍读上声,但古全浊声母的上声已分流到普通话的去声中去。古上声字演化的结果使得普通话里的上声字数量变少了,上面几种统计的结果上声均排在最后,就充分地说明了这一点。
(3)古去声字不论声母清浊在普通话中都念去声,普通话去声所辖字数之所以高居首位,在语言中的出现频率也之所以位居第一,就是因为它接收了全部的古去声字,同时又接纳了古全浊声母的上声字和半数以上的古入声字。
(4)古入声字在普通话中已消失,“入派三声”,所以它基本上不影响普通话四声的统计结果。
四、音节
(一)普通话音节的静态统计
普通话音节是由21个辅音声母和39个韵母按一定规律拼合而成的。经常出现的基本音节大约有400个左右,由于有些音节形式是否标准意见不一,现只把通行的数据排列如下:
(1)《新华字典》(1971年修订重排本)所列音节415个。
(2)《现代汉语词典》(1979年版)所列音节418个。
(3)《汉字信息字典》“索引”中列出音节417个,在所附《普通话音节字数统计表》中去掉“n”、“shei”、“rua”,列出414个。
(4)马大猷先生认为普通话中元音和辅音组成音节共414个,加上四声区别成为1327个。
(二)普通话音节与汉字对应计量统计
表4-1普通话辖50字以上基本音节表
序号 1 234 56789
10
11
音节 yijixi
fu
qi
li jian wei ju
bi
wu
字数
131
121
102
99
89
84
81
70
70
66
62
1213 14
15
16
1718
1920
212223
jie jiao
xian
pi
gu
bu
zhu
you
lu
hui
yin
xie
60 58 56
56
54
5453
5251
515050
表4-2普通话辖25常用字以上基本音节表
序号 1 2 3 4 5 6 7 8 9
音节 jiyifuyujianqiyanliwei
字33数
58484441 38 37 3634 33
10 11 12 13 14 1516 17 18 19 20
shuxijiaowuxianbijujiejingzhubo
33 32 31 29 29 2727 26 26 2625
表4-3现代汉语常用字音节和字对应计量表⑤
例
音节数 例音节数
1音1字féi3551音8字wěi30
1音2字bīng
2291音9字shǔ17
1音3字chè1511音10字
méi13
1音4字dūn1151音11-15字zhī16
1音5字luò96 1音16-20字jǐ 4
1音6字guī53 1音21-27字yì 4
1音7字jiè41总计
1124
(三)普通话音节的动态统计
普通话中使用频率最高的基音节,目前的观点和统计也不尽一致,较通行的有以下几种:
1、据张志公先生统计,在400个基本音节中使用频率最高的是以下14个音节:de、shi、yi、bu、you、le、ji、che、wo、ren、li、ta、dào、zhi。其次是:zhong、zi、guo、shang、ge、men、he、wei、ye、da、gong、jiu、jian、xiang、zhu、lai、sheng、di、zai、ni、xiao、ke、yao、wu、yu、jie、jin、chan、zuo、jia、xian、quan、shuo33个。这47个音节占总出现率的一半左右,是普通话语音中的主干部分。
2、北京航空学院计算机科学与工程系和中国文字改革委员会共同对1108万个汉字的抽样统计报告——《社会科学·自然科学字频统计表》表明,排列在高频度汉字前20名的音节顺序是:de(的)、yī(一)、shì(是)、zaì(在)、bù(不)、le(了)、yǒu(有)、he(和)、rén(人)、zhè(这)、zhong(中)、dà(大)、wèi(为)、shàng(上)、gè(个)、guó(国)、wǒ(我)、yǐ(以)、yào(要)、ta(他)。
3、北京语言学院语言教学研究所编写的《常用字与常用词》所列前20个高频词音节为:de(的)、le(了)、yī(一)、shì(是)、bù(不)、wǒ(我)、zài(在)、zhe(着)、gè(个)、yǒu(有)、ta(他)、shàng(上)、zhè(这)、shuō(说)、jiù(就)、ren(人)、de(地)、lǐ(里)、yě(也)、hé(和)。
(四)简要分析
上面的静态、动态与音节和汉字的对应计量统计,可以给我们提供下列信息:
1、普通话基本音节410个左右,带调音节1300多个。
2、10个高频音节是:de、yī、shì、zài、bù、le、yǒu、hé、rén、zhè。在普通话音节教学中,尤其是小学初年级的直呼音节的教学中,应加强这些高频音节的识读训练,以收到事半功倍的效果。
3、所辖汉字最多的前10个基本音节是:yi、ji、xi、fu、qi、li、jian、wei、ju、bi。
4、普通话音节所包含的字数很不平衡,仅从表4-3即现代汉语的常用字音节和汉字的对应计量统计就可以看出,只有31.5%的音节一音一字,一个音节承担一个字所代表的意义,68.5%的音节负担沉重,一个音节承担着两个以上的字所代表的意义,在现代汉语中,一个字大体相当于一个语素,这就意味着语言中存在着大量的同音语素或同音词,同音语素或词的大量存在,使语言表达中意义相混的可能性增大。在书面语言中,我们可以通过汉字这种独特的表意文字使它们相区别,但在用拼音字母拼写现代汉语时,这几乎是一条无法逾越的障碍,因此,它是汉语拼音正词法应该研究、解决的一个重要课题。
五、汉语拼音字母
(一)汉语拼音字母的静态统计
汉语拼音字母的全部形式有26个,除“V”在普通话中备而不用外,实际只有25个,分为元音字母和辅音字母两大类。元音字母五个:A、O、E、I、U,其它20个是辅音字母。
(二)汉语拼音字母的动态统计
表5-1汉语拼音字母出现概率表(%)
序号 1 2 3 4 56 78 9 10
11
12
字母 I n a e uh go d cz s
概率12.55 11.74 9.57 8.43 7.88 7.35 7.20 6.04 4.01 3.40 3.40 2.92
13 141516
17
18 1920
212223
2425
26
y j lb xm t wq fr k pv
2.88 2.33 1.90 1.72 1.62 1.25 1.18 1.09 1.04 0.82 0.77 0.61 0.33 -
(三)简要分析
1、字母出现概率不平衡。i、n、a三个字母的出现占1/3,再加上e、u、h、g、o、d六个字母已占2/3,其余17个字母不到1/3。
2、10个高频字母是:i、n、a、e、u、h、g、o、d、c。
1994年3月4日收稿 注释
①表1-1、1-2;表2-1、2-2;表3-2、表5-1所列数字是根据马大猷先生的统计重新编排的
②有的学者认为,普通话声母r摩擦不太强,它并不是对声母sh严格对立的浊擦音,应为无擦通音。见王力《再论日母的音值兼论普通话声母》,《中国语文》1983年第1期
③零声母音节开头的元音并不是纯元音,A、韵母是i或以i开头的零声母字,开头有半元音〔j〕。B、韵母是u或以u开头的零声母字,开头有半元音〔w〕。C、韵母是ü或以ü开头的零声母字,开头有半元音〔μ〕。D、不以i、u、ü开头的零声母字,开头有舌根浊擦音〔γ〕或喉塞音〔?〕。因为它们不区别意义,所以《汉语拼音方案》中不标出
④表1-3、表2-3、表3-3、表4-1所列数字是根据《汉字信息字典》重新统计编排的
⑤表4-3是根据钱乃荣主编《现代汉语》所列数字编排的
标签:元音音素论文; 拼音音节论文; 字数统计论文; 汉字演变论文; 普通话论文; 辅音字母论文; 拼音声调论文; 元音论文; 声母论文; 音节论文;