西南民族大学 610041
摘 要:用现代化的技术手段,科学采集真实语音并建设语音库,不仅可以长期保存濒危语言,而且能为后人学习、研究提供翔实的语音数据材料。本文以湖南隆回花瑶语语音库的建设流程为例,对濒危语言语音库的研究与建设进行了初步探讨,旨在进一步保护少数民族语言,保存和保护濒危语言和文化。
关键词:濒危语言 隆回花瑶 语音库 研究与建设
基金项目:本文得到西南民族大学研究生创新型科研项目资助。项目编号:CX2015SP146.
一、引 言
隆回花瑶主要居住于湖南省境内的雪峰山东北麓的溆浦、隆回两县接壤的海拔1200多米高山峻岭之中[1],忠实地传承着先祖最为古朴纯真生活,是一支被我国民族史料遗忘了的瑶族分支[2],人口约6000余人。
随着经济全球化的快速发展,隆回花瑶语一方面受强势语言的冲击,使用人数越来越少,另一方面由于花瑶语没有文字,语言仅仅保留在老人的山歌、民间故事、传说等口头语言流传形式上,属于我国定义的濒危语言。花瑶语言如果没有得到及时有效的保护,那些经过长久积累下来的民族文化载体——故事、传说、花瑶呜哇山歌和花瑶挑花等,会因为语言的消失而严重摧毁,同时由于语言是人类最重要的资源和财富,是人类最重要的交际和交流思想的工具,而花瑶语语音库的研究与建设是其保存、保护、传承的关键所在,因此保护隆回花瑶语言就显得格外重要。
二、花瑶语语音库的设计
语料音的建设包括录音文本设计、录音信息、录音过程和录音文件的处理等内容。录音文本选取都是经过筛选过的具有代表性的字、词、句、段落和对话,选择合适的录音人,运用齐全的设备进行录音,确保录制下来的花瑶语音能真实反映花瑶语言原貌。本文选取的采集点为湖南省邵阳市隆回县虎形山村,这里是花瑶居住最为集中的地方,有利于获取真实的花瑶语言素材。
1. 花瑶语语音库的发音文本设计
花瑶语录音文本设计包括了录音文本收集和选取,这次采集花瑶语主要包括四个文档:(1)第一个文档包括了492个常用词汇;(2)第二个文档包括了2200个日常用语;(3)第三个文档包括了351个短语和句子,其中203个语句长度为1~9个词的较短语句,48个语句长度大约为10~20个词的长句。(4)第四个文档主要是花瑶语语法调查用例,从词类与语法范畴角度出发,主要包括名词、代词、数词、量词、动词及其语法范畴、形容词、副词、助词、连词、语气词、叹词、拟声词和句类等内容。此次录音文本的选取和设计是根据中国社科院人类学研究所提供的录音文本,这个录音文本已成功用于彝语、藏语和傣语的语音的录制,在原有的录音文本的基础上,再根据当地花瑶语言实际使用情况对其内容进行增、删、修改,以确保全面而真实的反映花瑶语的语音存档。这次语音采集是花瑶语音库建设的重要步骤之一。另外还录制了当地居民在乡镇上的集市贸易、村寨中的交谈、发音人与其他村民的自由闲聊等对话话题,还请当地人用瑶语讲了本族祖先来源故事、花瑶婚俗、本族传说(神话)、花瑶歌曲、花瑶呜哇山歌、当地农作物或经济作物的耕种过程、花瑶挑花民间技艺的操作流程、本地某种疾病的土方法治疗过程,还请“邺皈”歌唱歌颂词等内容。
期刊文章分类查询,尽在期刊图书馆
2. 花瑶语语音库的录音设备与采样信息
录音信息包括录音文件名称、录音环境和录音设备的选取。此次采用的录音软件是Sony存储卡摄录一体机,带有高质量的外置声卡和高灵敏度的指向性话筒等录制设备,有利于保证录制的语音材料有高保真度和低躁声[3],采样率为16KHz,16bit精度,Wave格式存储。另外,在录制语音的过程中,要求能在安静的录音环境下通过录音软件录制,这样回音小,嘈杂音小,尽量避免街区和行人、车辆多的地方。
3. 花瑶语语音库的采集
录音过程中主要是调查人和发音人的相互配合和相互合作的过程。调查人主要包括调查人姓名,调查人单位,调查人联系方式、通信地址、电话、E-mail,调查时间,记录地点等属性。
发音人的选择,包括发音人的姓名、发音人单位、发音人联系方式、通信地址、电话、E-mail、发音人性别、发音人民族、发音人出生年月、发音人出生年月(公历)、发音人出生地(从省级至自然村级)、发音人主要经历、发音人文化程度、发音人职业、发音人会说哪几种话(包括普通话、外语)、发音人现在主要说什么话、发音人的父亲在哪里,会说什么话,发音人母亲在哪里,会说什么话等属性。录音文本由男/女生两个人朗读。其中两位是隆回县虎形山瑶族乡文体卫站工作人员。按照采集惯例,选择录音人是既懂汉语,又会瑶语的当地人,在提供包含的字、词汇、短语和句子的文档中,录音采集人员按照提供的文档朗读汉语,当地人的两名发音人相对应的念本民族语言。在录音的过程当中,录音人在录音前要对自己的录音文本能熟练朗读,正式录音前让发音人调整情绪,进入录音状态,由于受汉语和外来语的影响,有些花瑶语和汉语对接不上来,为了提高录音的准确性和达到较好的录音效果,我们请当地从事各行业的人首先对录音文本进行讨论,确定汉语对照的花瑶语的语音,讨论完之后在进行录音。通过录制测试句,再根据录音情况调节录音设备和发音人状态,录音采集人员要全程监听和指导,保证录音的每一句语音符合质量要求。[4]
4.花瑶语语音库文件的处理
录音文件的处理主要是对花瑶语进行切音和语音标注,花瑶语音库的研究与建设是一个循序渐进的过程,录制完成之后再使用Cool Edit Pro 2.0工具软件不仅可以查看声音效果、波形,通过播放录音后产生的.DAT文件听取录音是否与对应的录音文本一致,如发现问题,可以及时进行补录和通过专门软件进行后期处理和修改。[5]还可以进行对字、词、短语和句子的切音,对录制的花瑶语的切音这是进行花瑶语音库建设的一个重要步骤和关键环节之一。
此外语音库的标注和后期处理方法即语音语料库管理系统的设计还有待于进一步研究和建设,但是在录音的过程中,也存在一些问题,由于受知识理解程度的影响,当地不同年龄阶段的人对汉语意思理解不同,录的过程中意见不一致,鸡叫、小孩子的嬉闹声,给录音环境带来干扰,从而产生杂音。因此, 有时工作人员不得不停下来重录,影响到录音的进度和准确性。在采集花瑶语语音的过程中,此次所选用的录音文本中所包含的语料尽可能多的覆盖了花瑶的自然语言现象,合理选取录音人,良好的录音环境和高质量的录音设备对录音的顺利进行非常重要。
三、结 语
语言是重要的非物质文化遗产[6],但目前濒危语言的现状堪忧,利用信息化的技术手段对即将消亡的语言进行抢救性调查和记录,不但可以保存花瑶语以口头相承的形式流传于民间的神话传说、故事、花瑶山歌以及民间宗教唱词等形态的精神产品,而且可以通过建立濒危语言花瑶语音库,一方面保存大量真实的花瑶原生态语言,另一方面利用语音库中的有声资料对花瑶母语传承、双语教学、历史文化和语言变迁研究具有重要的历史文化意义和学术应用价值。
花瑶语语音库的研究与建设探讨,既保护了民族语言,有利于人类文明的传承和发展,也是有利于为保存更多的少数民族濒危语言和方言提供一个可值得借鉴的经验。
参考文献
[1]奉锡联,沈玲玫.湖南雪峰花瑶服饰刍议[J].广西民族学院学报(哲学社会科学版),1999:89.
[2]王俊杰.论花瑶挑花的文化空间[J].重庆科技学院学报(社会科学版),2010,8:134.
[3]孙金城,陈希清,李昌立等.汉语普通话语音数据库[J].声学学报,1991,16(6):467.
[4][5]戴庆厦,赵小兵.中国少数民族语言文字信息处理研究与发展[M].北京:民族出版社,2010:91-93.
[6]孙宏开.从语言的性质和功能看保护濒危语言的必要性和可能性[J].民族翻译,2014 ,2:8.
论文作者:周 娟
论文发表刊物:《语言文字学》2016年1月
论文发表时间:2016/9/27
标签:语音论文; 发音论文; 语言论文; 隆回论文; 文本论文; 汉语论文; 切音论文; 《语言文字学》2016年1月论文;