2018年藏语研究前沿论文

2018年藏语研究前沿论文

2018年藏语研究前沿

黄成龙

(中国社会科学院民族学与人类学研究所 北京100081)

摘 要: 通过对2018年国内外发表的有关藏语的语言特征描写分析、语音描写与语音演变研究、语音识别与合成、形态句法、自然语言处理、翻译与语言应用研究等本体和应用研究成果的分析,及时了解藏语研究的学术前沿、研究取向以及研究方法上和理论上的最新动态,进一步推动国内藏语的研究。

关键词: 藏语;藏文;区域研究;前沿

2018 年,国内外藏语研究在语言特征描写与分析、语音描写与语音演变研究、语音识别与合成、形态句法、自然语言处理、翻译与语言应用研究等本体和应用研究方面发表了一些带有前沿性的研究论文。本文拟从以下几个方面简要介绍2018年国内外藏语研究的前沿和最新动态。

一、语言特征描写与分析

2018年发表了4篇介绍文献中藏语语音概貌、藏语研究现状、展望与意义以及描写藏语方言群语音特征、方言词汇特征等方面的论文。

施向东在《<同文韵统>所见清初藏语概貌》一文中指出清代乾隆年间编撰成书的梵-藏-满-汉对音工具书《同文韵统》,以藏文为枢纽联通了梵-藏-满-汉四种文字语音,为规范梵汉、藏汉、梵藏之间的对音提供了规则。该文通过此书提供的资料和线索,对清初藏语的概貌进行了探索[1]

陈荣泽的《西藏民族大学的藏语研究:意义、内容与展望》回顾半个多世纪以来的藏学研究,认为藏语研究在科研、学科建设、教学中都有重要意义,应当重视藏语研究,通过积极推进科研队伍建设、充分利用藏语资源、加强合作、加快人才培养、融入和搭建科研平台等途径加强藏语研究[2]

铃木博之的《康巴藏语崩波岗方言群及其语音特征》对康巴藏语的方言分类进行讨论,并针对所谓的“南路次方言”进行重组,重新划出“崩波岗方言群”。该方言群名称源自藏族传统地理区域,分布在康区南部,主要包括四川省甘孜州理塘县、雅江县、稻城县及凉山州木里县。通过与藏文的对比,此文阐明崩波岗方言群中的六个土话的语音概要和内部差异,以及与周边其他方言群不同的特征[3]

尹蔚彬的《夏尔巴话词汇构造及特点》对我国西藏自治区聂拉木县樟木镇一带的夏尔巴话词汇进行了分析,提出夏尔巴话构词分为复合、紧缩、附加和重叠法四种类型。同时,将其与拉萨话词汇进行对比,认为夏尔巴话词汇系统借词多源,有一部分特色词。上述特点支持其为藏语方言的一个土语[4]

二、语音描写与语音演变研究

藏语语音描写方面发表了4篇论文,包括清化鼻音、音系概况、新方言形成中的语音特征;语音历史演变方面发表了3篇。

黄晓辉、李京的《基于循环神经网络的藏语语音识别声学模型》探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练。同时根据声学模型输入与输出的关系,通过在隐含层输出序列上引入时域卷积操作来对网络隐含层时域展开步数进行约简,从而有效提升模型的训练与解码效率。实验结果显示,与传统基于隐马尔可夫模型的声学建模方法相比,循环神经网络模型在藏语拉萨话音素识别任务上具有更好的识别性能,而引入时域卷积操作的循环神经网络声学模型在保持同等识别性能的情况下,拥有更高的训练和解码效率[21]

王双成的《藏语的清化鼻音》指出藏语三大方言中,康方言及一些康方言和安多方言过渡地区的土语中存在常态鼻音和清化鼻音的对立,清化鼻音的来源是古藏语带s-的鼻音组合sm-、sn-、sȵ-、sŋ-。同时,还从声学特征、鼻腔气流、语音信号等几个方面对藏语常态鼻音、清化鼻音做了实验分析,并对藏语清化鼻音的历史来源及演变特征做了进一步探析[5]

朗杰扎西的《松潘译语(川一)语音现象初探》提出译语所记录的藏语音系可能系康方言为基础的偏向书面语的藏语音系,而非学界目前推定的安多方言(农区话);清代至今300多年来松潘一带藏语的某些语音已经发生变化[6]

卢克斯(Elie Roux)和希尔特(Hélios Hildt)的《古典藏语音节分解算法描述与校验》试图在古典藏语中界定格式良好的音节边界以进行拼写检查。音节的形式化使我们得以考察西部藏语与其他藏语语法书之间的细微差别。同时,作者对照他认为可靠的藏语词典和《甘珠尔(Kangyur)》来检查这些差异。研究了音节的分解方法,讨论了模棱两可的情况以及宗喀语音节的形成[11]

昂色拉加的《藏语玉树话(拉布)音系概况》通过对玉树境内的称多县拉布乡的调查,分析当地方言的声韵调系统,指出其清、浊和半浊等声母跟声调共存且具有严格的对应关系,韵母结构相对简单,部分声母、韵母在多音节词内有音变现象,可见,该方言的语音面貌整体呈现出一种过渡性的特征[7]

随着战争的深入持久,他们更加深刻地认识到,“北越敌人很了不起,他们对自己的任务从来矢志不移,他们跟法国人打了几十年的仗,不在乎再跟我们干上几十年。”

杨大雪的《藏语若尔盖话音系说明》从音系学和语音学的角度对若尔盖话的音系进行描写和分析。先简要介绍当地人文地理和研究现状,然后对声母、韵母及音高模式进行描写。最终认为若尔盖话音节结构比较复杂,声母和韵母比较多,没有辨义的声调,但是有固定的音高模式[8]

杨大雪的《藏语若尔盖话历时音变概况》运用历史比较法将若尔盖话与藏文进行对比,观察并总结其音变规律,具体描写了若尔盖话与藏文的语音对应情况,总体音变趋势是音节结构趋向简化,这样的音变为若尔盖话带来了一些同音词,为保持原有的音位对立,若尔盖话产生了一些补偿机制。从演变阶段来看,若尔盖话很可能处于演变的中间阶段,音节结构继续简化,并出现声调萌芽迹象。这种演变的原因可能是由于浊音的清化;也可能是由于与周边声调语言,如西南官话和汉语普通话的接触。具体的演变原因和机制,还有待进一步研究[9]

比亚莱克(Bialek)在《原始藏语复辅音sL-和sR-与古藏语的历史分期》在公元630 年代的文本中,早期的古藏语(EOT)一定有四个/s/+流音组成的复辅音:zr-、sr-、zl-和sl-。然而,在古藏语和古典藏语中,只发现sr-、zl-和sl-,而这些音都没有在现代藏语口语中得到证实。为了找出早期古藏语的zr-怎么变化的,作者追踪了古典藏语的sr-、zl-和sl-在现代方言中的反映。由于zland和sl发生了相互平行的变化,作者假设同样的类推也适用于sr,以确定EOT开始zr-可能朝着什么方向发展。在重建了西部古代藏语(WAT)和安多藏语(AT)中最保守的方言的发展之后,他将这些发现与历史事实并列,以帮助解释藏语方言的现代分布。OT文献中记录的历史事件,结合作者对古藏语早期语音变化的了解,确定重建变化年代的时间框架,从而使我们能够构建古藏语的第一个尝试性历史分期[10]

历史文化街区要以真实性为前提,并结合现代化的手段来进行开发。然而当前的历史文化街区往往是打着怀念历史的旗号,充斥了大量的恶性消费,甚至毫无历史沉淀,或是缺乏了古典历史这一保证,现代化气息过于浓厚,文化底蕴不足。在一些历史文化旅游街区,游客仅仅能够欣赏到一些老房子,其余均演变成一种现代销售模式,历史名人像,传统的艺术和历史传承信息全无,与历史紧密相关的产品也多为现代化产品。以旅游纪念品来吸引游客,但纪念品本身却存在严重的雷同性,现代景点旅游中,购物功能已经强势凌驾于其他一切功能之上,旅游的文化情趣已经在历史发展中悄然走失。

三、语音识别与合成

3.4 术后采取适宜的体位 置管后应尽量维持患儿头高足低位,可以防止导管异位。同时要注意对患儿头型的维护及塑造,既要防止PICC导管和正压接头压伤皮肤,又要防止患儿头型偏向一侧,影响日后形象。注意随时观察患儿,每隔2小时给予患儿翻身更换头部体位1次。患儿仰卧时可以给患儿垫U型护颈枕,保证患儿头部在正中位。

兰义湧等人的《基于条件随机场的藏文人名识别研究》首先分析了藏文人名的特点以及藏文人名识别的难点,在此基础上,利用条件随机场模型,分别提出了采用基于亚音节标注的藏文人名识别方法和分词与词性标注一体化的藏文人名识别方法[12]

《美国翻译标准质量指南》明确规定,翻译项目的各个阶段应由客户与翻译服务提供方共同实施,以得到符合商定规范的成品[5]。不论规模大小,所有的翻译项目都要求客户和项目经理互动。有效的互动对项目成功十分必要。项目越复杂,涉及的人越多,沟通就变得更为重要。项目经理,某些情况下与译员是同一人,除与涉及的内部或外部各方沟通进展之外,还主导整个项目,项目经理的职责是保证规范得到实施。因此,在必要时分,客户反过来也应向项目经理提供及时可靠的帮助。

周雁、西绕多吉的《面向藏语声纹识别的语料库建设》结合藏语特点,设计、建立一个面向藏语声纹识别的语料库,包含文本相关、文本无关两部分,文本语料来自新闻报刊、文学类、教育类、科技类、佛学类、历史类和传统文化五明类等文献资料,为藏语的声纹识别研究奠定一定的基础[13]

语音识别与语音合成是当前国内外研究的热点问题,藏语的识别与合成也非常活跃,这方面研究有11篇。

黄晓辉、李京、马睿的《藏语口语语音语料库的设计与研究》基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供可靠的数据支撑[14]

扎西吉等的《藏语判断句的句法结构树构建方法》指出句法分析的研究一直是中文信息处理的重要领域,也是自然语言处理中一个重要的基础性任务。在机器翻译、信息抽取、语义检索和问答系统等很多的领域都有着广泛的应用前景,并且对句法分析提出了迫切的需求。文章通过分析藏语判断句的特征,构造了其句法树生成规则,并通过PCFG解决句法歧义问题,即从歧义中选择概率最大的句法结构,最后通过CYK 算法进行解码自动生成判断句句法结构树[40]

3.1.4 吸痰深度 对照组应用的确定吸痰管插入深度的方法为长于气管导管端0.5~1 cm,碰到阻力后往上提0.5 cm,再提供负压吸引[13]。这种方法可能会发生组织损伤和炎症反应,吸痰导致的损伤可以引起肉芽组织形成,导致支气管狭窄,肺气肿和肺不张。Ahn等[14]采用深部吸痰法,深部吸痰法可以从吸出的痰液中找到大量的呼吸道黏膜柱状上皮细胞,说明深部吸痰法容易造成组织的损伤。故应用测量法,根据气管插管插入的长度来确定吸痰深度的办法可更有利于减少这些并发症。

拉巴顿珠等的《藏语同形异音词的消歧方法研究》指出随着藏语语音合成研究的深入,藏语同形异音词的读音问题成为影响合成系统自然度和可懂度的主要障碍。藏语同形异音词与汉语中多音词的性质有所不同,仅仅依靠词典不一定能解决问题。该文从藏语本身独有的语言规则和语音特点出发,依据《藏汉大词典》,在其所列出的常用藏语同形异音词的基础上,共收集整理了465个同形异音词,然后从372320 个句子文本中统计出了同形异音词在藏语文本中的出现频率及不同读音的使用频率,并深度辨析了藏语同形异音词的构词形式、分类以及在具体文本中出现的形式,最后结合实例提出了具体的消歧方法及实验结果,为语音合成系统的前端文本分析模块提供了有力依据[16]

珠杰等的《论元角色的藏语语义角色标注研究》借鉴PropBank 标注规范和语义角色分析理论,探讨了藏语语义角色标注问题。先按照PropBank标注规范对藏语简单句进行了语义角色标注;然后,依据藏语动词的语义类别,研究了藏文语义角色框架文件建设的可行性;最后,结合藏语动词分析理论和格语法理论,在PropBank 标记基础上研究了藏语特殊语义角色标记规范和标记方式[36]

王德欣等的《基于LBG 的藏语字母识别算法研究》采用VQ 技术中LBG来实现对藏文字母的识别,并使用MATLAB R2014a 进行算法的仿真。此算法对已经采集好的藏语30个字母的语音进行了语音预处理和端点检测,并提取了MFCC 特征参数,随后开展识别工作[18]

周楠等的《基于瓶颈特征的藏语拉萨话连续语音识别研究》基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC 的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMMHMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别效果[19]

都格草等的《基于谱减法的藏语语音减噪研究》认为语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。该文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果[20]

机械臂要完成相应的抓取工作,必须由步进电机来进行驱动,步进电机的作用是将电脉冲信号转换为相应的角位移或直线位移的设备,它利用电脉冲信号进行控制,当步进电机接收到一个电脉冲控制信号后,就转动一个固定角度或前进一段固定位移。

赵悦等的《临近最优主动学习的藏语语音识别方法研究》基于主动学习的藏语拉萨话语音语料选择方法,提出一种临近最优的批量样本选择目标函数,并验证其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少人工标注语料的工作量[22]

四、形态句法研究

2018 年藏语形态句法方面的研究论文不多,只有3篇,包括多动词谓语、示证以及差比等问题,每篇研究针对具体的范畴与结构,具有前沿性。

二是水污染严重蔓延。环保部发布的《2013中国环境状况公报》在全国198个地市级行政区开展的4 929个地下水水质监测点中,水质呈较差级及极差级的监测点一共占了57.3%。全国地表水国控断面的水质“总体为轻度污染”。大范围地表水、地下水被污染,并通过大气污染、渗透等方式,蔓延影响到饮用水水源,直接影响了饮用水源水质,威胁人们的饮水安全。

瞿霭堂、劲松的《藏语多动词谓语句的认知基础和模块化》从类型学的视角,使用认知语言学的方法,对藏语的多动词谓语句这类句子定性定义,并全面、系统、综合地从内容上探讨它的性质、特点和类型,从形式上探讨它的模块化及其语音变化方式,从历史上探讨它的形成和演变[23]

蔡斯勒(Bettina Zeisler)的《别相信你自己没熟练掌握的词形变化——拉达克藏语的示证、言者态度与不确定性(admirativity)》指出言者可以从认知、示证和态度三个不同的“视角”概念化表达一种情景。在描述这些概念范畴以及语法化过程中,一个概念如何扩展到其他两个概念因语言而异。现代藏语,包括拉达克方言被认为有语法化的示证范畴。然而,由于藏语中说话人的态度与示证语法化为一个标记,而基于感知的知识与基于推理的知识具有共同特征,所以藏语的“示证”系统不同于类型学中常见的类型。以这一发展脉络为起点,似乎在类型上相当罕见的“示证系统”是不承诺(或不确定)的词汇标记:助词h.dug[24]

汪岚的《德钦藏语的差比句》指出德钦藏语差比句的基本语序类型为“比较基准(St)+比较标记(M)+比较结果(A)”,不同的句式中语序会有不同的变化:在差比句的肯定形式中典型结构为St+M+S+A,否定形式与是非问形式的语序分别为S+St+M+(NEG)A(NEG)与St+M+S+(INTER)A(INTER)。差比标记由古藏语方位词sɡaŋ(上面/在……上面)语法化而来[25]。

五、双语教育

李永斌的《西藏小学双语教学的衔接问题及对策——以拉萨市的调查为例》从拉萨市小学的调查出发,讨论西藏小学生学前阶段的双语基础,小学阶段的校园、家庭、生活的双语特点及其水平等,分析并提出西藏小学双语教学的衔接问题及相应对策。强调重视学前双语教学尤其是学生普通话能力的提高;重视小学一至三年级普通话听说与藏语读写能力的培养。注重寓教于乐,丰富不同年级学生的普通话交流。小学四至六年级应注重学生藏汉双语特别是普通话读写能力的培养[26]

甘永涛的《西藏双语教育政策绩效及其影响因素——基于拉萨、山南两市10所中小学的调查》通过问卷调查、访谈、文献法等研究方法选取西藏拉萨、山南两市10所中小学为例,对以上指标进行分析,得到研究结果并发现问题,进而给出相应的政策建议,以完善双语教育政策,实现少数民族双语教育更高质量的发展[27]

陈兵兵的《藏汉双语专业学生藏文学习探索研究》运用文献查阅、访谈和问卷调查研究方法,对物理学藏汉双语专业学生在藏文学习能力方面进行了探索研究。文章首先介绍了甘孜藏区双语教育现状和双语师资情况,然后根据问卷调查对双语学生藏文学习能力现状进行分析,找出原因,最后,结合学校的实际情况制定相应的解决对策。通过该文探索研究,期望找到理科双语学生藏文学习的有效方法,为以后类似问题的研究提供一些经验[28]

陈建林的《藏族学生英语三语写作中母语和汉语作用研究》藏族学生英语三语(L3)习得受到母语藏语(L1)和第二语言汉语(L2)的双重影响。以多语交互影响研究者提出的类型近似模型、第二语言主导模型和累积增强模型为理论基础,收集L2水平不同的藏族L3学习者的作文语料,从流利度、词汇丰富度和词语错误率等三个维度对比分析。结果表明L1 和L2 在L3 写作中发挥了不同的作用;L1 在作文构思阶段发挥作用;L2 水平越高,词汇错误率越低,但L2 水平在词汇丰富度上并不具有区分力;教学媒介语对L3 也会产生一定影响。这一结论对于藏区英语教学具有一定的启示[29]

5.资源节约型、环境友好型社会建设取得重大进展。报告提出:“主体功能区布局基本形成,资源循环利用体系初步建立。单位国内生产总值能源消耗和二氧化碳排放大幅下降,……生态系统稳定性增强”[1]。

马启龙的《现状、问题与改革:问诊甘肃省藏区藏汉双语教育》是一篇“藏汉双语教育研讨会”的综述文章,认为甘肃省藏区藏汉双语教育以藏语为主、以汉语为主和普通类三类教育模式并存;部分县市的小学、中学的师生比例较低。指出了甘肃省藏区藏汉双语教育存在的问题:双语教师紧缺;双语教师专业发展缓慢;双语辅助教材匮乏;县乡差异明显;高考升学录取率低;乡级学校硬件设施薄弱。分享了藏汉双语教育实践探索,即专门成立双语协调机构;明确办学定位、目标和特色;加强学校双语文化建设工作;双语教师专业发展的具体办法;深入开展民族团结教育。提出了推进甘肃省藏区藏汉双语教育改革的思路:深入推进义务教育均衡发展;进一步认识双语教育的重要意义;解决双语教师结构性短缺问题;加快双语教材和教辅资料建设;加强双语教研教改[30]

徐苏的《藏-汉-英三语视域下藏族学生英语教学模式探究》在“三语习得”视域下分析了藏族学生英语学习特征及现状,提出了有针对性地开展以母语藏语为媒介语的英语教学策略,以及激发藏族学生英语学习动机和培养藏族学生多语言心理及多文化意识的途径[31]

六、语言接触与影响

王宝红的《“御制五体清文鉴·汉藏文鉴专辑”中的藏语汉借词》以《御制五体清文鉴·汉藏文鉴专辑》中所收藏文词目中有不少借自汉语的词,或含有汉语音译的成分,这些藏语汉借词或借用成分,有些在中古已出现,有些则是元明以后进入藏语的。部分藏文词语中既含满语成分,又有汉语或藏语的成分,从而形成满藏或满藏汉“合璧词”。《汉藏文鉴专辑》中的藏语汉借词或汉语成分的数量并不算多,从词性来看,借用的词语或构词成分以名词性成分居多,动词借用甚少。藏语汉语词有些是汉文化中独有的词语,所指事物是藏文化所缺少的。藏语在吸收汉语借词时,会改造汉语的语音以适应藏语的语音系统。搜罗整理这些资料,分析这一时期藏语书面语吸收汉语的一些特点,有助于清代藏语书面语的研究,也有助于今人了解这一时期藏汉语交融的程度[32]

李永斌的《藏汉语码混用词类与结构》指出藏汉语码混用在词类上,首先以名词为主,其次是数词和量词,其他词类的混用较少。混用的汉语语码在藏语句子中主要处在主语、谓语和宾语位置,相关后缀未见与所混用的汉语语码结合表示语法关系,相关虚词则可在混用语码前后表示某种语法意义[33]

周洋的《云南水磨房话的格标记及其来源》认为云南省香格里拉市三坝乡安南村的水磨房话是一种词汇系统以汉语为主、语法系统高度藏语化的混合语。水磨房话具有严格的OV 型基本语序和一套后置词格标记系统,主要标记的是施事-工具-从格、受事-与事格、伴随格、替代格、比较格和处所格等六个大类。其格标记系统的形式来源以内部发展为主、外部借用为辅[34]

2018年1月,复旦大学钟扬教授基金成立。这个以他的名字命名的基金,是他的家人共同决定的,捐出的交通事故赔偿金用以鼓励更多热爱科研事业、热爱公益事业、热爱教育事业并具有奉献精神的师生。

七、自然语言处理

自然语言处理也是当前的研究热点之一,2018年自然语言处理(NLP)进一步在藏语研究中应用,共有12篇文章涉及这一领域。

李博涵等的《基于深度学习的藏文分词方法》采用多种深度神经网络模型,包括循环神经网络(RNN)、双向循环神经网络(Bi RNN)、层叠循环神经网络(Stacked RNN)、长短期记忆模型(LSTM)和编码器—标注器长短期记忆模型(Encoder-Labeler LSTM)。多种模型在以法律文本、政府公文、新闻为主的分词语料中进行实验。实验数据表明,编码器—标注器长短期记忆模型得到的分词结果最好,分词准确率可以达到92.96%,召回率为93.30%,F值为93.13%[35]

卓嘎等的《藏语语音时域参数提取关键技术研究》介绍了藏语时域语音信号处理过程中的语音特征参数及其提取关键技术,包括短时平均能量、短时平均幅度、短时过零率、短时自相关函数和端点检测等算法。分析了语音的时域特征参数在藏语语音分析中的实际应用[17]

才华等的《论藏文格结构体及其语法功能》通过Fillmore 格语法与藏语传统语法的比较研究,提出一种新的藏语语法单位即格结构体,并证实格结构体才是藏语句子最直接的组成成分的观点。该研究对藏语语法研究和藏语自然语言处理具有一定的参考价值[37]

万福成等的《融合事件特征及语义角色标注的藏文信息抽取技术》在藏语短语句法分析的基础上,融入功能语义信息线索,采用在藏语短语句法树库的基础上加入语义角色标注的方法,并融合事件触发词信息,对藏文信息进行抽取,并通过实验进行了对比分析。该文事件特征融合与已标注信息对藏文信息抽取有所帮助,该模型可以很好地应用于藏文信息抽取工作[38]

仁青卓么的《藏语动词短语结构类型统计研究》以藏语动词短语的结构类型、语法规则、语义分析等内容为主,建立了一个以结构和句法特征为主,兼顾语法和语义信息的藏语动词短语信息库,运用语料分析软件对提取的9962个藏语动词短语进行了计量分析,通过分类、比较、分析,得出一个较为完整的短语结构功能分类体系[39]

张夏夏和王蓓的《藏语拉萨话中焦点和疑问的韵律编码方式》请8位藏语拉萨话母语人自然说出两个目标句,包括疑问和陈述两种语气以及4种焦点条件(中性、句首、句中和句末焦点),通过音高、时长参数的声学和统计分析,考察了拉萨话中焦点和疑问的韵律编码方式。焦点在疑问句和陈述句中相同的编码方式是:焦点词音高升高、音域扩大且时长延长,而焦点前基本不变。不同的是:陈述句中焦点后有明显的音高下降和音域压缩,但疑问句中焦点后压缩不稳定。与相同焦点条件的陈述句相比,疑问语调整体有升高,焦点后的音高上升更稳定;但焦点词的音高在两种语气间没有明显区别。认为焦点后音高更多的是为了实现疑问语气而升高,而不是为了突显焦点而压缩;焦点词的音高不具备区别语气的功能[15]

头旦才让等的《藏语依存树库的构建技术研究》在收集和整理1 万句藏语分词标注语料基础上,研究了藏语依存树库构建技术和方法,根据指定的藏语依存句法标注集和藏语依存句法标注工具,建立了规模为1 万句、词语总数为119,510 个、平均句长为12 个词的藏语依存树库,并对建立的藏语依存树库进行了词类分布统计[41]

尕藏扎西、安见才让的《基于CYK的藏语句法分析器研究与实现》根据常用的藏文短语,总结出一套基于短语结构语法的藏文单句规则库,然后在Windows 平台上用C#实现基于CYK算法来分析和生成句法树的藏语句法分析器。实验结果表明,在人工标注的测试集上,藏语单句的句法分析准确率达到了81%[42]

绿筠愁眉不展:“姐姐说得是,我何尝不知道呢?如今皇上为了她的身份好听些,特特又指了上驷院的三保大人做她义父,难怪她更了不得了。”

闫晓东、黄涛的《基于情感词典的藏语文本句子情感分类》通过借鉴中文及英文情感分析中基于极性词典的方法来对藏文句子文本进行情感分析。首先通过人工的方法构建了一个全面、高效的极性词典,包括基础词词典、否定词词典、双重否定词词典、程度副词词典以及转折词词典,将极性词与修饰词组合成极性短语作为极性计算的基本单元,并研究了转折词对句子情感极性的影响,提出了一种基于极性词典的藏语文本句子情感分析方法。实验结果表明,利用该文构建的词典进行的倾向性分析效果良好[43]

肖维霖的《基于文献计量的藏语自然语言处理研究分析》通过以中国知网为数据源,下载了所有与藏语自然语言处理相关的文章,用文献计量学的方法从论文数量规律、机构发展、主题研究、作者分析四个方面初步分析了我国在藏语自然语言处理方面的研究发展情况[44]

为打通农商行进入资本市场的渠道,应由上级部门(如省联社)等进行主管,协同各区域农商行进行集中出资,来设立农商行股权交易信息中心,实现股权登记、质押、挂牌、托管等多功能,同时结合当地农村区域发展状况,可以将债权、土地承包权、金融资产及林权等在交易中心来办理交易及托管,将其打造成适用于农商行的战略平台。除此之外,农商行应建立健全股权流通的相应机制,完善交易流程及运行规则,对股权转让、设置及信息披露来进行明确规定,严格规范股权在交易中的操作细则,将制度进行市场化、透明化,使得广大股东充分明晰自身的权益,构建科学规范、合法、高效的农商行股权流动机制,实现股权的正常化,发挥农商行股权的真正价值。

才藏太等的《面向语言信息处理的藏语短语及其分类方法研究》在藏语短语与藏语句子的界线研究的基础上,根据藏语信息处理的特点和要求,按照语法功能和便于计算机自动分析和处理的原则对短语进行分类,并规定了信息处理中藏语短语类别单位的标记代码[45]

完么扎西、尼玛扎西的《现代藏语名词性短语结构规则研究》在深入研究藏语语法的基础上,通过对藏语真实语料的统计和分析,归纳了现代藏语名词性短语的2种典型结构类型及9种具体组合模式,并面向藏语计算语言学的实际需求,借鉴现代汉语短语结构规则研究方法,尝试以形式化的方式对现代藏语名词性短语的整体性质及对其内部组成成分约束条件进行了全面的描述[46]

八、翻译与应用研究

翻译涉及文献、文学、电影、人名、地名等内容,这里仅介绍几篇古藏文读译,人名译名规范化方面的论文。语言应用研究包括语言使用现状、语言接触、语言习得等问题。

陈践的《吐蕃古藏文读译窥见》从五个方面提供阅读和翻译古藏文文献的参考意见,不仅注意古藏文相同发音部位舌根音不送气清音与送气清音、浊音可以交替,还要了解敦煌汉译藏的文献是解读“旧词”的最佳辞典。同时,她认为了解一些安多藏语对解读古文献有裨益,注重原文的历史背景和译文的逻辑关系,要勤向有生产经验的藏族同胞讨教[47]

巴德群珠的译文《了解象雄语:最基本的途径》在涉及藏学的文献中不时会讨论到象雄语,象雄语是否是一种死语言。当然从某种意义上说,只要还有人以任何方式使用一种语言,或者尝试学习和使用一种语言,就不能视之为完全死亡。研究者要考虑的问题是:今天我们是否还有可能了解象雄语这种在7世纪或8世纪吐蕃西部象雄王国没落前后绵延几世纪的语言。试图回答这一问题需要考虑这种语言早期存在的证据,以及手稿传承、词汇量、藏缅语对比之中的问题,还要考虑专注于词汇而非形态学,用《斯巴卓浦》来说明当前面临的各种障碍。除了这些问题之外,在探索知识的过程中要秉持一定的乐观精神[48]

建立和完善水权制度,明晰水资源产权,实行资源有偿使用制度,并在此基础上建立一个利用市场手段和政府宏观调控进行管理的水市场,让水价真正反映水资源的稀缺程度,让水市场起到优化配制水资源的作用。应加快完善水价形成机制,建立健全由资源成本、工程成本、环境成本构成的节水型水价体系,进一步规范城市水价及收费的管理办法,保护用户利益,促进城市水务产业的健康发展。

龙从军、豆格才让、刘汇丹的《汉-藏人名用字音译规则研究》指出随着信息技术的发展,藏文在互联网上广泛使用,政府主办的报刊也逐渐有了网络版,大量的汉文材料被翻译成藏文。翻译者在音译汉文人名用字时,未能遵从统一的音译规范,导致同一人名存在多种音译形式。该文统计了五家藏文网站,发现一些公众人物的人名用字音译形式比较混乱,不但影响信息交流,而且不利于藏文自然语言处理。该文详细分析了音译混乱的原因,提出在汉-藏人名用字音译时,需要制定一一对应的音译原则;同时注重原则实践的可行性和一致性。翻译者在音译汉-藏人名用字时必须严格遵从音译原则;推行音译原则还需要依靠相关政府机构和部门[49]

仁增等的《藏语人名汉译规范化研究》指出人名是特殊词语,是一个民族文化的载体,其中蕴含着多种文化信息。因此,其翻译不同于一般词语的翻译,应特殊对待。但进行藏语人名汉译时,由于缺乏统一的译写规则与管理等原因,译者各行其是,造成了一定的混乱,这既不利于交流和藏文化的健康发展,也不利于汉语文的规范。该文就此展开研究,对藏语人名汉译及其规范化问题提出了自己的初步看法,旨在人名翻译趋于规范[50]

王富银、史文洁的《云南省迪庆州藏族语言使用现状调查研究》以云南省迪庆州的藏族为研究对象,从藏语、汉语方言和普通话使用情况、语言习得状况、汉语学习途径、学校语言教育状况和语言态度五个方面,调查云南省迪庆州藏族的语言使用现状。他们认为迪庆藏族尤其是年轻一代的藏语使用能力有弱化倾向,汉语在交际中的地位有所增强。造成这种现象的原因是多方面的,既有社会发展与民族杂居的因素,也有教育水平提高和语言态度转变的因素。进行合理的少数民族语言规划,釆取必要的语言政策和行动措施,是保护、扶持和促进少数民族语言传承与发展的有效途径[51]

甘永涛等的《学生个性特征对藏语态度和习得的影响:四川省甘孜藏族自治州调查》从语言态度的角度,对学生语言习得中个体差异进行了实证分析。采用单因素方差分析(ANOVA)方法分析了个体特征对语言态度和语言学习的影响。最后,对语言态度和语言习得数据进行回归分析[52]

对工件裂纹形貌检查,选取开裂处切取一个单齿,暴露裂纹面,裂纹面宏观检验,裂纹面形貌一致,呈现应力型裂纹形貌,如图3所示。

九、结 语

从2018年国内外藏语研究的最新动态和前沿问题研究来看,藏语研究在本体研究方面主要集中在语音的描写和语音演变的研究上,词汇、语法以及语言接触方面研究成果较少。双语教育、语音识别与合成、自然语言处理等应用研究越来越活跃,其成果越来越多。未来研究重点仍将是藏语语音识别与合成、机器翻译、人工智能等领域,然而,藏语语音、词汇、语法本体研究还需要进一步加强。

[参考文献]

[1]施向东.《同文韵统》所见清初藏语概貌[J].民族语文,2018(1).

[2]陈荣泽.西藏民族大学的藏语研究:意义、内容与展望[J].西藏教育,2018(3).

[3]铃木博之.康巴藏语崩波岗方言群及其语音特征[J].四川民族学院学报,2018(5).

[4]尹蔚彬.夏尔巴话词汇构造及特点[J].民族语文,2018(5).

[5]王双成.藏语的清化鼻音[J].民族语文,2018(2).

[6]朗杰扎西.《松潘译语》(川一)语音现象初探[J].中央民族大学学报,2018(5).

[7]昂色拉加.藏语玉树话(拉布)音系概况[J].西藏研究,2018(1).

[8]杨大雪.藏语若尔盖话音系说明[J].中国民族博览,2018(6).

[9]杨大雪.藏语若尔盖话历时音变概况[J].中国民族博览,2018(8).

[10]Bialek,Joanna.The Proto-Tibetan clusters sL- and sRand the periodisation of Old Tibetan[J].Himalayan Linguistics ,2018(2).

[11]Roux,Élie and Hildt,Hélios D.Algorithmic description of the decomposition and checking of a Classical Tibetan syllable[J].Himalayan Linguistics ,2018(2).

[12]兰义湧,龙从军,赵小兵.基于条件随机场的藏文人名识别研究[J].中央民族大学学报(自然科学版),2018(1).

[13]周雁,西绕多吉.面向藏语声纹识别的语料库建设[J].计算机工程与科学,2018(11).

[14]黄晓辉,李京,马睿.藏语口语语音语料库的设计与研究[J].计算机工程与应用,2018(13).

[15]张夏夏,王蓓.藏语拉萨话中焦点和疑问的韵律编码方式[J].清华大学学报(自然科学版),2018(4).

[16]拉巴顿珠等.藏语同形异音词的消歧方法研究[J].中文信息学报,2018(7).

[17]卓嘎等.藏语语音时域参数提取关键技术研究[J].电脑知识与技术,2018(8).

[18]王德欣等.基于LBG 的藏语字母识别算法研究[J].电脑技术与软件工程,2018(20).

[19]周楠等.基于瓶颈特征的藏语拉萨话连续语音识别研究[J].北京大学学报(自然科学版),2018(2).

[20]都格草等.基于谱减法的藏语语音减噪研究[J].广西科学院学报,2018(1).

[21]黄晓辉,李京.基于循环神经网络的藏语语音识别声学模型[J].中文信息学报,2018(5).

[22]赵悦等.临近最优主动学习的藏语语音识别方法研究[J].计算机工程与应用,2018(22).

[23]瞿霭堂,劲松.藏语多动词谓语句的认知基础和模块化[J].民族语文,2018(5).

[24]Zeisler,Bettina.Don’t believe in a paradigm that you haven’t manipulated yourself——Evidentiality,speaker attitude,and admirativity in Ladakhi[J].Himalayan Linguistics ,2018(1).

[25]汪岚.德钦藏语的差比句[J].语言研究,2018(3).

[26]李永斌.西藏小学双语教学的衔接问题及对策——以拉萨市的调查为例[J].中国藏学,2018(4).

[27]甘永涛.西藏双语教育政策绩效及其影响因素——基于拉萨、山南两市10所中小学的调查[J].民族高等教育研究,

2018(4).

[28]陈兵兵.藏汉双语专业学生藏文学习探索研究[J].四川民族学院学报,2018(4).

[29]陈建林.藏族学生英语三语写作中母语和汉语作用研究[J].外语教学理论与实践,2018(3).

[30]马启龙.现状、问题与改革:问诊甘肃省藏区藏汉双语教育[J].民族高等教育研究,2018(1).

[31]徐苏.藏-汉-英三语视域下藏族学生英语教学模式探究[J].教育观察,2018(16).

[32]王宝红.《御制五体清文鉴·汉藏文鉴专辑》中的藏语汉借词[J].西藏民族大学学报,2018(5).

[33]李永斌.藏汉语码混用词类与结构[J].青海民族研究,2018(2).

[34]周洋.云南水磨房话的格标记及其来源[J].方言,2018(3).

[35]李博涵等.基于深度学习的藏文分词方法[J].计算机工程与设计,2018(1).

[36]珠杰等.论元角色的藏语语义角色标注研究[J].高原科学研究,2018(3).

[37]才华等.论藏文格结构体及其语法功能[J].西藏大学学报,2018(2).

[38]万福成等.融合事件特征及语义角色标注的藏文信息抽取技术[J].广西师范大学学报(自然科学版),2018(2).

[39]仁青卓么.藏语动词短语结构类型统计研究[J].西北民族大学学报(自然科学版),2018(2).

[40]扎西吉等.藏语判断句的句法结构树构建方法[J].西北民族大学学报(自然科学版),2018(4).

[41]头旦才让.藏语依存树库的构建技术研究[J].高原科学研究,2018(3).

[42]尕藏扎西,安见才让.基于CYK的藏语句法分析器研究与实现[J].计算机时代,2018(6).

[43]闫晓东,黄涛.基于情感词典的藏语文本句子情感分类[J].中文信息学报,2018(2).

[44]肖维霖.基于文献计量的藏语自然语言处理研究分析[J].青藏高原论坛,2018(1).

[45]才藏太等.面向语言信息处理的藏语短语及其分类方法研究[J].中文信息学报,2018(9).

[46]完么扎西,尼玛扎西.现代藏语名词性短语结构规则研究[J].高原科学研究,2018(1).

[47]陈践.吐蕃古藏文读译窥见[J].西藏民族大学学报,2018(6).

[48]巴德群珠译.了解象雄语:最基本的途径[J].国外藏学,2018(1).

[49]龙从军,豆格才让,刘汇丹.汉—藏人名用字音译规则研究[J].中文信息学报,2018(3).

[50]仁增等.藏语人名汉译规范化研究[J].青海社会科学,2018(1).

[51]王富银,史文洁.云南省迪庆州藏族语言使用现状调查研究[J].现代语文,2018(9).

[52]Gan,Yongtao,et al.The Impact of Students'Personal Characteristics on Tibetan Language Attitude and Acquisition: A survey of the Ganzi Tibetan Autonomous Prefecture in Sichuan Province,China[J].Neuro Quantology ,2018(5).

New Advances in the Study of the Tibetan Language in 2018

Huang Chenglong
(The Institute of Ethnology and Anthropology,Chinese Academy of Social Sciences,Beijing,100081)

Abstract: This paper introduces and reviews research trends on the Tibetan language in 2018,such as description and analysis of the Tibetan or dialects,phonological description and phonological changes,speech recognition and synthesis,morphosyntax,natural language processing,translation and bilingual education,etc.This article not only can help to understand research orientations and trends in the Tibetan language,but can further promote study of the Tibetan language as well.

Key words: Tibetan language and scripts;areal study;research frontiers

中图分类号: H214

文献标识码: A

文章编号: 1003-8388(2019)04-0061-09

收稿日期: 2019-05-09

作者简介: 黄成龙(1968-),男,四川茂县人,现为中国社会科学院中国少数民族语言研究中心副主任,中国社会科学院民族学与人类学研究所研究员,主要研究方向为语言类型学、纪录语言学以及汉藏语言形态句法。

基金项目: 本文系中国社会科学院民族学与人类学研究所创新工程重点项目“茶马古道语言学调查研究”(项目号:2019MZSCX005)的阶段性成果。

[责任编辑 陈立明]

[校 对 梁成秀]

标签:;  ;  ;  ;  ;  

2018年藏语研究前沿论文
下载Doc文档

猜你喜欢