基于投射的藏语语义依存分析研究 *
夏吾吉1,2,华却才让1
(1.青海师范大学藏文信息处理教育部重点实验室,青海 西宁 810008;2.青海师范大学民族师范学院,青海 西宁 810008)
摘 要: 藏语是语序非常灵活的一种语言,藏语词法分析和句法分析等浅层研究不能很好地满足藏语自然语言理解的需求。从简单句型的藏语句子出发,研究了基于投射的藏语语义依存分析,构建了藏语语义依存树库,设计了语义依存弧类型分析特征模板。最后通过最大熵分类模型,对人工分析过的语义依存弧的句子进行依存弧的类型分析并进行标注,为今后的语义依存分析提供新的思考视角和更好的理论支撑。
关键词: 藏语语义;投射;语义依存树库;最大熵模型
1 引言
从自然语言处理的视角来看,语义依存分析是理解自然语言的一个有益探索。自然语言处理系统中,既要识别文本的实体,又要分析文本的语义关系。语义分析是将人类所使用的自然语言转化为计算机使用的能够反映其意义的形式化描述,它不但是理解自然语言根本性的问题,也是自然语言处理的热点和难点,包括浅层的语义分析和深层的语义分析。语义依存分析是深层语义分析的实现方式,是建立在依存理论基础上的对构成句子的词与词之间语义关系的进一步分析。语义依存分析的研究是以依存句法分析为基础的深层研究,综合利用了词法分析、句法分析和语义角色标注等浅层语言信息。相比依存句法,语义依存所描述的含义不受字面的影响,融合了句子的依存结构和语义信息,并能直接表达语义的本质。对自然语言理解来说,句子中的动词和形容词是理解句法结构以及句子意义的中心,进一步找出中心词周围的其他词语,分析这些词语与中心词之间的修饰关系,就可以理解句子的句法结构及意义。目前,中文和英文等主流语言的语义分析方面,相关研究者已经做了不少研究,并且形成了较为系统的语义分析研究体系[1,2]。
饭要一口一口吃,读书也得有个轻重缓急。临时性问题,可以查阅式阅读。如果是为了长远的专业发展,则需要系统阅读。我设计了班主任阅读的四个阶梯,对应分类,每一个阶梯均难易搭配,是一个相互补充、相互支撑的系统。第一阶梯,基本著作,班级管理常识性知识和技巧。第二阶梯,主题穿越:沟通艺术、案例分析、主题班会、教育叙事、生涯教育、班级活动、家校合作、课程开发、问题生转化等。第三阶梯,理论研读:教育学、心理学、脑科学等。第四阶梯,视野拓展:文学艺术、哲学宗教、史学国学和其他类别。
藏文信息处理研究工作开始于20世纪80年代,经过了字处理[3]和词处理[4]等研究阶段,现已全面开展了句子处理[5]的研究工作。语义依存分析是句子处理研究的重要任务之一。从藏语自然语言处理的实际需求出发,为藏语自然语言处理研究工作提供一个系统的藏语语义依存标注体系和规模相当的藏语语义依存分析语料树库,对藏文信息处理的发展是至关重要的。相关藏语语义依存方面,文献[5]实现了基于判别式的藏语的依存句法分析;文献[6]采用词对依存分类模型开发了半自动依存句法标注工具软件;文献[7]设计了符合藏语语法体系的句法和语义标注关系体系;文献[8]分析了传统藏文文法中的逻辑格和接续特征的语义映射关系。此外,通过文献检索目前还未见到全面分析藏语句子的语义依存关系分析的研究结果。上述文献只对藏语进行了词法分析、句法分析及语义角色标注等研究分析,这些研究都属于藏语自然语言处理的浅层分析。藏语自然语言处理的目标是在机器能够理解藏语言的基础上实现相应的操作,但目前这些研究还处于基础性的浅层分析状态。对于计算机来讲,如何能够真正理解藏语的语义,且像人的大脑一样分析和思考问题是非常难于突破和极具挑战的。要解决这些问题,必须对藏语自然语言进行更深层次的研究,不能仅仅停留在浅层的分析和研究上。因此,值得进一步去研究更深层次的语义依存分析。
本文将借鉴中文和英文的研究方法,结合藏语自身的语法结构特征和构词规律,确定藏语语义依存关系类型,并根据语义依存关系类型,构建藏语语义依存树库,通过最大熵模型分析基于投射的藏语语义依存关系。
你是左撇子吗?如果答案肯定,你就属于在人群中只占十分之一的少数派。在学习、生活中,也许你曾遭遇过一些尴尬和痛苦,比如,吃饭的时候怕和你的筷子打架,谁都不愿意挨着你坐。随着社会的开明程度不断提高,左撇子们的境遇变得越来越好,甚至在某些领域还独占鳌头。比如,在体育竞赛中,左撇子的击剑手、棒球投球手、拳击手,相比于同实力右撇子选手,则更容易获得胜利。再来看一个事实,在美国的倒数前7任总统中,有4位都是左撇子——福特、老布什、克林顿和奥巴马。左撇子并非生理缺陷,而是正常的遗传现象,科学家称它为“偏侧优势”。
2 藏语语义依存框架
传统的藏语语法体系中格分为: “(体格)”“(业格)”“(主格)”“(为格)”“(从格)”“(属格)”“(于格)”“(呼格)”等8种。藏语中的格助词是通过特定的语法关系来表示句子中各个词语之间的各种结构关系[9]。按语法形式分只有“(主格)”“(从格)”“(属格)”和“(于格)”4种。格助词的接续形式表示藏语句子中词语与词语之间的结构关系,并具有格以及助词的双重性质。经大规模藏语语料统计分析,在语料库中格词类的频度最高,其通用性较稳定,句子中各个成分之间的层次结构关系与格助词的接续规则相关联[10]。
1056 高分辨率磁共振成像分析基底节区孤立性缺血性脑卒中病因 王 诺,张首龙,秦鲁平,朱 宣,张敏敏,邓本强,吴 涛
投射语义依存分析模型的核心任务是保证依存弧没有交叉的前提下,判断句子中任意2个词之间是否存在有向语义依存弧,确定词与词之间存在支配与被支配的有向依存弧以后,需要解决的关键问题是如何获取语义依存关系的类型,并如何在有向语义依存弧上标注其关系类型,这部分工作类似于分词后对词语进行词性标注。本文采用最大熵模型来判断藏语投射语义依存关系类型,该模型既能够较为容易地对分类问题进行建模,又能够输出各个类别较为客观的概率值,以便于后续的推理步骤使用[13],最大熵模型还可以解决隐马尔科夫模型HMM(Hidden Markov Model)和N元文法等模型无法实现的长距离依存问题。
以上所描述的语义依存关系中的“Agt(/vt_13,/nr_2)”,它所表示的含义为是“/nr_2”是“/vt_13”的施事者,或者说“/vt_13”和“/nr_2”之间存在施事关系,标记为“Agt”,其中“/vt_13”是“/nr_2”的支配词,“/nr_2”是“/vt_13”的被支配词。
以上依存关系可以转换为依存树层次结构模式,如图1所示。
Figure 1 Hierarchy of Tibetan projection semantic dependence analysis
图1 藏语投射语义依存分析层次结构图
图1中共有15个节点和14条边,“Root”是整个句子的根节点,具有1个向下依存关系“Root”,而“/vt”是全句的核心节点,它具有5个向下依存关系:“Agt”表示施事关系,“mFreq”表示频率角色,“Datv”表示涉事关系,“Cont”表示客事关系,“mPunc”表示标点标记。“/nr”“/dp”“/nn”“/nn”和“/lz”的主词或支配词是“/vt”;“/nr”有2个向下关系:“Nmod”表示名字修饰角色,“cAuxm”表示作格标记,“/nn”和“/gx”的支配词是“/nr”;“Poss”表示领事关系,“mMaj”表示多数标记。
3 投射的藏语语义依存树库
预测一个依存词对是否为确定某一个语义依存关系时会涉及到一些特征条件因素,那么定义向量X ={x 1,x 2,…,x n }为这些因素所构成的向量,向量Y ={y 1,y 2,…,y n }为语义依存关系类型构成的向量。p (y |x )是系统将依存词对的某个特征预测为某一个语义依存关系的概率。最大熵模型中,p (y |x )在满足一定的约束条件下,使下面所定义的熵值最大:
Figure 2 Flow chart of tree library construction
图2 树库构建基本流程图
现阶段市政建筑工程中最为常见的问题为塌方。地基开挖施工需要开挖基坑,在此过程中必须根据施工现场的土层状况进行,不同的土层使用相对应的施工技术。同时还要做好坡度控制,配合必要的支护措施,才能够保证基坑不会在外力作用下出现不稳定的情况,避免变形和塌方事故。地基塌方不仅会影响上方建筑,还会威胁到周围的建筑安全。
4 藏语投射语义依存分析模型
藏语句子中,除了格助词以外,虚词也体现着重要的依存结构关系,句子中的格助词和虚词的结构关系以及接续规则是制定依存标注规范的重要依据,是对句子进行依存标注时必须遵循的规则。因此,确定藏语句子中词语之间的依存关系时,从藏语特有的语法形式入手,借鉴了文献[11]中提出的中文依存体系和文献[12]中提出的英语依存标注制定经验,以藏语自身的特征和语言现象作为依据,制定了施事关系、涉事关系、当事关系、客事关系、频率角色、时间标记等62种依存弧类型,同时采用4元组(h ,e ,r ,d )表示藏语句子中词语与词语之间的语义依存关系。该4元组的含义是句子中词语h 支配词语d ,e 表示从词语h 指向词语d 的依存弧,r 为依存弧e 的语义标签,即h 指向d 的依存弧类型。实际标注时,找出句子中存在语义关系的依存词对,用括弧的层次级别来区分词对中的支配词和被支配词并确定该词对的依存关系类型后,统一标注至被支配词的括弧右侧。比如:句子“/nn_1/nr_2/gx_3/dp_4/nr_5/gz_6/nn_7/rz_8/gl_9/nn_10/gz_11/nn_12/vt_13/lz_14(尼玛老师经常给自己的学生们教藏民族的舞蹈)”中的语义依存关系可描述为:“(((/nn)Nmod/nr (/gx)cAuxm)Agt (/dp)mFreq ((/nr (/gz)cAuxm)Poss/nn (/rz (/gl)cAuxm)mMaj)Datv ((/nn (/gz)cAuxm)Poss/nn)Cont/vt (/lz)mPunc)Root”。
表1中father 表示父节点,child 表示子节点;word 表示词形,pos 表示词性;prevOfchild 及flwOfchild 分别表示子节点的前1个词与子节点的后1个词;prevOffather 与flwOffather 表示父节点的前1个词及父节点的后1个词。d 表示依存词对之间所包含的其他词的个数。r 表示父节点与子节点的语义依存弧类型,语义依存弧类型特征计算了依存词对father 与child 间依存弧的语义依存关系类型为r 的概率。
语义依存树中构成句子的词与词之间的依存弧相互不交叉,也就是说句子中一个词语及其所有的子节点都在一个连续的子树上。藏文信息处理面临的最大困难和障碍在于词法分析、句法分析、语义分析等知识的缺乏,建立带有各类关系标注附加信息的语料库正是解决这个瓶颈的有效方法。目前,在藏语自然语言处理领域,藏语语料库的加工和设计理论成为人们研究的热点,藏语语料库的建设也向大规模、多层次不断发展。除了较早出现的分词和词性标注以外,句法关系标注和语义关系标注等形式也逐渐受到重视。构建藏语语义依存树库是深入研究藏语自然语言处理的基础,基于藏语语料库的方法对藏语自然语言处理的各个方面产生了重大的影响。在各种语料资源中影响最大的是标注语法信息的数据,语义依存标注后的藏语句子是一个树形结构,所以这样的语料库称为语义依存树库。由于对句子进行语义依存标注时,不仅要制定复杂的标注规范,还要投入大量的人工力量,同时语义依存树库又是开展语义分析研究工作所必需的数据资源,因此,构建语义依存树库就成为语义分析中最为重要的内容之一。为此,本节从藏文网站上各个相关领域(包括日常用语、法律、新闻、小说、童话等)的句子中取材,人工构建了包含1 500个句子藏语投射语义依存树库。构建树库的基本流程如图2所示。
(1)
其中C 表示满足限制条件下的概率分布模型集合。由拉格朗日乘子法可得,满足条件的最优解为:
由图2可知,构建藏语语义依存树库的步骤大致分为3步,第1步是在大规模的藏文原始文本中,通过藏语句子边界识别规则筛选句子后,采用青海师范大学分词标注工具对筛选出的句子做了分词及词性标注工作,对结果进行人工校对并手动修改其中分析错误的部分;第2步是在第1步工作的基础上对藏语句子中存在语义关联的依存词对进行过滤后,建立依存词对(支配词和被支配词)之间的依存弧,并确定依存弧的方向(支配词指向被支配词);第3步是确定依存词对之间的语义依存关系类型,同时标注在依存弧上,从而形成语义依存网络,构建藏语语义依存树库。
那么条件概率的最大熵模型为:
(2)
其中,x ,y 分别为向量X 和向量Y 的分量。
(3)
其中z (x )为归一化因子:
(4)
f i (x ,y )是特征函数,用来表示向量X ={x 1,x 2,…,x n }与语义依存关系类型Y ={y 1,y 2,…,y n }之间的关联。w i 为特征f i (x ,y )的权重。
最大熵模型的约束是通过特征函数f i (x ,y )来实现的,该特征函数是一个二值函数,一般可以用以下公式来描述:
i =1,2,3,…,n
(5)
用E p(f )来表示特征函数f i (x ,y )相对于概率分布p (y |x )的期望值,其计算方法如式(6)所示:
(6)
特征函数的模型期望值如式(7)所示:
念蓉扶楚墨上床,楚墨很快打起呼噜。沙发上堆着他脱下来的衣服,客厅里,一股难闻的酒精气息。念蓉洗完澡,上床,却睡不着。雨似乎停了,一滴雨水落到窗外的空调冷却机上,地动天惊。
(7)
对于每一个特征函数,为了使模型满足所有已知信息的约束,特征函数的真实期望值和模型期望值必须相等,这就是说每一个特征对应着一个等式约束。模型所满足的等式约束为:
(8)
因此,模型在数据集上的条件熵为:
宫颈与子宫、乳腺等器官均是雌、孕激素发生生物学效应的靶器官,其功能、代谢和细胞增殖等均受到雌、孕激素的调节和影响。近年来国内外学者的研究报道均证明子宫内膜癌与乳腺癌的治疗及预后与ER、PR的表达状态存在密切的相关性,由此我们推论子宫颈癌的发生、发展和受雌、孕激素影响的其他靶器官一样,是否会受到雌、孕激素的影响? 近年来有学者认为宫颈癌中的AC对雌激素较为敏感,是激素依赖性肿瘤,类似于子宫内膜癌,手术时必须同时切除双侧附件。而目前对AC给予HRT治疗安全性的研究国内外甚少。本研究旨在探讨早期AC患者是否可行手术保留附件及术后给予HRT治疗提供一定的参考依据。
(9)
最大熵模型在满足所有已知约束的模型中对所有未知的信息不做任何假设。
(2)从混合式教学在中小学领域研究文献的关键词可视化分析可以看出,研究的热门关键词为“混合式学习”、“混合式培训”、“中小学教师”、“教学设计”、“混合式教学”等,但是词与词之间的结构不是很紧密,词之间的关联性也不够,形成的紧密度也不高。
5 特征选择
对藏语句子进行语义依存关系标注的关键工作在于构建出适合于藏语语义依存关系的特征库。因此,本文根据文献[14]中所提出的构成句子的词与词之间的特征信息,包括词与词之间的顺序、位置、距离、相邻关系以及词对的上下文信息等问题,设计了32种特征,具体特征模板如表1所示。
Table 1 Feature template of dependent arc type
表1 依存弧类型特征模板
从步兵,到枢密副使,十五年,秀容月明只回家三次。三瘸子的媳妇说:“秀容月明的官越做越大,他媳妇的肚子却不见大。”
在护理管理当中实行分级管理制度,由分管院长进行总体把控,再由护理部主任来进行监督,最后由护士长来进行实施。这样可以有效的将医院感染防控措施进行落实,并且在实施的过程当中更具有直接性以及权威性。通过分级管理制度的实行,护理管理者以及参与者都成为了医院感染防控的主力人员,能够及时地带领年轻护士开展各项防控工作,提高院感管理工作效率。在每个科室当中,还要设置兼职的感染控制护士,对控制感染工作的落实进行监督、记录,然后进行持续改进,提高医疗质量与医疗安全。
由表1可以看出,基本特征分为4类:(1)1元特征:表示单个父节点或子节点的特征信息;(2)2元特征:包含父节点、子节点共同的特征信息;(3)3元特征:表示父节点或子节点以及它们的前1个与后1个词共同构成的特征信息;(4)距离特征:表示依存词对father 与child 间距离和顺序等构成的特征信息。
6 实验
本文对藏语语义依存分析的评价方法沿用依存分析评价方法,即以下评价指标:
(10)
6.1 实验语料
本文所用的实验语料是从第3节中构建的藏语语义依存树库(规模为1 500个句子)中随机抽取1 200个句子作为训练语料,占整体语料的80%,其他300个句子作为测试语料,占整体语料的20%,平均句子长度为14个藏文词。表2为详细的语料统计信息。
2)采用预先配制NaOH 10g-50 mLH2O溶液与K3Fe(CN)610g-50 mLH2O按1:1比例混合使用,金相试样腐蚀的时间为60 s。
Table 2 Detailed statistics of the corpus
表2 语料详细统计
6.2 实验结果
本文在藏文句子中已确定依存弧及其方向的测试语料上,通过最大熵模型识别投射语义依存关系类型,所得的实验结果如表3所示。
从实验结果可以看出,语义依存弧类型识别最高正确率为82.67%,此结果不是很理想。从实验数据中分析识别错误的原因,主要有4个方面:第1,该实验是在词法分析基础上进行的,因此词法分析中产生的错误影响了下一步的操作;第2,本项工作是首次对藏语语义依存关系进行研究分析,构建的树库规模较小,未能完全覆盖藏语言的语义现象;第3,句子中包含同位指代的等同关系和包含从句的藏语复合句的分析结果识别错误率较高,其中同位指代的等同关系涉及到指代消解问题,用机器识别该问题本身存在一定的难度;第4,测试语料中,藏语复合句子中包含从句等不同语义结构成分的简单句有2个或更多,本文训练语料又侧重于简单句型,导致模型训练过程中难以分析,从而识别出现错误。
Table 3 Experimental results of Tibetan semantic dependence analysis
表3 藏语语义依存分析实验结果
7 结束语
藏语是一种语序非常灵活的语言,藏语词法分析和句法分析等浅层研究不能很好地满足藏语自然语言理解的需求。本文首次从藏语简单句型出发,研究了基于投射的藏语语义依存分析,根据“八格”等藏语独有的语法特点,构建了藏语投射语义依存树库,设计了分析语义依存弧类型特征模板,基于最大熵分类模型,对人工分析过的语义依存弧的句子,进行依存弧的类型分析并进行标注。实验结果表明,其分析结果最高准确率为82.67%,此准确率相对较低,但是对于首次分析藏语投射语义依存关系,此方法已达到了人们可以接受的结果;同时为今后的语义依存分析提供了更好的理论支撑,也为语义依存分析理论提供了新的思考视角。今后的工作中将继续优化藏语语义依存分析特征模板,通过神经网络等主流方法分析藏语语义依存关系,比较不同模型的性能和优劣,选择适合于藏语语义依存分析研究的模型。
参考文献:
[1] Ding Y, Palmer M. Machine translation using probabilistic synchronous dependency insertion grammars[C]∥Proc of the 43rd Annual Meeting on Association for Computational Linguistics,2005: 541-548.
[2] Ding Yu. Dependency-graph based Chinese semantic parsing[D].Harbin:Harbin Institute of Technology,2014.(in Chinese)
[3] Cai Zhi-jie, Cai Rang-zhuo-ma. Research on the distribution of Tibetan character forms[J].Journal of Chinese Information Processing,2016,30(4):98-105.(in Chinese)
[4] Li Bo-han, Liu Hui-dan,Long Cong-jun,et al.Tibetan word segmentation based on deep learning[J].Computer Engineering and Design,2018,39(1):194-198.(in Chinese)
[5] Huaque Cai-rang, Zhao Hai-xing.Tibetan text dependency syntactic analysis based on discriminant[J].Computer Engineering,2013,39(4):300-304.(in Chinese)
[6] Huaque Cai-rang, Jiang Wen-bin,Zhao Hai-xing,et al.Semi-automatic building Tibetan treebank based on word-pair dependency classification[J].Journal of Chinese Information Processing,2013,27(5):162-172.(in Chinese)
[7] Tashi-Gyal, Duo La.Theory and method of Tibetan dependency treebank construction[J].Journal of Tibet University,2015,30(2):76-83.(in Chinese)
[8] Qi Kun-yu. Research on Tibetan semantic role labeling based on dependency[J].Journal of Northwest University for Nationalities (Philosophy and Social Sciences),2014(1):139-143.(in Chinese)
[9] Ge-sang-ju-mian.Practical Tibetan grammar[M].Chengdu:Sichuan National Publishing House,1987.(in Chinese)
[10] Huaque Cai-rang.Research on some key technologies of machine translation based on tree to string Tibetan language[D].Xi’an:Shaanxi Normal University,2014.(in Chinese)
[11] Zhou Ming, Huang Chang-ning. Approach to the Chinese dependency formalism for the tagging of corpus[J].Journal of Chinese Information Processing,1994,8(3):35-52.(in Chinese)
[12] de Marneffe M C, Manning C D.Stanford typed dependencies manual[EB/OL].[2018-08-05].http://ai.ustc.edu.cn/cn/seminar/files/manual.pdf.
[13] Ratnaparkhi A. A maximum entropy model for part-of-speech tagging[C]∥Proc of Conference on Empirical Method for Natural Language Processings,1996:133-142.
[14] Collins M J.A new statistical parser based on bigram lexical
dependencies[C]∥Proc of the 34th Annual Meeting on Association for Computational Linguistics,1996:184-191.
附中文参考文献:
[2] 丁宇.基于依存图的中文语义分析[D].哈尔滨:哈尔滨工业大学,2014.
[3] 才智杰,才让卓玛.藏文字形结构分布研究[J].中文信息学报,2016,30(4):98-105.
[4] 李博涵,刘汇丹,龙从军,等.基于深度学习的藏文分词方法[J].计算机工程与设计,2018,39(1):194-198.
[5] 华却才让,赵海兴.基于判别式藏语依存句法分析[J].计算机工程,2013,39(4):300-304.
[6] 华却才让,姜文斌,赵海兴,等.基于词对依存分类的藏语树库半自动构建研究[J].中文信息学报.2013,27(5):162-172.
[7] 扎西加,多拉.藏语依存树库构建的理论与方法探析[J].西藏大学学报(自然科学版),2015,30(2):76-83.
[8] 祁坤钰.基于依存关系的藏文语义角色标注研究[J].西北民族大学学报(哲学社会科学版),2014(1):139-143.
[9] 格桑居冕.实用藏文文法[M].成都:四川民族出版社,1987.
[10] 华却才让.基于树到串藏语机器翻译若干关键技术研究[D].西安:陕西师范大学,2014.
[11] 周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3): 35-52.
Semantic dependence analysis of Tibetan based on projection
XIA Wu-ji1,2,HUAQUE Cai-rang1
(1.Tibetan Information Processing Key Laboratory of Ministry of Education,Qinghai Normal University,Xining 810008;2.Normal College for Nationalities,Qinghai Normal University,Xining 810008,China)
Abstract :Tibetan is a language with very flexible word order. Current research such as Tibetan lexical analysis and syntactic analysis cannot meet the needs of Tibetan natural language understanding. Based on the simple sentence pattern of Tibetan sentences, we study the semantic dependence of Tibetan based on projection, construct a Tibetan semantic dependency tree library, and design a semantic dependency arc type analysis feature template. Finally, the semantically dependent arc sentences of the artificial analysis are analyzed and labeled through the maximum entropy classification model, which provides a new perspective and sound theoretical support for future semantic dependence analysis.
Key words :Tibetan semantics;projection;semantic dependent tree library;maximum entropy model
文章编号: 1007-130X(2019)10-1868-06
*收稿日期: 2018-08-13;修回日期: 2019-02-26
基金项目: 青海省科技计划项目(2017-GX-146);青海师范大学中青年科研基金(17ZR11)
通信作者: 华却才让(cairanghuaque@aliyun.com)
通信地址: 810008 青海省西宁市城西区五四西路38号青海师范大学计算机学院
Address: The Computer College ,Qinghai Normal University,38 Wusi West Road,Chengxi District,Xining 810008,Qinghai,P.R.China
中图分类号: TP391
文献标志码: A
doi :10.3969/j.issn.1007-130X.2019.10.021
作者简介:
夏吾吉 (1982-),女,青海尖扎人,硕士,讲师,研究方向为藏文智能信息处理。E -mail :shawokyi@163.com
XIA Wu -ji ,born in 1982,MS,lecturer,her research interest includes Tibetan intelligent information processing.
华却才让 (1976-),男,青海化隆人,博士,教授,CCF会员(35475M),研究方向为藏语词法分析、句法分析和机器翻译。E -mail: cairanghuaque@aliyun.com
HUAQUE Cai -rang ,born in 1976,PhD,professor,CCF member(35475M),his research interests include Tibetan lexical analysis,syntactic analysis,and machine translation.
标签:藏语语义论文; 投射论文; 语义依存树库论文; 最大熵模型论文; 青海师范大学藏文信息处理教育部重点实验室论文; 青海师范大学民族师范学院论文;