汉语信息处理研究:语义研究--解决情景模型中函子的缺省成分_语义分析论文

中文信息处理专题研究:语义研究——在情景模型下求解函子缺省成分,本文主要内容关键词为:语义论文,中文论文,专题研究论文,成分论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一 情景模型

情景模型(Situational Model)是继语言学、逻辑学、形式语义学之后发展的学科。起初,模型理论主要描述公式中谓词及其论元的各种关系的总称是否能在真实世界中可满足。后来加入了描述情态、时态的逻辑算子,描述语用的可能世界,谓词演算的模型发展到情景模型。语用过程中,听话者对篇章语义的理解不仅要求包含语段、语句和功能语义,还包括交际双方共处的情景知识,这些知识是用情景模型所表达的外部世界信息。

语篇的功能语义表示语篇的内涵,用情景模型表达的语义就是外延。这个说法与Mantague语法的说法是一致的。一个语句(蒙氏语义未涉及篇章)的意义分为内涵和外延,内涵是关于可能世界的函数,外延是内涵函数在可能世界W下的值。

Meaning(S)=[S的逻辑表达式α]在M,W,g之下的理解。

=Ext[α,W](α的外延)

=Int[α](W)(α的内涵Int,是以可能世界W为变目的函数)

通常的模型论,||α||[M]的解释部分仅有模型M,不出现W、g。不出现g是因为所考虑的α是封闭式,若原先的公式含有自由变元x,这意味着对“所有的”x求值,若对原先公式的自由变元考虑可满足性,则可加“存在”x,总之,可用量词封闭。不出现W是因为模型论中没有可能世界,没有情景。用可能世界语义理论表示封闭公式的可满足概念W,M├Φ。其中模型M=,A为论域,F为对常量符合的静态解释。静态是指A、F不随可能世界W变化,后来发展到F可随世界W变化。例如人名“王涛”,可以出现同名同姓的,用住所地址不同来区分,W之中地点L1处是大王涛,W之中地点L2是小王涛。进一步,论域A也可能随W变化,在经典模型中,论域的扩张是非常谨慎的。

二 利用情景模型求解

Montague模型是用来反映客观世界的关系,要反映心理世界状态就相形见绌了。情景语义学的出发点也在于此,但是要求解心理世界状态是很困难的,我们不想涉及这一方面。在我们的体系内,由场合、知识、上下文组成的求解模型求解出函子缺省成分,从而得到函子调用式Ψ°,由这些式子组成公式:α=ΠΨi°,要在模型下求解出函子成分的缺省问题,简写为

M情景,(S)├clΨ,(cl指量词封闭)其中clΨ是指:x:NP,y:NP,z:NP Ψ(x,y,z)

函子的变元x,y,z用存在量词封闭,这个存在记号是从逻辑式中借用的,表明可以从情景模型中寻找出来的,这儿的约束变元x,y,z也不是个体范畴的,而是名词或者名词短语NP句法范畴,表示有一个x为NP,一个y为NP,一个z为NP,使得Ψ(x,y,z)为具体函子式。

M情景,(S)├clΨ

当且仅当

M情景,(S)├存在一个赋值代换θ,使得θ·Ψ=Ψ°(称为Ψ的具体调用)

求解的前提是配备句法分析系统和动词配价词典,包括形式规范和词义。求解方法可添补缺省成分。添补缺省成分这一计算过程,用模型论抽象就是:M情景,(S)├clΨ。

三 语言环境描述

本文构想和描述一个语言环境情景M=(s,S,Δ,M0),希望这样的环境:

(1)基于模型论思想。(2)能在一定程度上形式化。充分的完全的形式化应该在后继的项目中完成。(3)能在一定程度上描述语用语义,可提供必要的信息,由此能理解一个语句的意义。

假定语句S,对应Ψ(函子),变元用存在量词封闭。

(一)M[,0]├Ψ[,0]M[,0]为客观世界知识的模型。

Δ,M[,0]├Ψ是上述语言环境扩展了知识情景Δ,知识背景是文化背景的一个组成,因此跟语种、社会、民族有关。知识包括语言知识、社会知识、科学知识等方面,本文为简化起见,知识情景Δ的组成:DIC(词典知识),WKN(客观世界知识)。客观世界知识是人所积累和约定的知识集成,结构上分层次,体现了概念之间的蕴含和从属关系。例如关于一个事件,呈现树形结构。这树形结构是一个抽象模式(Abstr-act Pattern),只提供了概念语义上的关系,是一种抽象的形式,具体的信息都可以随语言表达式分析理解逐个求解出来。抽象模式的实例化就是一个分析理解过程。但是也不排斥固化的模式结构,在知识中会有许多典范实例,有关的信息被固定下来,那么分析理解过程不是实例化过程,而是有关典范实例比较匹配的过程。例如范例型的法律知识条文,可以采用这种形式。

词典知识是语言知识的集中反映,对于书面语言理解、自动生成文本、自动检查语法等应用来说是必不可少的。怎样才能使计算机有效地用上词典呢?关键在于设计好词典的形式规范。除了词类特征、句法特征之外,更为重要的也是目前学术界最为企盼的是词义特征的规范。例如动词的义素分析中,从逻辑上看,动词配价的论元是否与义素动词的配价论元有继承关系,这将直接影响到谓词结构的分解。例如:

捏:用拇指和别的手指夹。(《现代汉语词典》)

动词的形式规范:V[2][,捏](x,y)(V[2]表示二价动词,下同)

语义类型:X:人/手指;Y:物

“捏”用“夹”解释,

夹:从两个相对的方面加压力,使物体固定不动

动词的形式规范:V[2][,夹](x,y)

语义类型:X:人体手/脚/工具;Y:物

“捏”的义素调用了“夹”,因此出现了V[2][,夹]的调用式。

词义逻辑式:V[2][,捏] (x,y):- V[2][,夹](x,手指(x),y)(符号":-"读作“义素为”)由此可见,V[2][,夹]的论元x,y是继承V[2][,捏]中的x,y,V[2][,夹]的第一个论元调用了函数“手指(x)”。(NP:“x的手指”),作为动词“夹”的可有成分(工具)。因此,词典知识DIC中,每个动词包含两项信息:

(1)动词形式规范—汉字、字型、义项号、价、语义类型说明。

(2)动词义素分析,如:V[2][,捏] (x,y):- V[2][,夹](x,手指(x),y)。

(二)Σ,Δ,M[,0]├Ψ

使Ψ可满足的解释,除客观世界模型M[,0]、知识Δ之外,还应考虑上下文情景Σ(context model)。一个篇章看成一个语流,假定有n个语句组成的语句序列S1,S2,…,Si-1,Si,Si+1,…,Sn。初始语句S1之前Σ为空,即Σ0=Λ,最终语句Sn的下文也为空。第i句的上文记为Σi-,下文记为Σi+,为简化讨论,不涉及代词指称问题时,关心的主要是上文,所以简单地说,语句S的上下文Σ是指Σi-。

Σ表示的信息应为上文语句的逻辑公式集。语法范畴上与语句S的逻辑式是同范畴的。

Si的上文由i-1个语句公式组成,每个公式由若干个函子组成。

(三)σ,Σ,Δ,M[,0]├Ψ

使Ψ可满足的解释,除上述诸组成之外,还包括谈话场合σ(occ-asion),表示当前说话句S时所处的场合,描述动作、事件、状态。有关场合的信息原来的载体不是语言,需要将这些非语言的信息切换成情景模型内的符号,这种符号表示形式称为信息子Inf。场合信息用信息子Inf集合表示,σ={Inf}。Inf:《话对,Speaker,Listener,L,T》表示在L地方T时刻Speaker与Listener对话这样一个情景。inf:《话说,Speaker—王明,Listener—李英,L,T》表示“在L地方T时刻王明对李英说话”这样一个情景结合。inf:《李林,刘红,L,T》表示李林与刘红的对话情景场合。Inf大致上与谓词式相当,内中第一个信息为信息子名、指称动作、事件、状态。后边的信息包括参与者、时间、空间等。信息子与谓语动词的谓词相比较,语义虽相当,但形式不同,谓词因子—函子出现在语句的逻辑公式中,是形式系统内的符号,而信息子出现在模型—解释中,是元语言符号。汉语语义计算(理解)系统将自动地从模型解释中提取必要的信息,供给语句逻辑表达式中代换或解释。

“上下文”有可能转换为场合,使语句进入新的场合,场合情景的切换在脚本(scenario)这一类语篇中是常见的。因此,情景模型中的信息子与语句逻辑式中的谓词式可以被双向切换,是语篇理解中的主要执行机制。

四 信息子

情景语义学(Barwise)所用的信息子符号也还不能看作为适合于演绎的形式化约定,所以将信息子用在语义解释上,不妨作一点简化约定,或者直接作为原子对象看待。

例1“买一张票。”

场合σ: Inf1:《说话,Speaker—游客,Listener—售票员,L,中山公园售票处》 Inf2:《自述,Speaker,S》

函子: V[2][,买](xl,一张票)

当前场合σ是“说话”场合,由Inf1提取“Speaker—游客”,但不能直接进入形式系统的Syntax,就是不能直接作为项添补进来,需要转换成相应的人称“我”—"Speaker"示意图如下:

例2“不能再吃了。”

函子:V[2][,吃(1)] (x1,x2)

“不”“能”“了”都处理成算子,“不”逻辑否定算子;“能”,模态算子;“了”,体时算子,加在函子上可得到公式。关键在于求解x1,x2=?这一单句,逻辑上是指“某人”不能再吃“某物”了。“某人”“某物”是指“谁”和“什么”,取决于具体情景和场合。场合σ,除Inf1:“说话”,Inf2:“自述”,还规定了其中的地点是饭桌旁和Inf3:“吃饭菜”,Inf4:“吃饱”这类信息子。于是计算:

(2)由动词V[2][,吃(1)]的形式规范中,语义类型的规定,选取匹配的项:

语义类型规定:V[2][,吃(1)] (x,y),X:人/动物,Y:食物;

匹配:我{人称}:人, 饭菜:食物;

(3)从而得到q:{x1/我,x2/饭菜}

这儿的“饭菜”泛指(饭桌上)任一种菜和饭中一部分。数、量、名化可具体为“一只”“一勺”等。

五 上下文对照求合一代换

由两个单句构成的复句(或两个以上单句构成的流水句),长度有限,连接紧密,按陈平(1987)的研究,是“客观连续性”最强的结构,省略与其添补最显著。会话、问答句常是这种复句结构,且单句中多出现单个动词。有时也会在会话句、问答句的前后分句中,不仅出现同一谓语动词,且语义重心也都在这同一动词上,动词的必有成分中的全部或部分可以是相同的,然而这些相同部分在后边分句中省略了,不省略显现出来的必有成分是两分句的主要差别。

此外,不同之外还可以是动词动作行为的肯定—否定性,选择性。此时前边分句的动核是完整的,函子不出现x变元,称为原型函子Ψ(N),后边分句动核有缺省的称为差异型函子,出现一个或更多的x变元,求解这类缺省只须合一这两个相同动词的函子,求得合一代换q,前边分句的原型函子有三种情况:(1)论元全部为指称事物的名词性成分,Ψ(N);(2)论元中一个为不定指代词“谁”y(谁)。合一前需转换为泛变元u(个体变元)(3)前边分句为疑问代词“怎么”作谓语的问句Ψ(怎么),合一前需转换为泛变元U(高阶谓词变元)。

例1 “小李走了吗”“走了。”

函子:S1:V[1][,走](小李),S2:V[1][,走] (x)

计算:要使语句集{S1,S2}合一,必须代换q{x/小李}

即求q使得{q·V[1][,走](小李)=q·V[1][,走](x)}所以q:{x/小李}

例2 “衣服买了吗?”“还没买。”

x变元代换后简化,函子:S1:V[,买](x1,衣服),S2:V[,买] (x1,x2)

计算:q使得合一{S1,S2}所以q:{X2/衣服},此外x1依赖于场合决定。

例3 “自行车谁骑走了?”“小沈骑走了。”

函子:S1:V[2][,骑走](谁,自行车);V[2][,骑走](小沈,x)

不定称代词“谁”替换成泛变元u,它可以与任何项匹配。函子简化为:

S1:V[2][,骑走](u,自行车);V[2][,骑走](小沈,x)

计算:q使得合一{S1,S2}所以q:{x/自行车},{u/小沈}

例4 “这车子你留着还是送人?”“还是留着吧。”

函子:由句内求解得S1:V[2][,留](你,这车子),V[3][,送](x3,人,x4)

三价函子中其中一个论元为常项,两个为变元,也可看成二价函子,于是同价动词的函子可由论元继承优先规则得:x3/你,S2:V[2][,留] (x1,x2)

对话场合将问句中的“你”,答句中应改为“我”。因此由场合—人称转换,将V2留(你,这车子)转换成新的副本V[2][,留](我,这车子)。

即S1:V[2][,留](我,这车子),V[3][,送](你,人,这车子)

与S2:V[2][,留] (x1,x2)

计算合一,得到代换q:{x1/我,x2/这车子}。

例5 “自行车怎么了”“坏了。”

函子:S1:V?(自行车),S2:V[1][,坏](x)

疑问代词“怎么”作谓语,后加“了”,表示询问状况的意思。句法功能上这个代词代替动词。但是不能确定代的究竟是哪个具体动词,也不能说成是任指性的,应该说是待指性的,是“待定的某个动词”。逻辑上这个疑问代词对应一个高阶的变元U,它不同于指称个体事物的项变元(泛变元u),而是指称动作—状态的谓词变元(为高阶逻辑变元)。

因此,由代词转换将“怎么”转换为谓词变元U,修改函子如下:

S1':U(自行车),S2:V[1][,坏](x)

q使得合一{S1',S2}因此q:{X/自行车,U/ V[1][,坏]}

标签:;  ;  ;  

汉语信息处理研究:语义研究--解决情景模型中函子的缺省成分_语义分析论文
下载Doc文档

猜你喜欢