语境形式化研究_言语行为理论论文

语境的形式化研究,本文主要内容关键词为:语境论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:H31  文献标识码:A  文章编号:1009-055X(2004)06-0062-05

语境是一个十分宽泛的概念,在语言学领域(如语用学,社会语言学、自然语言处理等),其内涵也不尽相同,按照Bussmann[1]的Routledge Dictionary of Language and Linguistics,‘context’被定义为:交际环境中出现的所有因素:语言的和非语言的,特定话语情景中的语境,说话人和听话人之间的社会关系语境,他们之间的知识状态和态度,同时还包括语言语境和上下文语境(注:As a comprehensive concept in communication theory,'context'refers to all elements of a communicative situation:the verbal & non-verbal,the context of the given speech situation and the social context of the relationship between the speaker and hearer,their knowledge,and their attitudes.Catford distinguishes between context and situation co-text.)。从上述定义中,我们可以看到,语境的内容较多而且关系复杂,如何使它们变得有操作性,这是形式化的第一步,这方面的研究多集中在人工智能和计算语用学领域。第二、第三和第四节从计算语用学和人工智能角度综述BDI(Belief/Desire/Intention)、DIT(Dynamic Interpretation Theory)和AI(Artificial Intelligence)模式在理论背景、研究角度、表征方式方面的差异,为语境的形式化研究提供可借鉴的方法和理论。

一、BDI模式

(一)理论背景

BDI模式以言语行为理论为基础。Searle在Austin言语行为“三分说”(locutionary act\illocutionary act\perlocutionary act)的基础上只研究“言外之力”(illocutionary act),即话语的语用意义。他从哲学的角度规定了实施言语行为的四个条件:命题条件(propositional condition)、准备条件(preparatory condition)、真诚条件(sincerity condition)和基本条件(essentional condition)。由于Searle是以逻辑的方式界定这些条件的,适合形式化的要求。这一研究思路和方法很快被运用到人工智能和自然语言处理领域,以解决话语言外之意的形式化处理问题。但是,上述条件是以哲学思辨为基础的,其操作性不强。要实现真正的“计算机化”,必须进一步加强言语行为的定义及条件的形式化程度,在这方面做出贡献的是Perrault和Allen(1980)[2],他们发展了传统的言语行为理论,认为语言的使用是一个有计划的过程。人们发出言语行为总抱有一定的意图(intention)和愿望(desire),并对交际对方的知识状态有一定的信念(belief)和推测。因此,言语行为的实施不是以Searle的条件为基础,而是建立在“计划操作符”(plan-operators)的基础上。言语行为的理解是一个计划过程,包括BELIEF\KNOW\WANT三种“计划操作符”,即影响言语行为的认知状态或因素。

(二)语境及其表征

在BDI系统中,语境主要指说话人的信念、想法和意图。Perrault和Allen[2]用谓词演算(predicate calculus)的形式表示BELIEF\KNOW\WANT三种认知状态。

BELIEF表示为:①believes the proposition:B(S,P).②S doubts the proposition:D(S,P)

KNOW表示为:①knows that P:KNOW(S,P).②S knows whether(KNOWIF)a proposition P is true if S KNOWs that P or S KNOWs that P:KNOWIF(S,P)=KNOW(S,P)∨KNOW(S,P)

WANT表示为:S wants H to do ACT(ACT表示某个行为的执行).W(S,ACT(H))

每一个言语行为由行为图式组成,包括限制(constraints)、条件(precondition)、效果(effect)和实现的目标状态(body)(注:Preconditions:conditions that must be ready be true in order to successfully perform the action

Effect:conditions that become true of successfully performing the action

Body:a set of partially ordered goal states that must be achieved in performing the action)。利用上述的表征,可对某个言语行为进行描述(Jurafsky,2002)[3],这些表征是推理规则的准备。如:

INFORM(S,H,P)

Constraints:Speaker(S)∧Hearer(H)∧Proposition(P)

Precondition:(KNOW(S,P)∧W(S,INFORM(S,H,P)))

Effect:KNOW(H,P)

Body:B(H,W(S,KNOW(H,P)))

二、DIT模式

(一)理论背景

言语行为理论奠定了语境形式化的理论模式。在此基础上,Bunt[4]提出,言语行为在处理自然语言理解时,有许多不足,例如:言语行为的分类无法区分具体的话语意图;在自然的对话中,言语行为不能够具体地说明和解释许多回应的方式(如OK,Quite so,Yes,Hm,You think so?)、自我纠正、停顿等;另外,言语行为理论认为,一定言外之力的实现有一定条件语境制约,即:命题内容规则、准备规则、诚意规则和更本规则,但是这些条件是以认知和心理语境为基础,没有考虑到话语意义和语境的多样性。Bunt提出了Dynamic Interpretation Theory(DIT),此理论继承了言语行为的某些观点,也认为话语的意义必须通过语境推导才能得到。但DIT主要来源于对具体的话语类型的分析,它更加注重语境和话语意义的动态性。Bunt重点研究以“信息交换”为主要交际任务的话语类型(语言交际的最基本言语事件),提出了dialogue act概念,它是一个交际功能和语义内容的结合体,其中不仅包括了提问、回答、验证、证实等主要的对话行为(task-oriented),还有像打招呼、道歉、请求、致谢等控制会话发展的对话行为(dialogue control)。因此,语境的内容要由具体的话语交际功能来确定,不仅包括心理语境,还有社会、语言和认知的条件。

(二)语境及其表征

根据Bunt[4]语境是影响交际行为理解和产生的条件总和,语境是和言语活动紧密相关并随交际的功能变化而改变的条件和因素。交际功能是会话参与者用信息改变语境的方式,Bunt首先将会话中可能出现的交际功能进行了分类,然后根据这些功能归纳了4类语境:

CA=〈①主体的社交语境,

②主体的处理状态、物理语境,

③主体(Agent)的认知和意图语境:

和交际任务相关的信息,

④主体的语言语境〉

如何对上述语境进行形式化的表征呢?

1、社交语境表征:

话语在会话中的社交功能主要有两类:起始类(initiative)和回应类(reactive),因此与之相关社交语境表征主要由两条规则构成:

(1)条件语境(conditional part:CP):规定具有满足某一个应对要求话语的语境特点,包括交际功能、语义内容和话语形式

(2)应对要求(interactive pressure:IP):例如,满足打招呼、自我介绍的应对要求的规则分别表征为:

Opening Greeting

〈CP:no dialogue acts have yet been performed other than SELF-INTRODUCTION

IP:OPENING-GREETING-INIT〉

Self-Introduction

〈CP:no dialogue act has yet been performed

IP:SELF-INTRODUCTION-INIT〉

2、物理语境表征:

物理语境主要说明交际者和周围环境以及交际者相互间交流的状况,它们可以观察到,主要包括交际信道以及交际双方是否相互注意,用两极赋值(binary-valued)有、无特征就可以表示。

3、认知语境表征:

认知语境包括两部分:关于处理状态的信息(处理进程、所遇到的困难、结果、完成时间)和与交际目的相关的认知状态信息。对完成时间的表征只能是接近实际时间的粗略估计,用赋值对的形式表征。另外,在自然的对话中,当交际者遇到困难时,一般会说“What did you say?”或者问“Do you mean this Tuesday?”,用两个特征表示,成功/失败、有问题。还有一些处理状态(比如处理不同已知知识和动态的知识),必须结合语言、语义内容和分析才能进行,它们的表征要复杂的逻辑式才能完成。下面的图表示话语的整个处理状态:

图2:关于处理状态信息的表征(1、2表示和语义内容相关的认知语境)

说话人必须对听话人的认知状态进行假设,而听话人也会对说话人的认知状态进行猜测,这些认知信念和话语的意图和交际任务紧密相关,形成循环,对它们的表征需要复杂的逻辑形式才能完成。Bunt采用了两种逻辑理论:(1)Constructive Type Theory(CTT)(2)Modular Partial Model(MPM)。第一种理论原是对知识表征及推理的逻辑式,它最大的特点是推理的前提或证据既可以是抽象的内容也可以是个体的概念,因此不仅能表达说话人所相信的内容,还可以表征说话人认为此信息可相信的种种证据。它的逻辑语言写为:A:B,意为A是类型B的元素。要表示A:B在语境?中成立,只要表明?包含这个表达式,或者能通过演绎推理规则在?得到此表达式。CTT可以用来表达话语的语义内容,例如:A farmer laughs,就表示为:[farmer:e,x:farmer,laugh:farmer→t,p:laugh?X]farmers是一群个体(e),x是其中一个farmer,laugh是farmers具有的特点,有证据表明x laughs。

使用CTT不仅可以表示话语的语义内容(说话人相信为真的命题),还能表示那些暗含的,但是说话人能提供证明的命题。但对于有些命题,说话人无法提供证明,也不能说出命题为假的证明,CTT无法进行表征,因此它只能对部分语境(信念)进行逻辑说明。另外,CTT实际的计算机处理程序中,我们无法一一对所有的知识信念进行真或假的表征。而在自然的对话中,所改变的语境只是和交际功能紧密相关的部分知识状态,而不是整个知识结构,Bunt认为应该用Modular Partial Model(MPM)来解决这一问题。MPM主要用来表示下列的信息:

a)表示“部分”的命题逻辑式:不连贯的知识(如知道John的生日是23号或25号,却不知道到底是其中哪一天)和知识缺损,如(S知道)U不知道命题P。

b)谓词逻辑知识:如,你知道Marx三兄弟,Groucho和Harpo是其中两个,你不知道第三个兄弟是谁,但你知道那肯定不是Karl。

MPM内部使用了8个定理和各种的定义来描述上面的知识信息,下面用一个具体的句子来说明知识的表征。例如表示WH问句:Where does Bill live?的语境条件(语义和认知条件):

C1:S wants to know where Bill lives;

C2:S believes that U knows where Bill lives.

s!表示S有此交际目的,MPM表示如下图:

S wants there to be an al such that S knows that Bill lives in al

S believes that there is an a2 such that U knows that Bill lives in a2

图3:MPM模式(Modular Partial Model)举例

上述模式表达了下面的结构:

Ms==

Where

Ns={a2},Ns!={a2},

Fsu={<L,{<b,a2>}>},

Fs!s={<L,{<b,a1>}.

4、语言语境表征:

语言语境不仅包括会话的当前话语,还包括前述的话语,其实就是对话的前后内容。在自然会话中,人类的记忆是有选择的,我们只保留目前话语的内容。在语义和句法学领域,已经有许多逻辑方式对语义内容、命题和句法表现进行了表征,但还没有形成统一的表征方式。

DIT语境的表征方式所覆盖的面比BDI模式要广得多,描写的充分性比BDI模式强。由于和语言交际的具体功能相联系,突出了语境动态性特点;用具体的会话类型(如“信息交换”)来定义和表征语境,避免了处理无范围限制语境的困难。

三、AI模式

(一)理论背景

在人工智能领域(Artificial Intelligence,AI),对语境的形式化表征分别有两个代表性的理论:一个是Propositional Logic of Context(LoC),另一个是Local Model of Semantics(LMS)。根据Bouquet et all[7],按照第一种观点,世界知识是一个整体的理论,由许多的相互关联的内部组织构成,组织的集合就是语境;而LMS认为不存在这样的普遍理论,语境有个人不同的世界观组成,它们具有不完整和局部性,相互独立,各自间的关系松散。

(二)语境及其表征

人工智能的主要目的是研究行为主体如何表征他(她)所认识的客观世界,以及如何利用这些知识进行推理获得新的知识,因此,语境被定义为知识表征,包括信念、命题态度等。根据Bouquet et all[5]、LoC的理论基础由McCarthy[6]首先提出,然后进行了形式化处理。语境和命题之间的关系表示为ist(c,p),意味命题p在语境c中为真。主要的公式表示为:c':ist(c,p),即:在外层语境c'中,p在语境c中为真。例如:C0:ist(context-of(“Sherlock Holmes stories”),“Holmes is a detective”)),意味:在Sherlock Holmes stories语境中,Holmes is a detective是真的。可表征的语境间的功能还包括C1≤C2,表示为语境2包括语境1所有的信息。其它关系还有:value(c,t),在语境c中给t赋的值,例如:

value(context-of(“Sherlock Holmes stories”),“number of wives of Holmes”)=0意味在语境Sherlock Holmes stories中,Sherlock Holmes has no wife。另一个关系:specialize-time(t,c)(注:除了表示时间外,还可以表征地点,说话人等物理语境。),表示在语境c中,t的时间值,例如:

C0:ist(specialize-time(t,c),at(JMC,Stanford)),表示在语境c中的某个时间t,John McCarthy is at Stanford University.

除了定义语境间的功能关系外,还可表征语境间相互作用的关系,即提升关系,如形式转化:

C0:?x?y ist(above-theory,on(x,y))→ist(general-block-world,on(x,y))

在不同的语境中,同一个谓词可以有数量不同的元(argument):

C0:?x?y ist(above-theory,on(x,y))→ist(context-of(s),on(x,y,s))

LMS理论认为没有普遍性的表征语言;与域相关的、和目标相联系的语境是世界知识的基础;各个具体的、局部的语境只能是从一定的角度、在某个层次上对世界知识的反映,即知识的表征只能是局部的;各个语境之间相对独立,通过有相容性的规则联系。命题的真值性依不同的语境而定,不同的语境有不同的推理规则。LMS理论基于两条原则:

局部原则(principle of locality):推理只能在局部语境中发生;

相容原则(principle of compatibility):不同的语境通过相容的限制条件联系。

上述原则通过下面的形式化表征反映:表征语言为,其中Li为语境Ci的语言;每一个Li有一套模式Mi;在Mi中,每个子集MT满足一套公式,各个公式都对应一系列和语境Ci相联系的理论Ti。一旦有了与语境Ci相联系的理论Ti,就形成语境Ci的局部模式Mti。两个语境之间通过相容限制条件表征:语境中的公式φ其真值和语境的公式真值相联系。因此,如果句子p在语境c中为真,而且c和c'有一定的关系R,那么句子p'在语境c'为真。语境是由三部分构成(Li Ai,),其中Li为语境语言表征,Ai为公理,为推理的规则。通过相容机制,能表征语境间的不同关系,如:

如果语境C表示在某个时间(t)John的信念,而且它包括句子“I'm hungry”,如果语境表示在某个时间(t+1)。那么两个语境存在这样的关系:句子“Yesterday I was hungry”在语境为真。

如果表示在某个时间(t)Mary的信念,而且John tells Mary“I'm hungry”。那么两个C和语境存在这样的关系:句子“He is hungry”在语境为真。

如果语境表示在个时间(t)某个房间内物体的位置,句子“John is near Mary”在语境为真,如果表示在不同时间同一物体的位置,那么句子“At time t,John was near Mary”在语境为真。

Bouquet et all[5]认为,由于把语境看成是世界知识的总和,LoC比LMS在处理语境的普遍性方面要强;而LMS认为语境是个体对世界的看法和视角,因此它用来表征个人的知识信念比较适合。

四、运用

BDI的范围表征较窄,只能表征一些简单的信念和知识,运用的范围有限。和BDI模式不同,DIT模式注重语境知识库的建立和运用这些知识的规则,突出语镜的可变性,扩大了语境的范围,更加强调语境和语用意义的动态性。它主要运用在以语用为基础的话语理解系统(Pragmatics-based Language Understanding System)(Black et all)[7]中。其中的核心主要是利用语境知识,对自然语言引擎处理的结果进行解释并生成回答,包括:

A World and Application Model(世界知识和运用的模式)

A Discourse Model(语篇模式:动态的、在会话过程中变化的知识)

A Knowledge Base Management System(KBMS)(运用上述知识的程序)

无论是世界知识或动态的知识都需要语境的形式化处理,建立相应的语境规则、理解和生成话语的语境形式化条件。因此,DIT模式对表征复杂的、动态的、在会话过程中变化的知识比较适合。

从人工智能角度对语境进行的形式化,并没有和具体的交际情景相结合,比较机械和抽象,它的主要目的是为了处理人工智能中普遍性的问题(the problem of generality),因为只要稍微增加一点改变,整个程序就要作相应的调整,因此,必须对整个知识系统作出具有普遍性的明晰表征,AI模式只能处理一些固定的世界知识和思维方式,如VIEWGEN模式,Hierarchical Belief(HB)模式等[5]。

作为基础研究,语用学必须转向日益发展的信息社会,才能获得活力。信息技术不断发展,向语用研究提出了挑战:语用意义的计算机和形式化。其中的关键是语境的表征和形式化。上述语境形式化模式拓宽了描写语用学(只注重语境的分析)的范围和视野,使之更具有实际价值,为今后的研究提供了可借鉴的理论和方法。

无论采用哪一种角度,虽然表征的方式各不相同,它们都采用了逻辑的思维和表征方式,这让我们看到逻辑在语用学研究中的重要意义。吕公礼[8]认为,语用逻辑要成为合理的形式化系统,首先需要从语用学的基本概念、范畴和命题的形式化做起。语境作为语用研究的最基础范畴,其逻辑表征模式和方式的研究有助于语用逻辑的发展。另外,语境的形式化研究也是跨学科的,它不仅需要语用学的描写研究,还要计算语言学、逻辑学、信息学等学科相结合的综合交叉研究。

对语境的形式化研究只是理论上的逻辑表征模式,它们还必须借鉴计算语言学中的技术和方法,使之用于实际的自然语言处理系统中,对其进行测试和评估,并不断改进和完善。

收稿日期:2004-07-23

标签:;  ;  ;  ;  

语境形式化研究_言语行为理论论文
下载Doc文档

猜你喜欢