语言的认知研究和计算分析,本文主要内容关键词为:认知论文,语言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
提要 从认知科学的角度讨论人类的认知过程和自然语言理解之间的关系,展示人工智能中的知识表示和语言学中的语法描述之间的互动作用,提出语言知识的形式表示和语言的计算分析的有关步骤,尝试建立一种语言的认知研究和计算分析相结合的研究范式,最后介绍这项研究的理论背景并展望这种研究的应用前景。
一 认知过程和语言理解
认知(cognition)是人脑最高级的信息处理过程(information—processing),它贯穿于问题求解(problemsolving)、 概念形成(concept—forming)和语言理解(language—understanding)等最复杂的人类行为中。认知活动最本质的特点是利用知识来指导人们当前的注意和行为,它涉及:1.信息的获取(acquisition)、表征(representation)并转化为知识,2.知识的记忆(存贮和提取),3.运用知识进行推理等心理过程。对于语言理解来说,认知过程的主要环节是语义的记忆和利用知识进行语义推导,从而从语言形式上获得正确的语义解释(semantic interpretation)。例如:
从理论上讲,(1)(2)都可能有a、b两种语义解释,但在通常的情况下,(1)只能理解为(1a),(2)只能理解为(2b)。反过来,从语言生成的角度看,(3a)(4b)可以省略为(3a’)(4b’),但(3b)(4a)不能省略为(3b’)(4a’)。这种语义理解和成分省略上的不平行性,只能从语义记忆和语义推导的方式上去寻找合理的解释。
袁毓林(1994)尝试从认知的角度,用扩散性激活的语义记忆模型和非单调推理的逻辑机制来解释例(1)~(4)这类现象。根据认知心理学的研究,意义的心智表达(mental representation )是概念网络,调用一个词项的意义可以激活知识网络上一大片相关的语义节点。比如,听到名词“酒”可以激活[液体、饮料、刺激性的味儿、颜色……]等一组语义,听到名词“花”可以激活[植物的器官、观赏性的颜色、味儿……]等一组语义,听到形容词“淡”可以激活[(味儿、颜色)不浓、(含量)稀薄、(态度)不热情……]等一组意义。人们根据常识推断,酒作为一种有特别味道的饮料,[味儿]是它的强特征,“酒淡”可以直接理解为“酒的味儿淡”;如要表达“酒的颜色淡”,属性名词“颜色”不可省去。同理,花作为一种有特别颜色的植物器官,[颜色]是它的强特征,“花淡”可以直接理解为“花的颜色淡”;如要表达“花的味儿淡”,属性名词“味儿”不可省去。
这种推理方式叫缺省推理(reasoning by default),大意是:除非特别说明,可以默认某一命题总是成立的。如,在没有特别指明时,人们可以断定鸟总是会飞的,除非说话人特别声明这只鸟是企鹅或驼鸟。缺省推理是非单调逻辑的一种,计算机科学研究者已对此作了大量讨论,并做了形式化工作。〔1 〕通过缺省来表示默认已成为人类语言交际时信息编码和译码的一种基本的约定,如:说起“部长、强人、工程师”时,听话人可以推断他们是男性;因为听话人相信,如是女性,说话人一定会特别声明。因此,语言中有“女部长、女强人、女工程师……”一类说法。
我们希望用扩散性激活的语义记忆模型和缺省推理的非单调逻辑来建立一种语言理解的微观机制,用以解释同一句子中不同词项之间的语义联结和制约关系;并籍此揭示人脑处理语言信息的某种心理过程,从而为认知心理学和计算机理解自然语言提供强有力的语言学支持。
二 知识表示和语法描写
由于知识在人类认知活动中的重要作用,因而在研究计算机模拟人类智力活动的人工智能学科中形成了一个专门的研究领域——知识工程(Knowledge engineering), 其任务是从人类专家那里抽取他在严格限定的具体领域里所拥有的专门知识(expertise), 并把这些知识表示成一个巨大的关于某个具体领域的规则集合,以建立所谓的专家系统(expert system),如肝炎诊断系统、气象预报系统等。 因为人工智能问题的求解是以知识为基础的,无论应用人工智能技术解决什么问题,首先碰到的就是所涉及的各类知识如何加以表示,即如何将已获得的有关知识以计算机可以识别的形式加以合理地描述、存贮,这就是所谓的知识表示(Knowledge representation)。合理的知识表示可使问题的求解变得容易,并有较高的求解效率。
为了提高计算效率,人工智能研究者一直致力于寻找获取和表示知识的最好的方法。从广义上讲,一个表示方法就是一个按照某些约定把字符组织起来的词汇表。现在已发展得比较成熟的知识表示方法有以下几种:〔2〕
(1)通过引入谓词、函数来加以形式描述的逻辑表示法。例如:
TABLE(A)表示A是桌子
EMPTYHANDED(ROBOT)表示机器人双手是空的
AT(ROBOT,A)表示机器人在A旁
HOLDS(ROBOT,BOX) 表示机器人拿着积木块
在这种知识表示下,计算机可采用归结法(resolution)或其他方法进行正确的推理。
(2)用有向图来表示知识的语义网络表示法, 一个语义网络由一些以有向图表示的三元组(结点1,弧,结点2)连结而成。在这种知识表示下,可用匹配法或归结法来进行推理。
(3)由条件和动作构成的产生式表示法(详见第三部分)。 此外还有框架表示法(将一个特殊个体类跟其他有关断言连结起来),概念从属表示法(将一个动作或事件跟有关断言连结起来),脚本表示法(将一个特殊的事件序列跟其他有关断言连结起来),这里不详细介绍了。
因为人类知识的最自然的表达方式是自然语言,所以知识表示在 某种意义上说是要把一组表示某种局面(situation )的语句转换成该局面中各部分之间关系的语义描述。并且,这种描述必须是可计算的(computable)。正是在这一点上, 现代语言学跟人工智能研究走到一起来了。因为,在很大程度上,语法分析的目标就是想通过对句子形式的分析来求出其语义表达(semantic representation)。比如,P.H.Winston(1980)研制的“通过类比来学习和推理”系统,以C.J.Fillmor的格语法(case grammar)为基础,发展了一种可扩展关系表示法(extensible—relation representation)来描述局面,再教计算机比较不同局面之间的类同性并进行自动推理。他用可扩展关系表示法对《灰姑娘》《罗密欧和朱丽叶》的情节描述和匹配比较。在这种表示法中,局面的各组成部分(如Romeo Julit)用一些节点来代表, 这些部分相当于施事、受事等各种语义角色;节点之间用关系(如love、Riss)来联结。形成一个语义网络。还有指明属性(如strong、beautiful)和高层约束(如cause)等的补充描述,增强了该表示法对各种复杂关系的表示能力。更妙的是,Winston(1980 )还用这种表示法描写水管的局面和电阻的局面,让计算机进行类比推理,从计算流过一段水管的水压的方式上学会计算电路的电压,从而重新“发现”了欧姆定律。进而由水管定律和欧姆定律去概括一般的具有线性约束关系的定律。
可见,人工智能的有些研究工作很像是语言学上的语义描写和语义推导。从上面的介绍中,我们不难得出两点印象:(1 )知识工程专家亟待语言学家发展更多、更好、更实用的语法描写方法,以便他们选来作为知识表示方法的基础;(2 )语言学家要认真学习知识工程专家所建立的各种知识表示方法,以研制更有理论意义和应用价值的语法分析方法。
三 形式表达和计算分析
语言的认知研究侧重从人类处理信息的心理过程方面来解释语言的结构和理解方式,这种工作在方法论上属于黑箱模型:认为大脑是一个密封的、无法打开的黑箱,只能从输入(刺激)——输出(反应)的关系上去推测其内部装置及其工作原理。例如:
a.这房子很大→a’.这房子面积很大
b.这箱子很大→b’.这箱子体积很大
(a)和(b)结构方式相同,但语义解释却很不一样。对此,我们假定:(1)大脑中语义贮存的方式是网络式的, 语义提取的方式是扩散性激活(spreading activation)式的。并且,由于常识和生活经验的作用,人在听/看到“房子”这个词时,[面积]这一语义节点优先激活,它跟其他词的语义节点的连接权值增大;人在听/看到“箱子”这个词时,[体积]这一语义节点优先激活、它跟其他词的语义节点的连接权值增大。(2)语义推导的方式是基于知识的缺省推理, 听/看到“房子大”可以直接理解为[房子的面积大]、听/看到“箱子大”可以直接理解为[箱子的体积大]。因为听话人相信说话人一定遵守交际的缺省约定,如果说话人要表示[房子的体积大]、[箱子的面积大],那么他必须特别声明,因而不能省去“面积、体积”这两个词。上述讨论可图示于下:
这种假设性的解释非常直观,而且具有很强的心理现实性。但是,从元理论层次上看, 这种语法研究的路子是功能主义(functionalism)的,缺少形式化的规范。我们承认,对语法规则的形式化的表达工作不一定能增强对语言现象的洞察力(insight), 也不一定能导致发现新的事实和规律。但是,一种解释力较强的语法分析方法,如果能用形式化的规则来表达其研究结果,可以帮助澄清理论解释中的模糊之处,校正所得到的语法规则中的不一致性,还可以防止研究者不切实际地夸大处于朦胧状态的思想,妄谈某种语法分析方法的解释力量。在这方面,人工智能中的机器学习(machine learning)的许多研究工作,为我们树立了一个从思想提出到规则表示、程序实现的典范。举一个例子,人工智能研究者假定人类处理复杂问题时采用的策略是“分解——攻克”(division—and—conquer),即把一个复杂问题分解为多个子问题逐个解决,或把一个总目标分解为多个子目标逐个实现。比如,从这儿(here)到目的地(destination)之间有一条河, 那么就把整个陆地施行的路径计划(path—plan)分解成下面几个路径计划事件:
LOCATE(bridge),
PLAN—ROUTE(here,bridge),
PLAN—ROUTE(bridge,destination)
为什么必须规划一条路线并找到一座桥呢?对前者的说明来自总的路径计划PLAN—ROUTE(here,destination)这个初始目标;对后者的说明来自于事实:从这儿到目的地之间有一条河,违反了陆地旅行的前提条件。为了实现上述说明,必须先找到可计算的谓词,这些谓词成为规则的条件项(前件),而经过调整的动作子序列将成为规则的动作项(后件):
IF GOAL(X)is LOC(X,time—2)=desination
&LOC(X,time—1)=here
&BETWEEN(here,destination)=river
&TRANSPORTATION(X)=Land—Vehicle
THEN FIND (bridge,river)
PLAN—ROUTE(here,bridge)
PLAN—ROUTE(bridge,destination)
上面从解决问题的策略这种思想出发,通过派生路线分解出可计算的寻找道路的规则,展示了怎样把认知解释和计算分析相结合的工作程序。要产生可计算的规则,必须先做好知识表示中的求精(refine)工作。知识求精是一个多步过程,它从一个高级语言(通常是英语等自然语言或各种一阶逻辑)描述的抽象说明开始,逐步产生可操作的、因而是算法化的描述。由此认识到,对语言结构的认知解释只有经过类似知识求精这样的工作,才能进入计算分析阶段,最终形成算法化的语法规则。
语言的计算分析指用某种形式化体系来表示语言的有关知识(包括事实和规则),并在这种知识表示下合理地推导出有意义的语言学论断(比如:判断一个语符列是不是某个语言的一个合语法的句子,判断一个句子是否有意义)。在各种形式化体系(formalism)中, 产生式系统(production system)比较适合作为语言的计算分析的工具, 因为产生式表示法容易描述事实、规则以及它们的不确定性度量,相应的推理方法比较完善。在产生式系统中,事实一般用三元组(对象,属性,值)或(关系,对象1,对象2)来表示。例如:
(Li Age 35)表示“老李35岁”
(Friend LI Zhang) 表示“老李和老张是朋友”
这种表示的机器内部实现就是一个表。规则一般用
if Condition then Action
2(条件→动作
或 前提→结论)
这种单一形式来描述,推理方式很单纯。如英语主动句(A doctor shot a lawyer)和被动句(A doctor was shot by a lawyer)可用下列产生式规则来表示其句法结构跟语义解释之间的关系:
IF the sentence is of the form A noun—1 verb a noun—2
THEN the meaninng is that an instance of noun—1 has therelation verb to an instance of noun—2
IF the sentence is of the form A noun—1 was verbed by anoun—2
THEN the meaning is that an instance of noun—2 has therelation verbed to an instance of noun—1
从结构上看,产生式系统由数据库(database)、规则集(set ofrules)和控制系统(control system)三部分组成。 数据库是一个关于事实的数据结构,它包含所求解问题的有关信息。规则集是产生式规则的集合,它蕴涵着问题从初始状态到目标状态(解)的变换规则。一条产生式规则满足了条件项之后就可对数据库进行操作,使其发生转换并向目标状态逼近。控制系统是一个推理程序,它包含了推理方式和控制策略,用以控制协调规则集和数据库的运行,规定问题求解过程的推理路线。数据库和规则集可以合称知识库,控制系统又叫推理机,一般的形式化体系都有这两个部分。〔3 〕用产生式系统作为语言的计算分析的形式化体系是比较理想的。比如,在语言学中,判定任意一个语符列是不是一个合语法的句子是一个句法分析问题,我们可以用产生式系统来求解这个问题。首先,在数据库中设定某种语言的语法有如下两种语法成分:终结9牛簅f approves new president company sale the
非终结符号:S NP VP PP P V DNP DET A N 其次,在规则集中设定该语言的语法有如下的重写规则(rewrite rule):
N→NPapproves→V
A NP→NP new→A
DET NP→NP
President→N
P DNP→PPcompany→N
V DNP→VPsale→N
DNP VP→Sthe→DET
of→P
现在来分析下面这个语符列是不是该语言的一个合语法的句子:〔4〕
The president of the new company approves the sale
这个待分析的句子就是初始数据,目标数据是具有单个符号的S。 产生式规则可从上述语法重写规则推得,一条语法规则右边的符号可替代数据库中跟语法规则左边匹配的任一符号串。例如,根据规则DNP VP→S可以把数据库中任一DNP VP子串用S替代,因此可能有不同的替代结果,控制系统规定选择最逼近目标数据的替换操作。可以给出求解这个问题的部分搜索树,以了解语言的计算分析中符号运算这一关键步骤的若干细节。
语言的计算分析可以粗略地分为三个步骤:(1)知识抽取,(2)形式表示,(3)逻辑推导。由于自然语言的复杂性, 对语言进行全面而彻底的计算分析是很困难的。目前只要做到面向计算的语言分析(computation—oriented linguisic analysis)就很有实践意义了。语言学家只需把有关的语言规则准确地抽取出来,并用近似产生式规则的“条件——结果”形式去明确地表述。至于怎样形式化或用什么形式体系来建立一个计算结构,那是计算机专家的工作。现在的计算技术足以保证计算机专家去完成自然语言的计算机自动分析这一富有应用前景的工作。
比如,上文对例(1)~(4)和(6 )的认知解释就不是一种面向计算的分析。为了得出面向计算的规则,必须经过知识求精,先设定在词库(lexicon)中给谓词标明选择特征, 给名词标明可由它激活的强特征和弱特征,再抽取出下列便于用产生式作形式表示的句法、语义规则:
i 如果谓词包含多项选择特征,并且大主语(subject—1 )所激活的一组语义特征中有几个跟它们重合,那么只有表示大主语的强特征的名词(充当小主语subject—2)可以省去(如(3a)→(3a’)、(4b)→(4b’)), 表示大主语的弱特征的名词(充当小主语subject—2)不可省去(如(3b)→(3b’)、(4a)→(4a’)。
ii 如果谓词包含多项选择特征,并且主语所激活的一组语义特征中有几个跟它们重合,那么只能选择主语的强特征作为语义解释(如(18a)(2b)和(6)),主语的弱特征不能进入语义解释(如(1b)(2a))。
从实用性上看,这种句法、语义规则是可操作的(operational ),它明确地指出了实施动作的条件和步骤;执行者可以根据上述规则所指示的过程(procedure)去完成省略充当小主语的属性名词[如(3a)→(3a’)、(4b)→(4b’)]或从省略属性名词的句子上得出正确的语义解释(如(1)→(1a)、(2)→(2b)、(6a)→(6a’)、(6b)→(6b’))这类任务。从结构形式上看,这种规则由条件项(如果……)和动作项(那么……)构成,因而是可计算的。这种算法化的规则经过形式化表示后,很容易在计算机程序上实现。这便是语言的计算分析所追求的目标之一。
四 理论背景和应用前景
在计算机科学中,人工智能研究者对于人类智能的本质有符号主义(symbolicism)和连接主义(connectionism)两种相对的认识。符号主义认为人类认知的元素是符号(symbol),认知过程就是在知识表示上的一种运算(operation)。 该学派强调人工智能的核心问题是知识表示,认为思维就是计算(computation)。与此相反, 连接主义反对把符号作为思维的基本元素,主张思维的基本元素就是神经元(neuron)本身,是大量神经元的整体活动构成了思维过程。简而言之,符号主义坚信大脑是一个串行的(serial)信息加工装置,信息在大脑中经过一系列可以确定的阶段逐步进行加工,每一阶段都发挥自己独特的作用,然后把信息送到另一阶段进行加工。连接主义坚信大脑是一个并行的(parallel)信息加工装置,信息在神经网络上同时进行加工。〔5 〕基于这种认识,连接主义学派创建了分布式并行处理的工作机制,避开了符号主义处理中知识表示的困难,改进了解决给定问题的速度,提高了计算机处理信息的效率。我们相信,语言理解这种高级的认知活动,其加工机制主要是串行的。因此,认知心理学和人工智能中的符号主义学说和信息的串行加工机制成为对语言进行认知研究和计算分析时主要的理论背景。
根据上文的讨论,认知在很大程度上是一种利用知识去解决问题的心理过程。假如把知识表示成一个有限的、一致的命题集合(包括事实、规则和约束等),并称之为“理论”(记作Th);那么一个完全的演绎推理过程,对于出现在它的Th演绎闭包(deduction closure )里的问题,总是能够解决的。〔6〕正是从这一点上说, 认知就是在知识表示上的一种逻辑运算,而逻辑运算又是可以还原为一定的算法(即还原为计算)的,所以认知科学家强调:人的心智过程可以理解为符号处理的计算过程,思维即是计算。对于语言理解来说,它需要的知识既包括句法、语义等语言学知识、也包括其他为语言理解所必需的世界知识。如果能把这些知识形式化为一种符号表达,即表示成一个有限的、一致的命题集合,那么,作为一种认知过程,语言理解便是知识表示上的一种运算。由此看来,对语言的认知研究的自然而合理的延伸便是对语言的计算分析。因此,语言的计算分析不仅具有应用上的必要性,而且具有理论上的可能性。人工智能的许多研究不仅为语言的计算分析提供了技术条件,而且已经开了这方面的先河(一批运转良好的自然语言理解系统便是证据)。当然,在讨论语言规则的可计算性时,我们还应当考虑计算的复杂性(complexity)这一问题(比如,知识库要多大才管用,运算的时间要多长才有结果)。
语言的认知研究和计算分析相结合,将产生一批对认知心理学有积极意义的成果。揭示语言理解的心理过程将为研究人类一般的认知处理机制提供局部的证据,从而使语言学真正成为探索人类心智这个伟大事业的一部分。语言的认知研究和计算分析相结合,将使语言研究直接为计算机处理自然语言服务。根据这种研究范式得出的语法规则是接近算法化的,因而容易形式化并在计算机程序上实现。语言的认知研究和计算分析相结合,对语言教学也有直接的应用价值。
应用语言学更重要的是研究怎样发展一种适合于工程技术的语言教学等应用领域的语言研究的理论和方法。
注释:
〔1〕详见袁毓林(1993)§4。
〔2〕〔3〕参考石纯一等(1993)145~169页,林尧瑞等(1990)271~303页。
〔4〕参考林尧瑞等(1990)33~35页。
〔5〕参考张钹、张铃《人工智能中的两个学派》, 《第一届中国人工智能联合学术会议论文集》,453~457页,吉林大学出版社,1990。
〔6〕如果一个问题(Q)不在某人的知识范围中(Th=Q), 那么他就不能解决它。他只有通过学习来扩大Th的演绎闭包,才有希望解决Q。
标签:语义分析论文; 人工智能技术论文; 语法分析论文; 认知过程论文; 形式化方法论文; 符号计算论文; 语言描述论文; 认知科学论文;