自然语言形式分析的奠基力作-纪念《句法结构》出版60年论文

自然语言形式分析的奠基力作
——纪念《句法结构》出版60年

冯志伟1,周 建2

(杭州师范大学 外国语学院,浙江 杭州 311121)

摘 要: 1957年,乔姆斯基《句法结构》出版,这是对结构主义的一系列基本原理提出的挑战,是自然语言形式分析的奠基力作,标志着语言学中的“乔姆斯基革命”的开始。此书着重阐述了形式语言理论和转换语法。在形式语言理论中,乔姆斯基将语言看成是一个抽象的数学系统。为了描写和解释语言现象,他论证了语法的生成能力,认为应该把语法看成是能生成无限句子的有限规则系统。在转换语法中,乔姆斯基认为,转换语法模型由直接成分层级、转换层级、语素音位层级三个层级构成。在运用转换规则时,具体的操作方式主要有调位、复写、插入、消去,转换使语法具有更强的解释力。

关键词: 乔姆斯基;《句法结构》;形式语言理论;转换语法

如果说,索绪尔语言学说的提出是语言学史上哥白尼式的革命,那么,乔姆斯基(N.Chomsky,1928— )的转换生成语法的提出,则是语言学史上的又一次划时代的革命,即“乔姆斯基革命”。

1916年索绪尔《普通语言学教程》的出版,开辟了现代语言学的新纪元,而1957年乔姆斯基《句法结构》的出版(Chomsky,1957),是对结构主义的一系列基本原理提出的挑战,标志着语言学中的“乔姆斯基革命”的开始。这场革命直到今天还没有完结(冯志伟,1982)。

《句法结构》一书出版已经60年了,这是一本对于现代语言学有重要影响的著作,也是自然语言形式分析的奠基力作,特写此文以志纪念。

将以上构建的高技术产业创新效率评价模型采用DEAP2.1软件进行计算,得到五个创新主体的创新效率评价相关结果,整理相关结果值得到相关数据如表2所示。

一、乔姆斯基与《句法结构》

1928年12月7日,乔姆斯基出生于美国费城。他的父亲威廉· 乔姆斯基(William Chomsky)是一个希伯来语学者,曾写过《大卫·金西的希伯来语法》(Davis Kimhi’s Hebrew grammar)一文。幼年的乔姆斯基(他的名字叫诺阿姆,即Noam Chomsky)在父亲的熏陶下,就爱上了语言研究工作。1947年,他结识了美国描写语言学“后布龙菲尔德学派”的代表人物、著名语言学家海里斯(Z.Harris,1909—1992)。在研读了海里斯《结构语言学方法》(Method in Structural Linguistics)之后,他被海里斯那种严密的研究方法深深地吸引住,几乎到了心醉神迷的程度。从此,他立志以语言学作为自己毕生的事业,进入海里斯执教的宾夕法尼亚大学,专攻语言学。

乔姆斯基是熟悉希伯来语的,掌握了《结构语言学方法》的基本原理之后,他试图用海里斯的方法来研究希伯来语,但所获甚微。于是,他决定把海里斯的方法作适当的调整,建立一种形式语言理论,采用递归的规则来描写句子的形式结构,从而使语法获得较强的解释力。

从1947年到1953年,乔姆斯基花了整整六年时间来从事这项研究。其间,1949年在巴尔希列尔(Y.Bar-Hillel,1915—1975)的鼓励和支持下,提出了一套描写语言潜在形态的规则系统。1951年在宾夕法尼亚大学完成了硕士论文《现代希伯来语语素音位学》。1951年后,他到哈佛大学学术协会任职,以正式会员的身份从事语言研究工作。1953年,他在《符号逻辑杂志》(Journal of Symbolic Logic)上发表了《句法分析系统》(System of Syntactic Analysis),此文对美国描写语言学的方法进行了形式化描述。他感到,在结构主义的框架中研究语言,往往会得出错误的结论。

好在今年6月,王述金的弟弟王述银带领沮水巫音乐班从武汉表演回来,他激动地告诉我,哥哥生前的愿望要实现了。

为了完成形式语言理论这一有意义的课题,在海里斯的建议下,乔姆斯基从1953年开始学习哲学、逻辑学和现代数学。这个时期,他受到了古德斯曼(N.Goodsman)的“构造分析法”的影响,也受到了奎恩(W.V.O.Quine)对逻辑学中的经验主义批判的影响,他采用的语言研究方法是严格的、形式化的。同时,他对美国描写语言学的方法越来越不满意,在哈勒(M.Halle)的支持下,乔姆斯基决心同结构主义思想彻底决裂,另起炉灶,走自己的新路。

1954年,乔姆斯基着手撰写《语言理论的逻辑结构》(The Logical Structure of Linguistic Theory)一书。在这部著作中,他初步勾画出生成语法的理论观点和思想方法。1955年,《语言理论的逻辑结构》(Chomsky,1975)书稿完成,乔姆斯基回到宾夕法尼亚大学,并以论文《转换分析》(Transformational analysis)获得了博士学位。

1955年秋,乔姆斯基经哈勒和雅可布逊推荐,到麻省理工学院(MIT)电子学研究室做研究工作,并在现代语言学系任教,给研究生讲授语言学、逻辑学、语言哲学等课程。麻省理工学院电子学研究室在著名学者魏斯奈尔(Jerome Wiesner)的领导下,为多学科的联合研究提供了良好的环境,这样,乔姆斯基就可以专心致志地从事自己的研究工作。

这时,乔姆斯基的形式语言理论的思想已基本成熟,他更加清晰地认识到结构主义的方向是完全错误的,他开始大胆地向结构主义挑战。

1956年,在哈勒的建议下,乔姆斯基把自己在麻省理工学院给本科生讲课的一些笔记,交给了荷兰摩顿(Mouton)公司的《语言学丛书》(Janua Linguarum)的编辑舒纳费尔德(C.V.Schoonefeld)。舒纳费尔德独具慧眼,答应出版这些笔记。经过一番修改之后,由摩顿公司在1957年以《句法结构》(Syntactic Structures)为题出版。此书的出版,得到了美国陆军通讯兵团,美国空军科学研究署、空军研究部、空军开发部和美国海军研究署的资助,还得到了美国国家科学基金会和伊斯特曼·柯达公司的资助。可见美国海陆空三军以及美国国家基金会对此书的重视。

转过脸,再看那几盆争奇斗艳的牡丹,我只能一声轻叹。这牡丹永远都不会有昙花的内敛!看它们那鲜红欲滴的颜色,娇艳得令人心颤,却又是那么张扬,那么招摇——花瓣层层叠叠展开,艳面朝天,似乎唯恐人们不知道它的美丽。殊不知,这种过分的渲染难免使人腻味。正如《三国演义》中的杨修,生怕人们不知道他的聪明,一次次地彰显才华,以哗众取宠,结果却招来了杀身之祸。可见,内敛是生命中一种多么可贵的品质!

从此,乔姆斯基的语言学说开始在语言学界传播开来,并进一步发展成为众所周知的转换生成语法(transformational generative grammar)。2002年,德国德古意特公司(De Gruyter GmbH&Co.KG)出版了《句法结构》的第二版(Chomsky,2002)。可以说,《句法结构》是自然语言形式分析的奠基性著作,对于现代语言学的发展具有重要的意义。

在撰写《句法结构》前后,乔姆斯基还在1956年至1963年间,发表了《语言描写的三个模型》(Chomsky,1956)、《论语法的一些形式特性》(Chomsky,1959)、《上下文无关语法和后进先出存储器》(Chomsky, 1962)和《语法的形式特性》(Chomsky,1963)等论文。本文也结合这些论文来分析《句法结构》,这样将有助于我们更加深入地理解《句法结构》的内容。

用1 mL无菌分度吸量管吸取1.3.1中1:10样品稀释液1 mL,沿管壁慢慢注入装有9 mL稀释液的无菌中号试管中,操作过程中分度吸量管流液口不能触碰稀释液,否则可能导致检测结果偏高。使用旋涡混合器振摇试管1 min其混合均匀,制成1:100的样品稀释液。另取1 mL无菌分度吸量管,按照上述操作步骤,按10倍系列依次制备样品稀释液,每递增稀释一次,需换用新的分度吸量管。

二、形式语言理论

乔姆斯基在《句法结构》中,以语言学家可以理解的方式介绍了他的形式语言理论(formal language theory)和转换语法(transformational grammar)。

(一)语法生成的方法

形式语言理论的研究对象,除了自然语言之外,还包括程序语言和其他人造语言。在形式语言理论中,语言(Language)被看成是一个抽象的数学系统,乔姆斯基把它定义为:按一定规律构成的句子(Sentence)或符号串(String)的有限的或无限的集合,记为L。

每个句子或符号串的长度是有限的,它们由有限数目的符号相互毗连而构成。构成语言的有限个符号的集合,叫做字母表 (alphabet)或词汇(Vocabulary),记为V;不包含任何符号的符号串,叫做空句子(empty Sentence)或空符号串(empty String),记为 ε。

如果V是一个字母表,那么,把由V中的符号构成的全部句子(包括空句子ε)的集合,记为V*,而把V中除了ε之外的一切句子的集合,记为V+。例如,如果V={a,b},则

但是,某语言的字母表V中的符号相互毗连而成的符号串,并不一定都是该语言中的句子。例如,“the boy hit the ball”在英语中是正确的,叫做“成立句子”;而由同样符号构成的“*the hit the boy hall”在英语中却是不正确的,叫做“不成立句子”。为了区别一种语言中的成立句子和不成立句子,就有必要把这种语言刻画出来,从而说明在这一种语言中,什么样的句子是成立的,什么样的句子是不成立的。乔姆斯基认为,可以采用三种办法来刻画语言。第一种,穷尽枚举法,即把语言中的全部成立句子穷尽地枚举出来。

如果语言只包含有限数目的句子,要穷尽地枚举是能办到的;而如果语言中句子数目是无限的,用简单枚举的办法就行不通。

而且,在很多场合,对于语言中某一个长度有限的句子,还可以采用一定的办法将其长度加以扩展。例如,对于英语句子

This is the man.(这是那个男人。)我们可以将其扩展为:

This is the man that married the girl.(这是那个同姑娘结婚的男人。)还可以进一步扩展为:

引导各类公共资源和生产要素向乡镇流动,积极推进城乡规划、产业布局、基础设施、公共服务、社会管理、市场体系,优化城乡空间布局,加快产业发展,实行基础设施共建共享,促进城乡公共服务均等化。加大城市基础设施建设投入,鼓励大型商贸企业将网点拓展到农村。积极推进城市公交、供水、燃气、污水和垃圾处理向周边村镇延伸,促进城乡基础设施共建共享。加强农村文化设施建设,积极开展文化、科技、卫生对农村的支援活动。

这样,由语法G生成的语言L(G)的形式化定义为:L(G) = (W︱W在中,并且

乔姆斯基认为,可以在句子里加上任意数目的that-从句,每加一个这样的从句就构成了一个新的更长的句子,而这些句子都是成立的。究竟能加多少个that-从句,只与讲话人的记忆力及耐心有关,而与语言本身的结构无关。从这个意义上说,人们能够加上无限数目的that-从句而使句子保持成立。在这样的情况下,用穷尽枚举的办法来刻画语言显然是行不通的。

第三,不存在任何的φ、ψ和ω,使得ψφ φ→ψωφ;

例如,上面三个句子可以这样统一地加以描述:

设X是一个初始符号,S为句子,R为that-从句,提出重写规则:

X→S

S→SR

这里,“→”是重写符号, “”是毗连符号,利用这两条规则,可以生成数目无限的带that-从句的句子。

乔姆斯基把这些数目有限的刻画语言的规则,叫做“语法”(grammar),记为G。语法是有限规则的集合,这些规则递归地生成潜在的无限的句子,并排除语言中的不成立句子。语法G所刻画的语言,记为L(G)。需要注意的是,乔姆斯基在这里所说的“语法”,与一般语言学书中所说的“语法”不是一回事,它有着如上所述的特定的含义。

乔姆斯基指出,早在19世纪初,德国杰出的语言学家和人文学者洪堡特(W.V.Humboldt,1767—1835)就观察到“语言是有限手段的无限运用”。但是,由于当时尚未找到能揭示这种观点的本质内容的技术工具和方法,洪堡特的论断还是不成熟的。那么,究竟如何来理解语言是有限手段的无限运用呢?

乔姆斯基认为,“一个人的语言知识是以某种方式体现在人脑这个有限的机体之中的,因此语言知识就是一个由某种规则和原则构成的有限系统。但是一个会说话的人却能讲出并理解他从未听到过的句子以及和我们听到的不十分相似的句子。而且,这种能力是无限的。如果不受时间和注意力的限制,那么由一个人所获得的知识系统规定了特定形式、结构和意义的句子的数目也将是无限的。不难看到这种能力在正常的人类生活中得到自由的运用。我们在日常生活中所使用和理解的句子范围是极大的,无论就其实际情况而言还是为了理论描写上的需要,我们完全有理由认为人们使用和理解的句子范围都是无限的。”(Chomsky,1982)

递归是体现“有限手段的无限运用”的最好办法。乔姆斯基提出的“语法”就恰恰采用了递归的办法。

第三种,自动机识别法,即提出一种装置来检验输入符号串,用这种装置来识别该符号串是不是语言L中的成立句子。如果是成立句子,这个装置就接收它;如果是不成立句子,这个装置就不接收它。乔姆斯基把这样的装置叫做“自动机”(automata),它是语言的“识别程序”(recognizer),记为R。

如果α→β是P的重写规则,φ1和φ2是V*上的任意符号串,应用重写规则α→β于符号串φ1αφ2,得到符 号串 φ1βφ2。那么, 可写为φ1αφ2φ1βφ2,读为:在语法G中,φ1αφ2直接推导出φ1βφ2。就是说,当应用某个单独的重写规则从第一个符号串得到第二个符号串的时候,表示这两个符号串之间的直接推导关系。

语法和自动机是形式语言理论(formal language theory)的基本内容。如果要想了解乔姆斯基关于语言“生成”的基本概念,必须认真地研究他的形式语言理论中关于语法的论述,否则,我们就很难理解“生成”这一概念的实质。

乔姆斯基从形式上把语法定义为四元组:

其中,VN是非终极符号,不能处于生成过程的终点;VT是终极符号,能处于生成过程的终点。

而除了入股普洛斯外,万科还与四家公司共同设立60亿元的物流地产基金,用于投资境内确定区域的拟建、在建及已建成的物流地产项目。很显然,物流市场已经成为了万科在房地产开发之外的重点业务。

显然,VN与VT构成了V,VN与VT不相交,没有公共元素。我们用∪表示集合的并,用∩表示集合的交,则有

V=VN∪VT

VN∩VT=φ (φ 表示空集合)

尽管我国已经制定了大量的少数民族高等教育政策来推动少数民族高等教育的发展,我国的少数民族高等教育事业也已经取得了显著成绩,但是,我国的少数民族高等教育政策还是存在不足之处,需要我们深入思考,从而找到解决的对策。

VN中的符号用大写拉丁字母表示;VT中的符号用小写拉丁字母表示;符号串用希腊字母表示,有时也可以用拉丁字母表中排在后面的如w之类的小写字母来表示。

S是VN中的初始符号,它是生成过程的起点。

荥经黑砂是一种历史悠久的传统工艺品,在传承匠人先辈技艺的基础上,我们还要结合当代美学、审美,做到传承和创新并重,将其打造成中国文化的名片,才能把非物质文化遗产发扬光大,让其走向国际舞台。

P是重写规则,其一般形式为:

φ→ψ

这里,φ是V+中的符号串,ψ是V*中的符号串① V *false表示由V false中的符号构成的全部符号串(包括空符号串φ false)的集合,V +false表示V *false中除φ false之外的一切符号串的集合。例如,如果V = { a ,b } false,则有 V *={φ ,a b aa ab ba bb aaa …}false,V + = { a ,b aa ab ba bb aaa …}false。,也就是说,φ≠φ ,而可以有ψ=φ 。

如果用符号“#”来表示符号串中的界限,那么,可以从初始符号串#S#开始,运用重写规则#S#→#φ1#,从#S#构成新的符号串#φ1#;再运用重写规则#φ1#→#φ2#,从#φ1#构成新的符号串#φ2#……一直重写下去,当得到不能再继续重写的符号串#φn#才停止。这样得到的终极符号串#φn#,显然就是语言L(G)的成立句子。

重写符号“→”读为“可重写为”,它要满足如下条件:

第一,“→”不是自反的;

抽蓄电站汛期冷却水备用水源设置研究与探讨………………………………… 臧克佳,郑凯,和扁,严丽(12-97)

第二,A∈VN,当且仅当存在φ、ψ和ω使得φAψ→φωψ② “当且仅当”是数学上表示充分条件的一种习惯用法,它的含义是“在某种条件下,而且只在这种条件下”。 ;

第二种,语法生成法,即制定有限数目的规则来生成(generate)语言中无限数目的句子。

第四,存在元素对(χ1,ω1),…,(χj,ωj),…,(χn,ωn)的有限集合,使得对于一切的φ、ψ,当且仅当存在φ1,φ2,及j≤n时,φ=φ1χjφ2和ψ=φ1ωjφ2,那么,φ→ψ。

限制1:如果φ→ψ,那么,存在A,φ1,φ2,ω,使得φ=φ12,ψ=φ1ωφ2

例如,在英语中,有如下的语法:

因此,本文提出一种新型GIS设备气体泄漏检测报警装置,将该装置固定在GIS设备上,即可快速方便检测预知GIS设备是否有气体泄漏,并且能够检测其泄漏的情况,该装置结构简单,易于安装, 可达到快速高效检测SF6气体泄漏情况的目的[5] 。

这里,初始符号S表示句子,NP表示名词短语,VP表示动词短语(这里的V与表示字母表的符号V不同)。

利用这些重写规则,可以从初始符号S开始,生成英语的成立句子“the boy hit the ball”“the man saw the ball”“the man took the ball”“the man hit the ball”等等。

“the boy hit the ball”的生成过程可写成如下形式,后面注明所用重写规则的号码:

CCUS(碳捕集、利用和封存)是近年来国际社会应对气候变化的热点问题。数据显示,近150年左右,大气中的二氧化碳含量大幅度增长,由工业革命前的280mg/L上升至目前的396mg/L,导致全球气温上升。全球碳捕集研究院发布报告预警称,如果碳排放没有大幅度减少,预计到本世纪末全球升温超过2℃,极端天气和自然灾害将更加频发。

语法也可用于生成符号语言(symbolic language)。例如:

利用这个语法,可以生成所谓“有中心元素的镜象结构语言”。这种语言的句子由三部分构成:第一部分是若干个a和若干个b相毗连;第二部分是单个的符号c;第三部分是在c后与第一部分成镜象关系的若干个a和若干个b的毗连,如abcba,bbacabb,ababacababa……。这种结构叫做“镜象结构”。如果用α表示集合{a,b}上的任意非空符号串,用α*表示α的镜象,则这种语言可表示为:αcα*

这样写出来的生成过程,叫做推导史(derivational history)。当然,由于这里写出的语法只是英语语法的一个小片段,因而用这样的语法生成的语言,也只是英语的一小部分。

如果我们要生成符号串abbaacaabba,那么,从S开始的推导史如下:

4.2.2 资源优势。高校团委是高校的核心组织之一,各类学生、专家教授的资源源源不断的流入,通过不断的培养、交流和沟通,形成具有相对权威性的师生创业团队资源。高校团委也是对外交流和合作的一个重要的平台,是各项创业活动的组织者、开创者,且高校团委还拥有相当丰富的活动阵地和活动资源,无论是学校内部还是校外的一些单位、企业的创业信息资源的收集也会更具优势,对于外部信息和资源,高校团委在审核筛选之后,有效的推送、宣传学习,给予创业团队丰富的校外资源和信息,高校团委在一定程度上也是学生创业团队重要的信息来源支撑。

显然,由这个语法生成的语言的符号串,其数目是无限的。

下面,我们来给语法G所生成的语言L(G)下一个形式化的定义。为此,要引入表示V*上的符号串之间关系的符号

先对这两个符号的含义作一说明。

由此可见,刻画某类语言的有效手段,是语法和“自动机”。语法用于生成此类语言,而“自动机”则用于识别此类语言。

假定α1α2,…,αm是V*上的符号串,并且,那么,这种关系可以写为,读为:在语法G中,α1推导出αm。由此可见,表示α1和αm这两个符号串之间的推导关系。换句话说,如果应用P中的若干个重写规则由α得到β,那么,对于两个符号串α与β,就有

This is the man that married the girl that brought some bread.(这是那个和带来了一些面包的姑娘结婚的男人。)

这个定义的含义是:对于一切符号串W的集合,W在中,并且有,那么,符号串W的集合就是由语法G生成的语言L(G)。

由此可见,一个符号串处于L(G)中要满足两个条件:

条件1:该符号串只包括终极符号;

条件2:该符号串能从初始符号S推导出来。

从公元前21世纪大禹创行了沟洫制度,有遂、沟、洫、浍排水蓄洪,从而进入农主牧辅的农耕时代。又过了1 300多年,到后汉、魏晋时期(公元前770年—前317年),兴建了很多陂、堨、塘、湖等蓄水工程灌溉农田,人类赖以生存的粮食生产得到了很大发展。新中国成立后,坑塘建设进入了一个飞跃发展的新时期。

同一语言可由不同的语法来生成,如果L(G1) =L(G2),则语法G1等价于语法G2

前面所定义的语法G=(VN,TT,S,P),其重写规则为φ→ψ,并且要求φ≠φ 。

(二)语法生成的类型

以上定义的语法,生成能力过于强大。有鉴于此,乔姆斯基给上述语法加上了程度不同的限制,从而得到了生成能力各不相同的几类语法:

可见,语法包含着有限个规则χj→ωj,这些规则充分地确定了该语法全部可能的生成方式。这样,用这有限数目的规则,就可以递归地生成语言中无限数目的句子。

限制2:如果φ→ψ,那么,存在A,φ1,φ2,ω,使得φ=φ12,ψ=φ1ωφ2,并且A→ω。

限制3:如果φ→ψ,那么,存在A,φ1,φ2,ω,使得φ=φ12,ψ=φ1ωφ2,A→ω,并且ω=aQ或ω=a,因而,A→aQ或A→a。

限制1要求语法的重写规则全都具有形式φ12→ φ1ωφ2,这样的重写规则在上下文φ1→φ2中给出A→ω。显然,在这种情况下,ψ这个符号串的长度(即ψ中的符号数)至少等于或者大于φ这个符号串的长度(即φ中的符号数),如果用|ψ|和|φ|分别表示符号串ψ和φ的长度,则有|ψ|≥|φ|。由于在重写规则φ12→φ1ωφ2中,每当A出现于上下文φ1→φ2中的时候,可以用ω来替换A,因此,把加上了限制1的语法叫做上下文有关语法(context-sensitive grammar)或1型语法(type 1 grammar)。

限制2要求语法的重写规则全都具有形式A→ω,这时上下文φ1─φ2是空的,在运用重写规则时不依赖于单个的非终极符号A所出现的上下文环境。因此,把加上了限制2的语法叫做上下文无关语法(context-free grammar)或2型语法(type 2 grammar)。

限制3要求语法的重写规则全都具有形式A→aQ或A→a,其中,A和Q是非终极符号,a是终极符号。这种语法叫做有限状态语法(finite state grammar)或3型语法(type 3 grammar),有时也叫做正则语法(regular grammar)。

没有上述限制的语法,叫做0型语法(type 0 grammar)。

显而易见,每一个有限状态语法都是上下文无关的;每一个上下文无关语法都是上下文有关的;每一个上下文有关语法都是0型的。乔姆斯基把由0型语法生成的语言叫0型语言(type 0 language),把由上下文有关语法、上下文无关语法和有限状态语法生成的语言分别叫做上下文有关语言(contextsensitive language)、上下文无关语言(contextfree language)和有限状态语言(finite state language),也可以分别叫做1型语言(type 1 language)、2型语言(type 2 language)和3型语言(type 3 language)。

由于从限制1到限制3的限制条件是逐渐增加的,因此,不论对于语法或对于语言来说,都存在着如下的包含关系① ⊇false表示包含关系,A⊇falseB表示B包含于A中,B也可以等于A。 :

0型⊇1型⊇2型⊇3型

图示如1:

图1 语法和语言的分类

上述四种类型的语法及其所生成的语言的卓越见解,是乔姆斯基对于形式语言理论的最为重要的贡献,在计算机科学界,人们把它称为“乔姆斯基层级”(Chomsky hierarchy)。图示如2:

图2 乔姆斯基层级

下面进一步对这四种类型加以说明。

1.有限状态语法

有限状态法的重写规则为A→aQ或A→a(A→a只不过是A→aQ中,当Q=φ 时的一种特殊情况)。如果把A和Q看成不同的状态,那么,由重写规则可知,当状态A转入状态Q时,可生成一个终极符号a。这样,便可把有限状态语法想象为一种生成装置,这种装置每次能够生成一个终极符号,而每一个终极符号都与一个特定的状态相联系。

我们改用小写字母q来表示状态,如果这种生成装置原先处于状态qi,那么,生成一个终极符号后,就转到状态qj;在状态qj再生成一个终极符号后,就转到状态qk,如此类推。这种情况可用“状态图”(state diagram)来表示。

如果这种生成装置原先处于某一状态qO,生成一个终极符号a后,转入状态q1,那么,其状态图为图3所示:

图3 生成语言a的状态图

这个状态图生成的语言是a。

如果这种生成装置原先处于状态qo,生成终极符号a后,转入状态q1,在状态q1再生成终极符号b后,转入状态q2,那么,其状态图为图4所示:

图4 生成语言ab的状态图

这个状态图生成的语言是ab。

如果这种生成装置处于状态qo,生成终极符号a后,又回到qo,那么,其状态图为图5所示:

图5 生成语言{a*}的状态图

这种状态图形成一个“圈”(loop),它生成的语言是a,aa,aaa,aaaa,等等,可简写为{an},其中n≥ 0。

如果这种生成装置处于状态qO,生成终极符号a后转入状态ql,在状态q1,或者生成终极符号b后再回到q1,或者生成终极符号c后转入状态q2,在状态q2,或者生成终极符号b再回到状态q2,或者生成终极符号a后转入状态q3,那么,其状态图为图6所示:

图6 生成语言{abncbma}的状态图

这个状态图生成的语言是 aca,abca,abcba,abbcba,abcbba……, 可 简 写 为 {abncbma}, 其 中n≥0,m≥0。这种生成装置在生成了若干个终极符号之后,还可转回到前面的状态,构成一个大的封闭圈。例如下面图7中的状态图:

图7 含有大封闭圈的状态图

这个状态图可以生成如acde,abacdee等终极符号串,状态图中的“#”表示空符号。由于使用了空符号“#”,进入状态q3之后,还可以返回到初始状态qo,继续生成新的符号串。例如,在生成了符号串abacd之后,还可以返回初始状态qo,继续生成符号串acdeee,这样最终就可以生成符号串abacdacdeee。这时,qo既是初始状态,又是最后状态。

这个状态图生成的语言,可简写为{a(ba)ncdem},其中n≥0,m≥0。

可见,给出一个状态图,就可以按着图中的路,始终顺着箭头所指的方向来生成语言。当达到图中的某一状态时,可以沿着从这一状态引出的任何一条路前进,不管这条路在前面的生成过程中是否已经走过;在从一个状态到另一个状态时,可以容许若干种走法;状态图中还可以容许出现任意有限长度的、任意有限数目的圈。这样的生成机制,在数学上叫做“有限状态马尔可夫过程”(finite state Markov process)。

状态图是有限状态语法的形象表示法,因此,根据状态图就可以轻而易举地写出其相应的有限状态语法。例如,与图7中的状态图相应的有限状态语法如下:

在这个语法中,qo,q1,q2,q3表示状态,它们都是非终极符号,不难看出,P中的各个重写规则都符合于有限状态语法重写规则的形式。

然而,由于有限状态语法的重写规则限制较严,因而存在着不少缺陷。

第一,有一些由非常简单的符号串构成的形式语言,不能由有限状态语法生成。乔姆斯基举出了如下三种形式语言:

①ab,aabb,aaabbb……,它的全部句子都是由若干个a后面跟着同样数目的b组成的,这种形式语言可表示为L1={anbn},其中n≥1。

② aa,bb,abba,baab,aaaa,bbbb,aabhaa,abbbba……,这种形式语言是没有中心元素的镜象结构语言。如果用α表示集合{a,b}上的任意非空符号串,用α*表示α的镜象,那么,这种语言可表示为L2={αα*}。

③ aa,bb,abab,aaaa,bbbb,aabaab,abbabb……,它的全部句子是由若干个a或若干个b构成的符号串,后面跟着而且只跟着完全相同的符号串,如果用α表示集合{a,b}上的任意非空符号串,那么,这种语言可表示为L3={αα}。

L1,L2,L3都不能由有限状态语法生成,可见,这种语法的生成能力是不强的(冯志伟,2015)。

第二,在英语中存在着如下形式的句子:

① If S1,then S2.

② Either S3,or S4.

③ The man who said S5,is arriving today.

在这些句子中,if——then,either——or,man——is存在着相依关系,这种句子与乔姆斯基指出的、具有镜象特性的形式语言L2很相似,也是不能用有限状态语法生成的。

第三,有限状态语法不适于描写自然语言。

例如,可以提出一个有限状态语法来生成两个英语句子:“the man comes”与“the men come”。其状态图见图8:

图8 生成“the man comes”及“the men come”的状态图

如果在状态1q 处加一个圈,则状态图变为图9:

图9 在图8的状态q1处加了一个圈

这时,这个有限状态语法除了能生成上面的两个句子之外,还可生成“the old man comes”“the old o1d man comes”……以及“the o1d men come”“the o1d o1d men come”……等句子。可以看出,其中一些句子在英语中是不成立的。

又如,可以提出这样的有限状态语法来生成英语句子:“I shave myself”(我给我自己刮胡子)。其状态图见图10:

图10 生成“I shave myself”的状态图

如果除了“I shave myself”之外,还要生成句子“you shave yourself”(你给你自己刮胡子),则可提出如图11所示的状态图:

图11 彼此钩连的状态图

但是这个状态图也可生成“I shave yourself”这样的不成立句子。为了防止生成这种不成立句子,必须把状态图分成两路,使得它们不能彼此钩连。如此一来,状态图就变得更为复杂。见图12:

图12 更为复杂的状态图

如果要把“in the morning”这样的短语加在前面的句子上,那么还要在上面那个状态图中加上如图13所示的状态图:

图13 新加上的状态图

这样一来,状态图就会变得十分复杂。如果要生成英语中的一篇文章、一本书籍,那么其状态图不知要有多么复杂!由此可见,有限状态语法作为一种刻画自然语言的模型会显得无能为力。

第四,有限状态语法只能说明语言中各个符号的排列顺序,而不能说明语言的层次,因此,不能解释语言中的许多歧义现象(ambiguity)。如“o1d men and women”这个短语有两个意思:一个意思是“一些年老的男人和一些女人”(男人都是年老的,而女人未必都是年老的),另一个意思是“一些年老的男人和一些年老的女人”(男人和女人都是年老的)。这种现象不能用有限状态语法来说明其线性排列顺序上有何差异,也不能通过线性排列顺序的差异进行解释。可见,有限状态语法对语言现象的解释力不强。

2.上下文无关语法

为了克服有限状态语法的缺陷,乔姆斯基提出了上下文无关语法。

上下文无关语法的重写规则形式是A→ω。其中,A是单个的非终极符号,ω是异于ε的符号串,即|A|= 1≤|ω|。应该注意的是,“上下文无关”指的是语法中的重写规则形式,而不是指不能利用上下文来限制它所生成的语言。前面提到过的镜象结构语言的语法,其重写规则的左边都是单个的非终极符号S,右边都是异于ε 的符号串① 这里用希腊字母ε来表示空符号。 ,因而它是上下文无关语法。

上下文无关语法的推导过程,是由“推导树”(derivation tree)来描述的。乔姆斯基又把“推导树”称为语法的“C-标志”(C-marker)。“树”(tree)是图论中的一个概念。树由边(edge)和结(node)组成,它是由边连接着的结组成的有限集合。如果一个边由结1指向结2,那么,就可以说边离开结1而进入结2。如图14所示:

图14 树由边和结组成图

作为图论的树必须满足如下三个条件:第一,树中要有一个没有任何边进入的结,这个结叫做根(root);第二,对于树中的每一个结,都要有一系列的边与根连接着;第三,除根以外,树中的每一个结都只能有一个边进入它,因此,树中没有“圈”(loop)。

如果有一个边离开给定的结m,而进入结n,那么所有的结n的集合就叫做结m的“直接后裔”(direct descendant)。如果有一系列的结 n1,n2,……,nk,使得n1=m,nk=n,并且对于每一个i来说,ni+1是ni的直接后裔,那么结n就叫做结m的“后裔”(descendant)。同时规定,一个结是它自身的后裔。

对于树中的每一个结,可以把其直接后裔按顺序从左到右排列起来。

设G=(VN,VT,S,P)是上下文无关语法,如果有某个树满足如下条件,它就是G的推导树:

第一,每一个结有一个标号,这个标号是V中的符号;第二,根的标号是S;第三,如果结n至少有一个异于其本身的后裔,并有标号A,那么,A必定是VN中的符号;第四,如果结n1,n2,……,nk是结n的直接后裔,从左到右排列,其标号分别为A1,A2,……,Ak,那么,A→A1A2……AK,必是P中的重写规则。

例如,我们可以考虑这样的语法:

这个语法的四个重写规则,左边都是单个的非终极符号S或者A,右边都是异于ε的符号串,因而它是上下文无关语法。

现在我们画出这个语法的推导树。为了便于说明,我们用圆圈表示结,把结编上号码,把标号注在结的旁边,边的方向都假定是直接向下的,不再用箭头标出。这个推导树如图15所示:

图15 推导树

从这个推导树可以看出,1、3、4、5、7等结都有直接后裔。结1的标号为S,其直接后裔的标号从左算起为a、A和S,因此S→aAS是重写规则。结3的标号为A,其直接后裔的标号从左算起为S、b、A,因此A→SbA是重写规则。结4和结5的标号为S,它们每一个的直接后裔的标号为a,因此S→a是重写规则。结7的标号为A,其直接后裔的标号从左算起为b和a,因此A→ba也是重写规则。由此可见,刚才画出的语法G的推导树,满足了推导树所要求的各个条件。

在任何树中,总有一些结是没有后裔的,这样的结叫做“叶”(leaf)。如果从左到右读推导树中各个叶的标号,就可以得到一个终极符号串,这个终极符号串叫做推导树的“结果”(result)。可以证明,如果α是上下文无关语法G=(VN,VT,S,P)的结果,则。例如,在上述推导树中,各个叶从左到右的编号为2、9、6、10、11和8,它们的标号分别是a、a、b、b、a、a,则推导树的结果α=aabbaa,因此,aabbaa。

在实际使用中,常常将推导树的结及其编号去掉,把推导树加以简化。如前面的推导树可简化为图16:

图16 简化的推导树

也可以把这个过程写为:

仍然用这个语法的重写规则,如果改换推导过程,还可以得到该语法生成的其他终极符号串。例如:

上下文无关语法克服了有限状态语法的缺陷,它具有如下的优点:

第一,上下文无关语法的生成能力比有限状态语法强。乔姆斯基指出的语言L1={anbn}及语言L2={αα*},不能由有限状态语法生成,但可以用上下文自由语法来生成。现在我们就来生成语言Ll及L2

提出上下文无关语法:

从S开始,用第一个重写规则(n-1)次,然后再用第二个重写规则1次,我们便可以得到:

可见,这样的语法能够生成语言L1={anbn}。

我们又提出上下文无关语法:

这样的语法可生成语言L2={αα*}。例如,如果要生成语言{αα*}中的符号串babbbbab,其推导过程如下:

可是,用上下文无关语法不能生成语言L3={αα},它的生成能力也是有一定限度的。

第二,为了用上下文无关语法来描写自然语言,乔姆斯基提出了“乔姆斯基范式”(Chomsky normal form)。他证明了,任何上下文无关语言,均可由重写规则为A→BC或A→a的语法生成,其中A,B,C ∈ VN,a ∈ VT

利用这样的乔姆斯基范式,可以把任何上下文无关语法的推导树简化为二元形式,也就是把它变成二叉的推导树。

例如,生成上下文无关语言{ancb2n}的语法的重写规则为:

如果生成符号串aacbbbb,其推导树如图17所示:

图17 aacbbbb的推导树

现在把这个语法的三个重写规则改写为乔姆斯基范式。

在这三个重写规则中,C→c是符合乔姆斯基范式要求的,不必再变换。我们先把S→aCbb及C→aCbb的右边换为非终极符号,用S→ACBB及A→a,B→b替换S→aCbb,用C→ACBB及A→a,B→b替换C→aCbb,然后再把S→ACBB,C→ACBB的右边换成二元形式,用S→DE,D→AC及E→BB替换S→ACBB,用C→DE,D→AC及E→BB替换C→ACBB。这样,便得到了如下符合乔姆斯基范式要求的语法的重写规则:

用乔姆斯基范式,可将符号串aacbbbb的推导树简化为如图18的二元形式的二叉树:

图18 二元形式的推导树

在乔姆斯基范式中,重写规则及推导树都具有二元形式,这就为自然语言的形式描写提供了数学模型。我们知道,自然语言中的句法结构一般都是二分的,因而一般都具有二元形式。美国结构主义语言学中提出的IC分析法,其直接成分一般都是二分的。由于乔姆斯基范式反映了自然语言结构的二分特性,因而通过该范式,可以使上下文无关语法在自然语言研究中得到广泛的应用。

例如,我们可以采用上下文无关语法的推导树,揭示语言结构的层次特性,从而区别某些有歧义的句子或短语。

前述的“old men and women”这个有歧义的名词短语,用有限状态语法是不能加以说明的,但用上下文无关语法就可以从层次的角度得到圆满的说明。

当其意思是“一些年老的男人和一些女人”时,其层次见图19:

图19 歧义句子层次分析之一

其推导树如图20所示① 图中,NP表示名词短语,AP表示形容词短语,CONJ表示连接词。 :

图20 歧义句子的推导树之一

当其意思是“一些年老的男人和一些年老的女人”时,其层次见图21:

图21 歧义句子层次分析之二

其推导树如图22所示:

图22 歧义句子的推导树之二

上下文无关语法采用这种二分的层次分析方法来揭示句子的内部结构规律。它说明,要判定两个语言片段是否同一,不仅要看组成这两个语言片段的词形是否相同,词序是否相同,而且还要看它们的层次构造是否相同。有限状态语法完全反映不了层次构造的情况。可见,上下文无关语法对语言现象的解释,比有限状态语法更为深入,它对语言现象的解释力,也比有限状态语法略胜一筹。

那么,上下文无关语法与有限状态语法之间存在什么样的关系呢?

乔姆斯基指出了如下的关系:

第一,每一个有限状态语法生成的语言都可由上下文无关语法生成。

在上下文无关语法的重写规则A→ω中,当ω为aQ或a时,即得

这就是有限状态语法的重写规则。这说明,上下文无关语法包含了有限状态语法。

第二,如果在上下文无关语法中,存在着某一非终极符号A,具有性质Aψ,这里φ和ψ都是非空符号串,那么这个语法就是自嵌入的(selfembedding)。乔姆斯基证明,如果G是非自嵌入的上下文无关语法,那么L(G)就是有限状态语言。他又证明,如果L(G)是上下文无关语言,那么只有在语法G是具有自嵌入性质的上下文无关语法时,L(G)才不是有限状态语言。

我们前面讨论过的{anbn},{αα*},{αcα*},{ancb2n}等上下文无关语言,不但在它们的语法的重写规则中,而且在用语法生成符号串的过程中,都会出现Aψ这样的推导式,具有自嵌入性质。因此,这些语言都不可能是有限状态语言,而是具有自嵌入性质的上下文无关语言。可见,确实存在着不是有限状态语言的上下文无关语言。

3.上下文有关语法

上下文有关语法中的重写规则P的形式为φ→ψ,φ和ψ都是符号串,并且要求|ψ|≥|φ|,也就是ψ的长度不小于φ的长度。

现有一种语言L={anbncn},它是n个a,n个b和n个c相毗连而成的符号串(n≥1)。生成这种语言的语法G是:

从S开始,用规则(i)n-1次,得到:

然后用规则(ii)1次,得到:

规则(iii)可以把(BC)n变换为BnCn。例如,如果n=3,有

这样,有:

接着,用规则(iv)1次,得到:

然后,用规则(v)n-1次,得到:

最后,用规则(vi)1次及规则(vii)n-1次,得到:

在这个语法中,它的各个重写规则的右边的符号数大于或等于左边的符号数,满足条件|ψ|≥|φ|,因此,这个语法是上下文有关语法。

例如,符号串“aaabbbccc”的生成过程如下:

符号串的变换 规则

这个上下文有关语法生成的符号串aaabbbccc的结构表示见图23:

图23 aaabbbccc的图示

可以看出,这个图示不是树形图。其中BCBC中间的CB重写成BC,BCBC前面一个B作为aB中的后一成分,BCBC后面一个C成为cC中的后一成分,这些成分的处理,都要使用上下文有关规则。

乔姆斯基指出,上下文有关语法与上下文无关语法之间存在着如下关系:

第一,每一个上下文无关语法都包含于上下文有关语法之中。

在上下文有关语法的重写规则φ→ψ中,φ和ψ都是符号串,当重写规则左边的符号串退化为一个单独的非终极符号A时,即有A→ψ,由于ψ是符号串,因而可用ω代替,即得A→ω。这就是上下文无关语法的重写规则。

第二,存在着不是上下文无关语言的上下文有关语言。

例如,乔姆斯基指出的不能用有限状态语法来生成的语言L3={αα},也不能用上下文无关语法来生成。但是,它却可以用上下文有关语法来生成。生成这种语言的语法如下:

在规则(iii)中,α是集合{a,b}上的任意非空符号串,由于αS的长度不大于αα的长度,并且αS不是单个的非终极符号而是符号串,所以,这个语法不可能是上下文无关语法,而是上下文有关语法。

例如,语言abbabb可以用如下的办法生成:

从S开始,用规则(i)1次,得到,用规则(ii)两次,得到,用规则(iii)1次,得到

可见,上下文有关语法的生成能力,比有限状态语法和上下文无关语法都强。但是,由于上下文无关语法可以采用乔姆斯基范式这一有力的手段来实现层次分析,所以,在自然语言描写中人们还是乐于采用上下文无关语法。

4.0型语法

0型语法的重写规则是φ→ψ,除了要求φ≠φ 之外,没有别的限制。乔姆斯基证明,每一个0型语言都是符号串的递归可枚举集;他还证明,任何一个上下文有关语言同时又是0型语言,而且还存在着不是上下文有关语言的0型语言。因此,上下文有关语言应包含于0型语言之中,它是0型语言的子集合。

但是,由于0型语法的重写规则几乎没有什么限制,用于描写自然语言颇为困难,它的生成能力太强,会生成难以数计的不成立句子。所以,在乔姆斯基的四种类型的语法中最适用于描写自然语言的还是上下文无关语法。

1985年,美国计算语言学家希布尔(S.Shieber)在《上下文无关性质的反证实例》一文中指出,在瑞士德语中存在着词序的交叉对应现象,也就是存在着如图24所示的符号串(Shieber,1985):

图24 词序的交叉对应

在这个符号串中,x1与y1对应,x2与y2对应,……,xn与yn对应,上下文无关语法描述不了这样的语言现象。

希布尔指出,在瑞士德语中有这样的句子:

(约翰说,我们让小孩帮助汉斯粉刷房屋。)

其中,d’chind(小孩)与动词lönd(让)相对应,Hans(汉斯)与动词 hälfed(帮助)相对应,huus(房屋)与动词aastriiche(粉刷)相对应。瑞士德语中这样的语言现象是不能用上下文无关语法来描述的。这样看来,自然语言并不是上下文无关的。

在汉语中,这样的非上下文无关的现象也不少。这里我们举两个例子:

(1)小李、小王和小张分别获得第一名、第二名和第三名。

(2)昆明、成都、长沙、长春、沈阳、哈尔滨、杭州分别是云南、四川、湖南、吉林、辽宁、黑龙江、浙江的省会。

例(1)中,“小李”与“第一名”对应,“小王”与“第二名”对应,“小张”与“第三名”对应,上下文无关语法不能描述这样的对应关系。例(2)中,“昆明”与“云南”对应,“成都”与“四川”对应,“长沙”与“湖南”对应,“长春”与“吉林”对应,“沈阳”与“辽宁”对应,“哈尔滨”与“黑龙江”对应,“杭州”与“浙江”对应,上下文无关语法也不能描述这样的对应关系。

尽管自然语言的大部分现象可以使用上下文无关语法来描述,上下文无关语法是生成语法的基础部分。但是,从总体上看来,自然语言还不能算上下文无关的,自然语言的性质似乎介于上下文无关与上下文有关之间。乔姆斯基在《规则与表达》中指出(Chomsky,1980/2005),自然语言可能比上下文有关语言还要复杂,它是乔姆斯基层级上最复杂0型语言,这是一种“递归可枚举语言”(recursive numerable language)。

自然语言的这种性质反映了它的“计算复杂性”(computational complexity)。关于自然语言的计算复杂性的讨论是语言学理论中一个重要而饶有趣味的问题,我们应当关注这个问题。

乔姆斯基的形式语言理论,对于计算机科学有重大意义。乔姆斯基把他的四种类型的语法分别与图灵机、线性有界自动机、后进先出自动机及有限自动机等四种类型的自动机联系起来,并且证明了语法的生成能力和语言自动机的识别能力的等价性的四个重要结果,即:

第一,若一语言L能为图灵机识别,那它就能由0型语法生成,反之亦然。

第二,若一语言L能为线性有界自动机识别,那它就能由1型(上下文有关)语法生成,反之亦然。

第三,若一语言L能为后进先出自动机识别,那它就能由2型(上下文无关)语法生成,反之亦然。

第四,若一语言L能为有限自动机识别,那它就能由3型(有限状态)语法生成,反之亦然。

乔姆斯基的上述结论,提供了关于语言生成过程与语言识别过程的极为精辟的见解,这对计算机的程序语言设计、算法分析、编译技术、图像识别、人工智能等,都是很有用处的,因而在计算机界产生了很大的影响。特别是在计算机科学家们发现算法语言ALGOL60中使用的巴科斯—瑙尔范式(Bacus-Naur normal form),恰好与乔姆斯基的上下文无关语法等价之后,不少学者都投入了上下文无关语法的研究,精益求精,成绩斐然。在语言学界,上下文无关语法的研究也引起了不少学者的注意,国外有些机器翻译研究机构,就是采用上下文无关语法的基本理论,来进行机器翻译系统设计的。

三、转换语法

(一)转换语法的提出

形式语言理论的成就,并没有使乔姆斯基踌躇满志。他是一个语言学家,他的学术兴趣毕竟还是在自然语言的研究方面,而形式语言理论在自然语言的研究中,并不像在计算机科学的研究中那么奏效。于是,乔姆斯基继续探索,试图找出一种适于描写自然语言的语言理论来。

他认为,存在着三种语言理论,可如图25所示:

图25 三种语言理论

图25中,I表示:语言理论被理解为一个抽象机器,在输入口输入言语片段,在输出口给出语法。这种理论的目的在于提供揭示语法的手续。

Ⅱ表示:语言理论被理解为一个抽象机器,在输入口输入言语片段及语法,在输出口得到“肯定”或“否定”的答复,判断语法是否正确。这种理论的目的在于提供判断语法的手续。

Ⅲ表示:语言理论被理解为一个抽象机器,在输入口输入言语片段和语法G1、G2,在输出口选择G1、G2这两个语法中哪一个为最优。这种理论的目的在于提供选择语法的手续。

乔姆斯基认为,Ⅲ是语言理论的最起码的要求,而他自己正是采取第Ⅲ种语言理论的。那么,如何进行语法的选择呢?他提出,选择最优语法的标准有两条:第一条,语法的简单性;第二条,语法的解释力。如果一种语法很简单,解释力又很强,那么它就是一种好的语法。

在乔姆斯基的形式语言理论中,语法被理解为语言的生成规则的集合。如果仅从这一意义上来理解语法,那么这种语法也可以看成是一种狭义的语法。按照语法的简单性和解释力来比较乔姆斯基的四种类型语法,可以看出,在描写自然语言方面,上下文无关语法较为简单,解释力也比较强,因而是一种较好的语法。

然而即使是从简单性和解释力的标准来衡量上下文无关语法,它仍然存在着美中不足之处。

第一,有些歧义的句子,用上下文无关语法的层次分析方法不能加以辨别和解释。如“the shooting of the hunters”的层次分析如图26所示:

图26 歧义句子有同一个层次结构

但是,相同的词形、词序及层次,却有两个不同的意思:一个意思是“猎人射击”,hunters是施事。比较:“the growling of the lions(狮子怒吼)”。一个意思是“射击猎人”,hunters是受事。比较:“the raising of the flowers(栽培花卉)”。

在形式语言理论的范围内,仅用层次分析的方法,并不能对这样的歧义现象作出解释。

因 为“the shooting of the hunters”,“the growling of the lions”,“the raising of the flowers”这三个句子的树形图,除末端结点之外,都是完全一样的。如图27所示:

图27 三个句子有同一个树形图

然而,如果我们了解到“the shooting of the hunters”是从“they shoot the hunters(他们向猎人开枪)”变换来的,那么就可以肯定,它的意思是“射击猎人”,而不可能是“猎人射击”。

又如“Flying planes can be dangerous”这个句子也是有歧义的:一个意思是“开飞机可能是危险的”,一个意思是“飞着的飞机可能是危险的”。但不论是哪一个意思,其层次结构都是一样的,用上下文无关语法也不能加以解释。然而,如果了解到它是从“Planes which are flying can be dangerous”变换来的,就可以肯定它的意思是“飞着的飞机可能是危险的”。

层次分析反映的是一个句子的推导树的结构,它显示了一个句子的生成过程。因此,层次分析法这一方法,在实质上反映了形式语言理论中“生成”(generation)这一个基本概念,它不过是“生成”这一基本概念在方法上的体现。正如乔姆斯基所指出的,层次分析法无非就是加加标示,用用括弧,把句子切分成前后相续的成分,并且注明这些成分分别属于哪个范畴,然后再把这些成分切分成更小的范畴的成分等……这样可以一直分到最终成分。因此,这样的分析法,显示不出对语义解释极为重要的各种语法关系。

层次分析法的不足之处,说明了不能再继续停留在“生成”这一概念上。为了提高语言理论的解释力,必须从“生成”过渡到“转换”。

第二,上下文无关语法还不够简单。

假使我们用上下文无关语法生成了终极符号串(即句子)。

“The man opened the door.(那人开了那门。)”也可以用“The door was opened by the man.(那门被那人打开了。)”表达同样的意思。

此外,英语中还有像“The man did not open the door.(那人没有开那门。)”“Did the man open the door?(那人开了那门吗?)”“Didn’t the man open the door?(那人没有开那门吗?)”“The door was not opened by the man.(那门没被那人打开。)”等等这样一些句子。

如果采用上下文无关语法来生成这些句子,那么势必要对每一个句子都建立一套生成规则。这样一来,语法就显得笨重不堪了。实际上这些句子是彼此相关的,如果我们以“The man opened the door.(那人开了那门。)”为核心句,其他句子都可以由这个核心句通过不同的转换而得到。这样就有可能把语言理论进一步简化。

可见,以语言理论的简单性这一标准来衡量,也有必要从“生成”过渡到“转换”。

于是,乔姆斯基另辟蹊径,提出了“转换语法”(transformational grammar)。这里我们采用“语法”这个术语,是因为“语法”已经不仅仅是指“生成”,而且还有着更为广泛的含义。

乔姆斯基关于转换语法的观点,既受到了法国哲学家笛卡儿(R.Descartes,1596—1650)及17世纪法国波尔·洛瓦雅尔语法学家们的影响,也受到了他的老师海里斯的影响。

法国波尔·洛瓦雅尔教派的语法学家阿尔诺(A.Arnaud)和朗斯诺(C.Lancelot),曾经使用转换的方法来分析句子(安托尼·阿尔诺, 2011)。例如:

“The invisible God has created the visible world.(无形的上帝创造了有形的世界。)”这个句子,是从“God who is invisible has created the world which is visible.”这个句子推出来的,而后面这个句子又可以从下面的核心句推出来:“God has created the world.(上帝创造了世界。)”“God is invisible.(上帝是无形的。)”“The world is visible.(世界是有形的。)”

乔姆斯基对波尔·洛瓦雅尔语法学家们的工作给以很高的评价。

海里斯早就看出了上下文无关语法的局限性,并提出了转换的初步概念。他认为,句子从其外部形式来看,是一个复杂的客体,它是由以某种方式结合起来的、一定数量的所谓“单纯形”(simplex)所组成的。这些单纯形的句子,叫做“核心句”(kernels)。核心句能用上下文无关语法生成或描写。但是,复杂的句子则是应用一系列规则的产物,这一系列的规则称为“转换规则”(transformational rules)。

例如,“John read the good book which was lent to him by Bill.(约翰读了比尔借给他的那本好书。)”这个句子,可以有下列核心句:“Bill lent a book to John.(比尔借了一本书给约翰。)”“The book is good.(这本书很好。)”“John read the book.(约翰读了这本书。)”

运用转换规则,便能由这些核心句生成上面的复杂句。

(二)转换语法的理论

乔姆斯基采用了海里斯的观点,提出了转换语法。而且,青出于蓝而胜于蓝,他走得比海里斯远得多,他对“转换”这一概念提出了严格的形式化的定义:

上下文无关语法中的非终极符号串Y1……,Yr,对于两个自然数r,n(n≤r),存在自然数序列β0β1……,βk与辅助符号串的词典Vp(Z1……,Zk+1)中的序列,使得

1.β0=0,k≥0,对于1≤j≤k,有

1≤β1≤r;

2.对于每一个非终极符号串Y1……,Yr,

t(Y1……,Yn;Yn……,Yt) = Yβ0⌒ Z1⌒ Yβ1⌒ Z2⌒ Yβ2⌒……⌒ Yβk⌒ ZK+1

这样一来,t就把在上下文Y1⌒……⌒Yn-1⌒——⌒Yn+1⌒……⌒Kr中的Yn,转换成某个符号串Yβ0⌒ Z1⌒ Yβ1⌒ Z2⌒ Yβ2⌒……⌒ Yβk⌒ ZK+1

这时,t叫做基本转换。

由基本转换t可推导出导出转换t*

t*是基本转换t的导出转换,当且仅当对于一切的Y1,……,Yr,有

t*(Yl……,Yr)=W1⌒……⌒Wr

其中,对于每一个n≤r,都有

Wn= t(Y1……,Yn;Yn……,Yr)。

这样,导出转换t*,便把符号串Yl—Y2—……一Yr转换成一个新的符号串W1—W2—……—Wr

基本转换t和导出转换t*,构成了非终极符号串Y1—Y2—……—Yr到另一个新的非终极符号串W1—W2—……—Wr的一个转换,这个转换,记为T。

乔姆斯基认为,转换语法模型由三个层级构成:

1.直接成分层级:在这个层级,利用上下文无关语法和上下文有关语法中的重写规则,生成核心句的非终极符号串Y1……,Yr,重写规则如下:

2.转换层级:在这个层级,利用转换规则

把核心句的非终极符号串Y1……,Yr,转换为另一个非终极符号串W1……,Wr。

3.语素音位层级:在这个层级,把转换所得到的非终极符号串W1……,Wr,按语言音位规则写为终极符号串wl……,wr

下面,作为例子,我们写出由核心句“The man opened the door”到句子“The door was opened by the man”的转换过程。

1.直接成分层级

在用上下文无关语法生成核心句的终极符 号 串“The man opened the door” 的 过 程中,我们在某个阶段上得到了非终极符号串NP⌒V⌒Past⌒NP,我们可以把这个非终极符号串改写为 NP⌒ Past⌒ V⌒ NP,令 NP= Yl,past=Y2,V = Y3,NP = Y4,得到序列 Y1Y2Y3Y4

2.转换层级

①基本转换t

②导出转换t*

3.语素音位层级

根据语素音位规则,用相应的词来替换NP—Past⌒be⌒de—V—by⌒NP,得到“The door was opened by the man.”

利用转换语法,可以把语言中一些基本的句子作为核心句,由它们转换出该语言中的其他的数以万计的句子来。这样以简驭繁,便把语言的描写大大地简化了。

转换语法能够解释上下文无关语法解释不了的一些歧义结构。我们前面说过的“the shooting of the hunters”这个句子,不论作“猎人射击”或“射击猎人”讲时,用上下文无关语法来分析,其树形图均是一样的。如采用转换语法。就能够分辨出当它作“猎人射击”讲时,是从NP—Aux—V这类句子转换成的,of后面就是NP,其树形图如图28所示。

当它作“射击猎人”讲时,是从NP1—Aux—V—NP2转换成的,of后面是NP2,而不是NP1,其树形图如图29所示。

这两个不同结构的句子,由于转换时采用了转换规则Ting(即动词加-ing词尾的转换规则),转换之后才以相同的形式出现,因而产生歧义。

图28 树形图

图29 树形图

在运用转换规则时,具体的操作方式主要有以下几种:

1.调位(movement),其公式为:XY→YX。

例如,英语中,主动句转换为被动句时,句首的主语NP要调到介词by之后。

2.复写(copying),其公式为:X→XX。

例如,英语中由陈述句转换成附加疑问句时,主语NP常要复写。

He is a good student.

——He is a good student,isn’t he?

附加疑问句末的he就是复写。

3.插入(insertion),其公式为:X→XY。

例如,英语中主动句转换成被动句时,表示施事的NP移位之后,前面要插入介词by。

4.消去(deletion),其公式为:XY→X。

例如,英语中从陈述句转换成命令句时,要消去主语。

从转换操作的公式中不难看出,转换公式已经超出了上下文无关语法重写规则A→ω的限制。调位和消去的公式,它们的左边都不是单个的非终极符号,它们显然已经不是上下文无关的规则了。

乔姆斯基还把转换分为强制转换(obligatory transformation)和随意转换(optional transform-ation)两种。

可转可不转的转换,叫做随意转换。例如:“My brother will write the letter.(我的兄弟将写那封信。)”可以转换成:“The letter will be written by my brother.(那封信将由我的兄弟来写。)”但是,不一定要作出这样的转换,因为不论主动句或是被动句都是合乎语法的句子。

又如:“The police brought in the criminal.(警察带进犯人来。)”可以转换成:“The police brought the criminal in.(警察带犯人进来。)”但也可以不转,因为两个句子都合乎语法。

非转不可的转换,叫强制转换。例如,在句子“The police brought in the criminal”中,如果宾语NP2是代词,那么,必须转换成:“The police brought him in(警察带他进来)”。因为“*The police brought in him”不合语法,是不能成立的。这种转换就是强制转换。

乔姆斯基根据强制转换和随意转换的区分,提出了核心句(kernel sentence)和非核心句(non-kernel sentence)的概念。

没有经过随意转换的句子叫核心句,经过随意转换的句子叫非核心句。

例如下面的句子:

i.My brother will write the letter.(我的兄弟将写那封信。)

ii.Will my brother write the letter?(我的兄弟将写那封信吗?)

iii.What will my brother write?(我的兄弟将写什么?)

iv.The letter will be written by my brother.(那封信将由我的兄弟来写。)

其中,i没有经过随意转换,是核心句。ii是i经过随意转换规则Tq而转换成的一般疑问句,是非核心句。iii是i经过随意转换规则TW而转换成的特殊疑问句,也是非核心句。iv是i经过随意转换规则Tp而转换成的被动句,还是非核心句① Tq、Tw、Tp都是随意转换规则的名称,这些规则的具体解释请参看乔姆斯基《句法结构》(第一版中译本)第115—116页。 。

四、乔姆斯基的局限

乔姆斯基的上述句法理论,在欧美语言学界引起了很大的震动。以耶鲁大学的霍凯特(C.F.Hockett)为代表的“后布龙菲尔德学派”的一些学者,从各个方面来攻击和非难这套新理论。在论战中,同时也在用这种理论来研究英语的过程中,发现它确实还有不少的局限。主要是:

第一,转换语法把一些句子定为核心句,语言中的其他句子均由核心句转换而来。但在语言研究中,哪些句子是核心句,哪些句子不是核心句,很难定出一个确切的标准。乔姆斯基把主动句规定为核心句,但是在英语中,被动句用得相当普遍,许多在汉语中用主动句表达的意思,在英语中却用被动句表达。那么,为什么不能把被动句看成核心句呢?可见,所谓“核心句”的提法是不科学的,在实践中也是行不通的。所以,后来乔姆斯基只好取消了核心句的提法,因而也就放弃了强制转换和随意转换的区别的理论。

第二,不论是形式语言理论还是转换语法,对于语义都研究得很不够,它们都不能反映语义之间的搭配关系。例如,根据形式语言理论,提出一个适当的语法,便可生成“the man saw the ball”这样的句子,这个句子的各个成分在语义上可以很自然地搭配起来。但是,用同样的语法,也可生成“*the ball saw the man”,这个句子并不违背上下文无关语法的规则,可是其中的各个成分在语义上搭配不起来,因为saw这个动词要求前面的名词一定是“有生命的”。在上下文无关语法中却不能反映这种语义上的搭配关系,转换语法当然也说明不了这种语义上的搭配关系。

上面我们对于乔姆斯基的形式语言理论到转换语法的发展历程做了概括的说明,可以看出,60年前出版的乔姆斯基的《句法结构》一书,是自然语言形式分析的奠基力作,我们应当认真学习和研究本书中提出的理论和方法,以推动我们语言学的现代化进程。

参考文献:

[1]N.Chomsky.Three models for the description of language[J].The Journal of Symbolic Logic,1956,(3).

[2]N.Chomsky.Syntactic Structures[M].The Hague:Mouton,1957.

[3]N.Chomsky.On certain formal properties of grammars[J].Information and Control,1953,(2).

[4]N. Chomsky.Context-free grammar and pushdown storage, Quart.Prog.Dept.No.65,MIT Res.Lab.Elect,1962.

[5]N. Chomsky.Formal properties of grammars[A].Handbook of Math.Psych[C].NewYork:Wiley,1963.

[6]N. Chomsky.The Logical Structure of Linguistic Theory (LSLT)[M].NewYork:Plenum,1975.

[7]N.Chomsky.Syntactic Structuresc Second Edition[M].Berlin:Walter de Gruyter,2002.

[8]N.Chomsky.Rules and Representations,Manhatton:Columbia University Press,1980/2005.

[9]S.Shieber.Evidence Against the Context-Freeness of Natural Language[J].Linguistic and Philosophy,1985,(8).

[10][美]乔姆斯基.乔姆斯基序[A].赵辛而译.黑龙江大学外语学刊编辑部编.乔姆斯基语言理论介绍[C].哈尔滨:黑龙江大学,1982.

[11][法]安托尼·阿尔诺,克洛德·朗斯洛.普遍唯理语法[M].张学斌,柳利译,姚小平校.北京:商务印书馆,2011.

[12]冯志伟.形式语言理论[J].计算机科学,1979,(1).

[13]冯志伟.从形式语言理论到生成转换语法[A].语言研究论丛(第二辑)[C].天津:天津人民出版社,1982.

[14]冯志伟.生成语法的公理化方法[A].哈尔滨生成语法讨论会论文集[C].哈尔滨:黑龙江大学,1983.

[15]冯志伟.自然语言的计算复杂性[J].外语教学与研究,2015,(5).

A Fundamental Book for Formal Analysis of Natural Languages——Celebration for 60 years publication of Syntactic Structure

Feng Zhiwei, Zhou Jian
(College of foreign Languages, Hangzhou Normal University, Hangzhou 311121, China )

Abstract: In 1957, Chomsky’s “Syntactic Structure” was published, which challenged a series of basic principles of structuralism, laid the foundation for formal analysis of natural language, and marked the beginning of the “Chomsky Revolution” in linguistics. This book focuses on formal language theory and transformational grammar. In formal language theory, Chomsky regards speech as an abstract mathematical system. In order to describe and explain linguistic phenomena, he demonstrates the generative ability of grammar and believes that grammar should be regarded as a finite rule system capable of generating infinite sentences. In transformational grammar, chomsky holds that the model of transformational grammar consists of three levels: direct component level, conversion level and morpheme phoneme level. When using the rules of transformation, the main ways are movement, copying, insertion and deletion , Conversion makes grammar more explanatory.

Key words: chomsky; syntactic structure; formal language theory; transformational grammar

作者简介: 1.冯志伟,男,杭州师范大学外国语学院特聘教授;

2.周 建,男,杭州师范大学外国语学院讲师。

标签:;  ;  ;  ;  ;  

自然语言形式分析的奠基力作-纪念《句法结构》出版60年论文
下载Doc文档

猜你喜欢