语言进化的计算机模拟研究_语言学论文

用计算机模拟研究语言演化,本文主要内容关键词为:语言论文,计算机论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 当前演化语言学的研究手段及其局限

演化语言学(Evolutionary Linguistics)是探讨语言涌现、变化和消亡的语言学子学科(Wang 1982;Ke & Holland 2006;Hauser、Barner & O'Donnell 2007)。对语言演化的思考可追溯到达尔文1859年出版的《物种起源》,但由于受到当时研究手段的制约,1866年巴黎语言学会颁布禁令不再讨论和语言演化相关的课题。直到上世纪50年代,随着语料的丰富,对人与其他动物的交流系统和认知行为的深入认识,以及相关学术领域的技术突破(Huang & Lenders,8 2004),演化语言学开始复兴。

当前的演化语言学研究主要采用3种手段:分别基于理论、基于语料和基于语言使用者。理论研究并不十分重视实证。例如,理论句法学家多通过主观内省分析句子合理性及使用者对其的处理,并由此提出抽象的结构性语法系统来解释语言形式和处理过程。普遍语法及相关理论(如Chomsky 1965,1995)就是典型例子。人类语言系统和处理机制的复杂更让很多理论学家断言语言能力不是自然选择的结果,而是由人类基因中固化的机制决定的(Jackendoff & Pinker 2002; Hauser、Chomsky & Fitch 2002; Chomsky 2006)。尽管这些抽象的理论和结构能在一定程度上归纳不同语言形式上的特点,我们无法知道使用者对句子的分析是否遵循这些理论,这些抽象结构是否在使用者的脑中存在。实证结果似乎与这些貌似完美的理论背道而驰(Newmeyer 2003),认为语言“横空出世”的论断更是无法验证(Ramachandran 2004)。此外,语言学家的个人内省并不能代表整个使用者,其主观创造的句子也不一定能代表日常交流用语。例如,Ross(1979)构造了一些含歧义或语法错误的句子,并让句法学家们根据接受程度将这些句子分类,结果不同学家对同一句子的分类竟然大相径庭。

与理论研究不同,历史语言学、社会语言学和类型学家强调基于真实语料来研究语言演化相关课题,如语言接触、历史亲缘关系及形式多样性等。例如,Greenberg(1963)通过比较30余种语言的词序归纳出一些词序的主要形式及其在不同语言中的分布规律。这些规律在后续的、基于更多语料的研究中已得到充分证实(Tomlin 1986; Dryer 1997)。随着计算生物学和信息学方法的引入,这类基于数据统计的研究已取得了很多突破(Levinson & Gray 2012)。但是,这类研究很大程度上受限于语料,特别是已灭绝语言的语料,过分关注语料也使这类研究忽视了语言使用者和其他因素对语言发展变化的影响。例如,Dunn et al.(2011)指出,功能性语法结构(如词序)主要受文化传递(Cultural Transmission)①影响,而非普遍认知限制。随着全面分析不同语言,越来越多的语言学家认为语言最显著的特征在于其形式多样性,而非普遍性,这种多样性主要归因于文化传递和交流中各种因素的影响(Evans & Levinson 2009)。

随着脑成像技术的发展,基于语言使用者表现的心理语言学研究开始关注语言使用者习得和处理语言的神经机制。这类实证研究验证、驳斥和改进了一些已有的语言学理论。例如,Harris、Wexler & Holcomb(2000)用脑电仪记录了人类被试理解两类句子的脑电波。第一类句子含有单个反身代词,并与主语在数上一致或不一致,如例(1);第二类含有复合的反身代词,也与主语在数上一致或不一致,如例(2):

此研究发现,被试在处理第一类句子时,反身代词的不一致会激发P600脑电波成分(当看到不一致的反身代词约600毫秒后,被试脑电波相比看到一致的反身代词呈现正向偏离),反映被试脑中的句法处理过程;被试在处理第二类句子时,复合反身代词的不一致会激发P300脑电波成分,反映被试脑中与语用有关的处理过程。此结果明晰了理论语言学关于反身代词与先行词的匹配是句法处理还是其他处理的争论(Reinhart & Reuland 1993)。尽管如此,这类研究仍面临一些难点,譬如如何设计实验关注特定语言结构而屏蔽其他结构,以及如何准确定位因处理特定结构而激活的脑区或脑电波成分。同时,这类研究通常记录被试在理解时的反应,多基于现代语言和小规模当代人类被试,对全面研究语言交流(包括产生和理解言语两个部分)及古人类语言处理机制的贡献有限,也很难体现文化传递等因素对语言演化的作用。

考虑到这些研究手段的局限,演化语言学还需要其他学科和手段的支持(王士元2012)。近年来,很多学科,如动物行为学(Hurford 2007),遗传学(Fisher et al.1998),以及考古学和古人类学(Schoenemann2006)正加入演化语言学研究的行列(Gong et al.2010)。在此背景下,计算机模拟也被逐步应用到演化语言学中。

计算机模拟可追溯到上世纪60年代“计算机之父”Von Neumann提出的自复制模型。此模型证明,通过设定规则,非生命体(如机器)也可自我复制(von Neumann 1966)。上世纪80年代,爱丁堡大学Hurford教授首次将计算机模型引入演化语言学研究,验证了词汇系统可通过索绪尔学习机制和反复交流逐步产生(Hurford 1989)。模拟方法可有效克服已有手段的难点与局限。例如,通过模拟和控制语言使用者、交流活动和社会—文化等因素,计算机模拟可探讨群体层面的语言演化并研究文化传递等因素对语言演化的影响;通过模拟特定语言结构和学习机制并剔除其他结构和机制,此方法可克服心理语言学实验的难点,有效验证特定机制是否可帮助使用者习得特定语言结构;通过引入情境和交流限制,此方法还可模拟各种习得和交流的环境与模式,用以探讨对语言习得和演化起决定作用的因素。随着越来越多计算机模拟研究的出现,此方法正逐步为语言学界所接受(Briscoe 2002; Cangelosi & Parisi 2002; Christiansen & Kirby2003b; Tallerman 2005; Bickerton & Szathmáry 2009; Gong 2009; Tallerman & Gibson 2012)。

结合作者研究经验,本文介绍计算机模拟在演化语言学中的应用。不同于面向人工智能和演化计算学者的评论(Perfors 2002; Wagner et al.2003; Lyon,Nehaniv & Cangelosi 2007; Parisi & Mirolli 2007),本评论面向语言学学者,讨论模拟方法相比于其他方法对演化语言学研究的必要性(§2),介绍对已有模型的分类标准(§3),归纳用此方法研究语言演化问题的步骤和手段(§4),并总结此方法的优势与局限(§5)。

2计算机模拟对语言学研究的必要性

模拟方法通常应用在无法预期理论能导致何种结果的情况下。秉承“通过建模来理解(Understanding by Building)”的思路,模拟方法通过建立包含所研究理论的模型并比较模拟结果与真实结果来验证和改进所包含的理论,并通过建立包含改进理论的模型进一步验证和改进这些理论,如此往复,直到得出能够产生预期结果的理论(图1)。模型包含所研究的理论,模拟结果为此理论派生的经验预测,比较模拟与真实结果有助于验证和改进理论,直到产生和真实结果相吻合的理论。请注意,这种模型与已有语言学或心理学研究中的模型在概念上有所不同,后者把模型与所包含的理论等同视之。

在演化语言学中,计算机模拟可被视为体现为计算机程序(模型)的假说或理论(Parisi & Mirolli 2007)。当程序运行时,这些假说或理论会派生出经验预测。通过比较模拟结果与真实语料或人类语言表现,计算机模拟可揭示语言复杂性和多样性背后的决定因素、语言处理机制的本质,及语言演化的过程(Cangelosi & Parisi 2002)。通过抽象语言演化的动态过程或模拟语言使用者的交流行为,计算机模拟可演示某些假设是否足以导致某些语言特性的出现并对其有效处理,还可探讨特定因素对语言处理和演化的作用(Lyon、Nehaniv & Cangelosi 2007; Jaeger et al.2009)。从这两个方面,我们可获得对语言形式、处理机制和演化的解释性认识(Mareschal & Thomas 2006)。

计算机模拟对演化语言学研究的必要性主要体现在两个方面:

1)克服时间局限性

由于缺乏化石等记录前语言时期人类交流系统的直接证据和某些语言在不同发展阶段的语料,语言学已有的研究方法只能回溯到一定历史阶段(即文字出现的约5000到8000年前),无法获得早于这个时间的、与语言相关的信息(Trask 1996)。

语言学家和其他学科学者试图用三种方法来突破这个时间局限。第一种方法基于生物学“个体发生重演群体演化”类比,通过研究语言习得来获得对语言涌现的认识(Bickerton 1990)。很多心理语言学研究正是从这个角度出发探讨语言的演化。但是,个体语言习得过程和语言在群体中涌现的过程在诸多方面并不一致。例如,个体习得主要是个体学习机制起作用(Steels 2005),主要发生在微历史时间段内(几年到十几年,Wang 1991),其语言输入来自于已完全发展并相对稳定的现代语言;相反,语言涌现不仅涉及个体学习机制,还涉及社会—文化因素(Steels 2005),主要发生在宏历史时间段内(几万到十几万年,抑或更长,Wang 1991),期间语言本身和语言环境都在变化。此外,当代人类所处的语言生态(Mufwene 2008)及大脑的结构和容量(Schoenemann 2006)都与早期人类显著不同。有鉴于此,演化语言学应慎用“个体发生重演群体演化”类比。

第二种方法通过比较其他动物,尤其是人类近亲(灵长类动物)的交流系统,来分析语言演化的历史及相关功能的适应性改变(Oller & Griebel 2004; Washburn 2007; Fitch 2010)。这种比较法揭示了很多可能导致语言的、为其他动物所共有的、习得的并有文化差异的认知能力雏形(如Stanford 2006; Herrmann et al.2007; Hurford 2007; Hilliard & White 2009)。但是,不论其他动物的这些雏形能力多么的精妙和发达,其交流系统都无法表现出人类语言的复杂性、创造性和丰富性(Oller & Griebel 2004),而且除比较法外,我们还需要其他方法进一步研究这些雏形能力如何最终导致人类语言。

第三种方法通过遗传学和脑科学研究来获得与语言处理和演化相关的基因和神经基础。例如,通过比较正常的和有语言障碍的KE家族成员的基因图谱,遗传学家定位了FOXP2基因(Fisher et al.1998),其在人类出现的时间点(约10至12万年前)可做为语言涌现的时间上限(Enard et al.2002)。语言与非语言能力在正常和有障碍个体基因上的差异也为解答哪些能力可导致语言处理机制提供了线索(Stromswold 2010)。同时,功能性脑成像技术可确定人脑中与语言处理有关的区域,比较这些区域同负责其他功能的区域可分析语言功能区与其他功能区的关联。但是,缺乏足够的障碍个体会限制遗传学家对可能导致这些障碍的基因进行定位(Bishop、North & Donlan 1995),而且基因与认知能力通常也不是一一对应的(Karmiloff-Smith 2006)。同时,语言是“全脑行为”,负责语言功能的脑神经元群落可能涵盖整个大脑皮层(Gulyás 2009),而且现有的脑成像技术还面临一些技术局限(Luck2005; Logothetis 2008)。

上述三种方法都不能有效克服时间局限性。在这一点上,计算机模拟可提供一些新视角。首先,通过给模型中的人工个体配置在其他物种中发现的能力或人类在语言任务中表现出来的能力,计算机模拟可探讨这些能力是否可导致某些语言特性的出现并影响对其的处理。例如,一些研究表明模式提取和顺序学习能力可帮助使用者获得词汇和简单句法(Kirby 1999; Gong 2009,2011)。其次,通过系统的设定条件,计算机模拟可辅助实验或其他实证研究,因为后者通常只能覆盖有限的条件。例如,Ke、Gong & Wang(2008)和Gong et al.(2012)的模型引入大规模社会网络结构探讨社会结构对语言形式扩散的作用。此研究辅助并扩展了小规模的社会语言学实证研究。

2)评价陈述式的语言学理论

很多从理论语言学研究中提炼的假说或理论并不十分具体,不足以给出明确的经验性预测(Lyon、Nehaniv & Cangelosi 2007)。相反,能够体现为计算机程序的理论必须清晰、连贯和完整(Cangelosi & Parisi2002),相关假设和初始条件必须明确(Jaeger et al.2009);否则,该程序可能无法运作,或无法得到由所包含的理论派生出的结果(Mareschal & Thomas 2006)。同时,通过演示解释性理论如何起作用,计算机模拟仿真能够发现所包含理论可能隐藏的问题(Christiansen & Kirby 2003a)。

3 模型分类标准

面对众多模型,计算机模拟学者提出了不同的分类标准以帮助我们更好的认识不同模型的特点及其所适合研究的演化语言学问题。

Holland(2005)根据目的把模型分为三类:1)数据驱动模型(data-driven models),旨在产生与实验或观测相一致的结果。很多语言变化模型(如Abram & Stragotz 2003)属于此类,能够产生与语言变化历史数据相吻合的结果,并由此论证所包含的因素对结果的作用;2)证明存在性模型(existence-proof models),旨在证明某些处理能力对语言演化是否有效(如Gong 2011),某些语言或非语言因素是否能对语言特性的生成和发展起作用(如Kirby 1999);3)探索性模型(exploratary models),旨在通过建模引入感兴趣的机制或因素来探索其对语言演化的作用。证明存在性模型也多是探索性的(如Gong 2011),这两类模型都要结合经验数据对所包含的理论做论证。

语言演化模型通常会定义一个人工语言,或一个人工语言可能会在这些模型中涌现。根据所定义的人工语言的精度,Ke(2004)把模型分为四类:1)整合的人工语言(language as a monolithic whole),此类模型把人工语言定义为不含内部结构的变量。很多语言竞争模型(如Minett & Wang 2008)属于此类,主要关心哪些社会—文化因素会影响使用者对不同语言的态度和选择,进而影响语言竞争;2)含有子成分的人工语言(language involving subsystems),如语音、语义或句法。这类模型的人工语言只有简单语义和词汇,忽略语音和句法(如Puglisi、Baronchelli & Loreto 2008),或只有简单语义和句法,忽略音系(如Gong 2009,2011);3)结合语用的人工语言(Ianguage embodied in use),此类模型模拟语言习得或交流,其间使用者利用语言知识和处理机制表达或理解简单意思;4)体现语义和句法的人工语言(language with meaning and form embodiment),此类模型探讨复杂语义和/或句法结构的涌现与变化。一些模型(如Cangelosi 2005)讨论符号具体化问题(symbol grounding problem,如何建立关联所指、语义和形式的符号系统,Harnad 1990),其他模型研究复杂形态—句法结构的产生(如Steels 2011)。

上述第三和第四类模型,根据其模拟的语言使用者是否处于一个情境之中,或其模拟的人工语言是否含有结构还可进一步分类(Wagner et al.2003)。在情境模型(situated models)(如Puglisi、Baronchelli & Loreto 2008)中,语言使用者被安置在一个自然或人工环境中,使用者与环境的交互及环境因素都有可能影响使用者的状态和语言;相反,在非情境模型(nonsituated models)(如Kirby 1999)中,使用者只和其他使用者进行信号或语言的交流。在结构模型(structured models)中,人工语言多由词汇或短语构成(如Gong2009,2011),这类模型主要研究组合型语言如何被使用者构建和理解;相反,在非结构模型(unstructed models)中,人工语言由来自单一或多渠道的、彼此独立的成分构成(如王士元、柯津云2001;Ke et al.2002;Gong et al.2012),这类模型多关心非语言因素如何影响语言演化。

最后,根据模拟语言交流和使用者的方法,我们把模型分为两类:1)行为模型(behavioral models),通过模拟使用者在交流过程中的行为来研究这些行为对语言演化的作用,所模拟的语言行为包括言语产生、理解,及语言知识的获得和更新,非语言行为包括使用者与环境的互动、在群体中的移动、出生和死亡等;2)数学模型(mathematical models),把语言和相关行为抽象为数学公式,并通过对这些公式的分析来预测语言演化的趋势及有关行为的作用,例如一些语言竞争和词汇扩散的数学模型(如Wang et al.2004; Minett & Wang 2008)把使用者对不同语言或不同词汇形式的选择抽象为微分方程,并分析这些方程以确定语言竞争中的稳定状态及语言的社会地位和使用者比率对语言竞争的影响。这两类模型可互相受益,数学模型为行为模型提供理论预测,而行为模型具体演示相关机制如何逐步实现数学模型所预测的结果。

一个常用于行为模型的手段是多个体系统(multi-agent system,MAS)(Ferber 1998),如图2所示。图2中空心双向箭头表示语言交流,实心单向箭头表示新个体加入和老个体离开,不同的椭圆框表示基于交流等因素定义的组群。在采用MAS的演化语言学行为模型中,组成MAS的个体相当于语言使用者,可相互进行语言交流,并利用其预设的处理机制获得和更新其语言知识。

通过其处理机制和个体间交流,个体可习得或逐步发展出具有某些人类语言特性的共同语言来进行有效交流。此外,个体还可与所处的环境进行交流(如形成对环境事物的概念,改变环境,或通过移动进入新环境等),取代其他个体或被新个体取代(类似于人群中的新老交替)。若引入社会—文化因素,这些个体还可被分成组群,受社会因素制约。总而言之,MAS可被视为人类社会的微缩版,提供了一个研究语言演化、个体学习和社会—文化因素的平台。

上述分类标准相互关联,同一模型根据不同分类标准可被归为不同类别,而基于不同标准的子类别可能重合(Gong 2009)。例如,基于人工语言精度分类的第一类模型(定义人工语言为整体不可分变量)通常是数学模型(用数学公式抽象语言选择过程),而其他三类模型(定义语言成分或语用过程)通常是行为模型(模拟具体处理语言和交流的机制)。鉴于篇幅和作者的研究经历,下面将重点围绕行为模型介绍开发计算机模拟的主要步骤和常用手段。

4 开发计算机模型的主要步骤和常用手段

开发行为模型研究语言演化问题可遵循以下4个主要步骤:1)设定研究问题;2)定义人工语言、语言知识和处理机制;3)实现语言习得或交流过程,及相关活动;4)分析模拟结果。开发模型时,我们可从这几个方面把抽象的语言学理论转变为具体的模拟机制;评价模型时,我们也可从这几方面对模型及其结果做全面的分析和认识。

4.1 设定研究问题

任何模型都是为了解决具体问题而开发的,研究问题决定了模型的人工语言、语言知识、处理机制、交流过程和其他非语言因素。例如,对于研究社会—文化因素对语言接触和竞争作用的模型(如Abram & Strogatz 2003; Wang etal.2004; Minett & Wang 2008),其人工语言可被简化为变量,语言知识、处理机制和交流过程也会大为简化,而相关的非语言因素则被细致模拟;对于词汇演化模型(如王士元、柯津云2001;Ke et al.2002; Baronchelli et al.2006; Puglisi、Baronchelli & Loreto 2008),其人工语言多涉及与词汇相关的结构,不一定包含句法结构,语言知识和处理机制也主要针对词汇,交流中的意思也主要由词汇表达,其他非语言因素可能并不涉及;对于句法演化模型(如Gong et al.2005; Gong 2009,2011),其人工语言多涉及句法结构,语言知识和处理机制也主要针对句法,交流中的意思可能也要用一些句法结构来表达,但其他非语言因素可能并不涉及。当然,结合具体研究问题,上述几种分类并非绝对。例如,研究社会—文化因素对语言结构作用的模型(如Kirby 1999; Gong 2010,2011)也会涉及词汇和句法等结构,以及相关的语言知识、处理机制和交流过程;研究社会网路对词汇演化影响的模型(如Ke、Gong & Wang 2008; Gong et al.2012)也要模拟词汇等语言结构。

4.2定义人工语言、语言知识和处理机制

行为模型通常把语言定义为一套匹配意思和言语的意思—言语对(meaning-utterance mappings,MU mappings)。不同模型的意思—言语对可能具有不同形式,其语言知识和处理机制也会略有不同。在词汇演化模型中,意思—言语对匹配独立的意思与言语。意思可预先设定(如Baronchelli et al.2006),也可逐步形成(如Puglisi、Baronchelli & Loreto 2008),言语符号也可预先设定(如王士元、柯津云2001;Ke et al.2002; Wang et al.2004)或随着意思数量的增长而增加(如Baronchelli et al.2006)。在一些词汇演化模型(如Hurford 1989)中,语言知识以矩阵形式记录,矩阵中的数值表明不同意思—言语对的概率,可被语言处理机制调整。

在句法演化模型中,意思—言语对匹配复合意思与组合言语,意思部分可预先设定(如Kirby 1999),也可逐步发展(如Vogt 2005),言语部分要么无结构(用不可分符号表达复合意思),要么有结构(言语中的不同符号对应复合意思的不同成分)。

例如,在词汇—句法共同演化模型(Gong 2009,2011)中,人工语言如例(3)和例(4)所示:

(3)“run〈wolf〉”(“狼在跑”)/a b c/;

(4)“chase〈wolf,sheep〉”(“狼追羊”)/c d e/;

这里,复合意思用逻辑式表示,“跑”和“追”是谓词,<>中第一个成分是施动者,第二个是受动者,“”表示双向匹配,//中的符号表示言语。如果言语没有结构,/a b c/整合在一起表示“狼在跑”;如果言语有结构,不同符号可对应不同意思成分。

此模型用不同的规则记录不同类型的语言知识(见下页图4):词汇规则记录言语符号与意思成分的匹配,词序规则记录不同词汇言语部分的先后顺序,句法范畴把具有相同语义角色(谓词、施动者或受动者)的词汇规则和有关的词序规则归纳到一起,并赋予相应的句法角色主语(S)(对应施动者)、动词(V)(对应谓词)和宾语(O)(对应受动者)(这里不考虑被动语态)。个体在获得一些范畴后,可根据其词序规则组织其词汇规则的言语部分以构成完整的言语表达复合意思。如图4所示,掌握这些规则的个体可用3个范畴中记录“fox”、“sheep”和“fight”的词汇规则表达“fight〈fox,sheep〉”这个复合意思。考虑到词序规则(SV和SO),构建的言语为/b e h/或/b h e/,分别具有SVO或SOV的句子词序。图4中,“#”表示谓词能够具有的、未被明确的施动、受动成分,“〈〈”表示局部次序“之前”,“〉〉”表示“之后”。

个体具有简单的模式提取和次序学习能力,并基于“经验”(个体在以往交流中遇到的意思—言语对)来获得上述语言知识。以图4为例,通过比较意思—言语对(1)和(2),个体可使用模式提取能力建立一个词汇规则匹配重复出现的意思成分“fox”和言语符号/b/。类似的,个体比较意思—言语对(2)和(3)会得到另一个词汇规则匹配“run〈#〉”和/m/。此时,基于次序学习能力,个体能注意到在意思—言语对(1)和(2)的言语中,表达“fight〈#,#〉”的符号/e/和表达“run〈#〉”的符号/m/都在表达“fox”的符号/b/之后。由于“run〈#〉”和“fight〈#,#〉”在这两个复合意思中具有相同的语义角色(谓词),个体会把表达这两个意思的词汇规则归纳到一个动词(V)范畴,并建立一个词序规则记录“之后”这个次序。通过不断交流,这些基本的、非语言特有的学习能力可帮助个体逐步获得一套彼此相似的语言规则来清楚表达复合意思。

除意思—言语对和规则外,行为模型还可采用其他方式模拟语言知识和处理机制,如人工神经网络(如Elman 1990)、决策树(如Steels 1997)等,在此不再累述。

这里有两点需要注意。首先,尽管这类模型预设了具有某种结构的人工语言和相关处理机制,在没有得到模拟结果之前,我们无法明确知道所模拟的处理机制是否可以在人工语言中生成相关的语言结构或有效的处理具有这些结构的人工语言,而这两方面正是这类模型所要研究的问题。其次,很多句法演化模型(如Kirby 1999; Gong 2009,2011)会预设一套意思供个体进行交流。换句话说,在发展词汇和句法结构前,个体已经可以理解很多复合意思。此做法受到了一些质疑(见Newmeyer2008),但考虑到这些模型的重点在于句法和相关处理机制,而且一个较成熟的概念系统一定出现在语言之前(Hurford 2007),预设指定意思的做法还是可以接受的。

4.3实现语言交流或习得过程,及相关活动

采用MAS的行为模型通常会模拟个体间的语言交流或习得。此过程通常涉及两个个体(说者和听者)并包含3个部分:产生言语、理解言语,以及语言知识的获得与更新。例如,在词汇演化模型(Ke et al.2002)中,产生和理解言语被简化为在说和听个体的说和听矩阵中搜索的过程,语言知识的获得与更新被模拟为对矩阵中数值的调整。在词汇—句法共同演化模型(Gong 2009,2011)中,产生言语是说个体根据其语言规则选取相应的词汇和词序构建表达复合意思的言语的过程;理解言语是听个体根据其语言规则对说个体产生的言语进行解码的过程;而语言知识的获得与更新是个体运用模式提取和次序学习能力从已有意思—言语对中提取规则的过程。

基于“明确意思传递”(explicit meaning transfer)(Smith 2003)假设如图5所示:在交流中,听者除了得到说者产生的言语(/a b c d/),还明确的知道此言语中含有的意思(“三个苹果”)。很多模型把言语理解简化为听者直接获得说者言语中含有的意思。但是,如果意思总能在无语言交流的情况下通过类似心灵感应的方式被听者得到,语言就无需作为交流媒介而存在了。此外,在给定语境下,对单个言语的理解也会有多种可能(Quine 1960),理解过程也不仅涉及听者的语言知识,还涉及到语用和其他因素的影响(Smith 2003)。尤其当语言知识匮乏时,言语理解还要求助于非语言的因素或能力,如儿童在语言习得过程中采用的互斥和对比原则(Clark 2003)。由此可见,“明确意思传递”假设忽视了言语理解的复杂性。词汇—句法共同演化模型(Gong 2009,2011)用更合理的模拟取代了这个假设。在此模型中,言语理解不仅取决于听者的语言规则,还涉及可能包含说者意思的非语言因素。通过调整非语言因素包含说者意思的概率,此模型探讨了语言演化对非语言因素的依赖(尤其在语言涌现初期)(Gong 2009),并演示了言语理解从依赖非语言因素到依赖语言规则的转变(Gong & Shuai 2012)。此转变意味着此时的人工语言已经能有效的表达不在此时此地发生的事物,这是语言一个重要的设计特点(Hockett 1960)。

除上述交流细节外,很多行为模型通过限定个体间的交流模式来模拟文化传递并探讨其对语言演化的作用。例如,重复学习模型(Kirby 1999)模拟了一串个体,每个个体代表一代语言使用者。个体通过理解串中前一个体产生的意思—言语对来习得其中的语言知识,并根据这些知识产生一些意思—言语对给下一个体进行学习,如下页图6所示。图6中每个矩形表示一个个体,它通过学习前一代个体的言语获得语言知识,并产生表达某些意思的言语供下一个个体学习。这种代与代之间的语言交流可比拟人类社会的垂直文化传递过程(即子代从父代习得语言的过程)。此模型的结果表明,垂直文化传递过程中的“瓶颈效应”(即子代只能获得父代产生的一部分意思—言语,并据此进行学习)可使语言从最初的无结构形式演化出某种结构,这种结构保证了子代个体仍然能够从有限的意思—言语对中获得足够的语言知识。换句话说,语言结构的出现可被视为是语言为有效穿过文化传递瓶颈而做的适应性改变。除了垂直文化传递,文化传递还有其他形式,如水平(即同一代个体间的交流)和倾斜文化传递(即上一代个体与非直系的下一代个体间的交流),如下页图7所示。图7中,实线箭头表示垂直文化传递,虚线箭头表示倾斜文化传递,点划线箭头表示水平文化传递。通过模拟这些形式,Gong(2010)进一步探讨了文化传递对语言涌现和变化的作用,尤其在每代包含多个个体的社会环境下。

如果把个体间的交流视为社会联系,行为模型还可模拟社会网络并探讨其对语言演化的作用。例如,在Ke、Gong & Wang(2008)的模型中,个体间被预先定义了一些社会联系以反映不同类型的社会网络(如小世界)(Watts 1999)和无尺度网络(Barabási & Albert 1999),只有具有社会联系的个体才能进行语言交流。此研究发现,由于无尺度网络含有一些具有很多社会联系的个体,一旦它们开始使用某种语言形式,该形式会快速扩散到其他个体;由于小世界网络中连接任何两个个体所需的社会联系数目的平均值相比随机网络(即个体间的社会联系是随机设定的)小,语言形式在小世界网络中的扩散速度也比在随机网络中快得多;最后,由于存在着这些能够加速扩散的因素,语言在无尺度和小世界网络中的扩散速度不会随网络尺寸的增加而大幅增加,这解释了为什么语言形式在小规模和大规模人类社会中都可以快速的扩散。

4.4 分析模拟结果

在定义了人工语言、语言知识、处理机制和交流过程后,模型就可以运行并产生结果了。对模拟结果的分析通常基于预先根据研究问题和所包含理论而设定的一些指标。例如,词汇演化模型(Ke et al.2002)设定听/说矩阵相似度(不同个体听/说矩阵中数值的相似性)和交流成功率(听者正确理解说者意思的交流占所有交流的比率)两个指标反映个体间的意思—言语对是否相近及个体间是否具有共同语言。词汇—句法共同演化模型(Gong 2009,2011)设定语言表达度(个体利用其语言规则可表达的复合意思占所有复合意思的比率)和交流成功率两个指标来探讨个体间如何发展相似的词汇和句法结构来正确的交流复合意思。

分析指标数值随模拟进程的变化可揭示语言演化过程的动态特性。例如,图8记录了Ke et al.(2002)模型的听/说矩阵相似度(虚线)和交流成功率(实线)随交流次数的变化。图8中,横坐标表示交流次数,纵坐标表示成功率/相似度,实线为交流成功率,虚线为听/说矩阵相似度。此次模拟有10个个体进行交流,不同意思和言语的个数分别为3,在成功或失败的交流中,个体对矩阵中有关数值的调整幅度为0.2。在模拟的初期阶段,由于个体听/说矩阵中的数值是随机设定的,听/说矩阵相似度非常低。基于此随机矩阵的交流多数是失败的,所以交流成功率也非常低。然而,在经过了3000次左右的交流后,个体对各自听/说矩阵持续调整的累计结果使得听/说矩阵的相似度和交流成功率很快由低数值增长到1左右,这表明此时个体的听/说矩阵已经变得几乎一样了,即所有个体开始用一套自发约定的意思—言语对来表达意思。此结果表明,在没有预先指定的情况下,依靠个体的处理机制和反复交流,一套共同词汇可自发的涌现。此结果演示了一个“约定俗成”的过程,很多语言形式都是通过这种方式在不同语言中逐步形成的,并不需要预先规定。此外,这些指标数值呈现的S型非线性快速增长的趋势也同样出现在词汇—句法共同演化模型(Gong 2009,2011)中,与很多物理现象中的相变过程(持续微小作用导致的系统全局状态的突然改变,如在持续加热下水在0度附近由固态到液态的迅速改变)相似。这种类似相变的趋势也可代表很多语言特性的涌现趋势。

除了跟踪单次模拟结果,结合统计方法,分析多次模拟的平均指标数值随模拟初始条件或其他设定的改变可进一步揭示模拟结果主要由哪些因素导致,以及这些因素是如何起作用的。例如,基于词汇—句法共同演化模型,Gong(2010)设定了一系列模拟条件,每个条件下三种不同的文化传递方式所占比重有所不同。模拟结果显示,在仅含有某种方式或某种方式的比重远大于其他方式的条件下,交流成功率在多次模拟下的平均值非常低,而在三种传递方式所占比重接近的条件下,交流成功率的平均值会很高。这表明在多个体社会环境下,为获得并保持较高的交流成功率,三种传递方式缺一不可。

5 计算机模拟的优势与局限

在了解了对模型的分类标准、开发步骤和常用手段后,我们可清楚认识此方法的优势与局限。计算机模拟有两个主要优势:

1)把语言作为一个复杂适应性系统进行研究

复杂适应性系统(complex adaptive system,CAS)(Beckner et al.2009; Steels 2000)通常由多个成分构成,其相互作用的结果通常是非线性的(如相变)和自组织的(在没有外界干预下,系统成分通过局部的、微观的或低层次的相互作用而生成某种全局的、宏观的或高层次的模式的过程,Camazine et al.2001),而且这些由微观层面相互作用累积的宏观层面结果在微观层面上可能并不可见(Ball 2001)。根据这个定义,语言也是一个CAS(Steels 2000;王士元2006),由多个语言成分(如语义、句法、语音等)构成,并在社会—文化和自然环境下在多个使用者间传递。语言成分在处理过程中频繁和紧密的相互作用、使用者的认知能力与经验,以及社会—文化等因素共同导致了语言的涌现和变化及使用者的语言行为(Beckner et al.2009; Fitch 2010)。

将语言视为CAS为研究语言学问题建立了新的理论基础(Loreto & Steels 2007),而计算机模拟提供了一个有效研究CAS的方法。如前所述,计算机模拟通常只定义语言系统的基本成分、成分间局部作用的规则,以及使用者简单的处理语言片段的能力。通过观察由这些局部作用或简单能力导致的语言知识和全局语言形式(Steels 1997; Cangelosi & Parisi 2002),计算机模拟可检测个人间的交流行为是否可导致群体共同语言的出现,或一些与语言看似无关的因素是否可导致某些语言特性的出现与变化。同时,在交流过程中,使用者通过用言语表达某些意思来影响其他使用者,并通过理解其他使用者的言语被其他使用者影响。通过模拟这个“交流过程中的环路”,计算机模拟可揭示交流过程中相关因素和成分的自组织过程,并观测由这些因素和成分导致的语言变化,例如从无语言发展出共同语言或从某种语言结构转变成另一种结构的过程。

2)对模拟结果的客观分析

模型的假设和结果可从多方面进行分析和验证。例如,模型中引入的个体学习机制可在心理语言学实验中得到印证(Christiansen & Ellefson 2002),重复学习模型(Kirby 1999)中发现的瓶颈效应在真人实验中也对语言结构发挥同样作用(Kirby、Cornish & Smith 2008)。此外,一个具有清晰仿真条件和量化参数的模拟架构(尤其是数学模型)可被用来研究不同领域中的类似现象,且模拟结果可互相印证(Belew、Mitchell & Ackley 1996)。例如,磁铁异形模型中表现的磁针指向从无序到有序的相变可被借鉴研究人群中语言形式的扩散和交流系统的产生(如Ke et al.2002; Loreto & Steels 2007),传染病学中的疾病扩散模型和演化生物学中的数学模型也可用来研究语言形式在群体中的扩散(如Gong et al.2012)。

计算机模拟是为特定目的对某个系统或现象所做的抽象(Belew、Mitchell & Ackley 1996)。与其他研究手段类似,此方法也有其不可避免的局限。

首先,多数模型都会对所关心的语言特性进行抽象和简化,以至于这些模型不能完全保留原有语言特性的复杂度。例如,研究语言竞争的数学模型(如Abram & Strogatz 2003; Minett & Wang 2008)看不到任何语言成分;词汇演化模型(如Ke et al.2002)中的交流被简化为在矩阵中根据概率进行搜索;词汇—句法共同演化模型(如Gong 2009,2011)中的人工语言只能表达包含施动和受动者的简单意思,而且其句法范畴相比真实语法范畴也过于抽象和简单。

其次,一个模型通常只关注某个具体研究问题,而忽视其他方面。例如,词汇—句法共同演化模型(Gong 2009,2011)只关心词序,而忽略其他句法结构;重复学习模型(Kirby 1999)只关心垂直文化传递,而忽略其他传递方式。

作为CAS的语言不是由单一因素或功能决定的,但是一次性处理所有相关因素和功能是不可能的(Fitch 2010)。所以,简化和专一是必需的。这两种措施可把原有系统简化为小规模的子系统,把原有过程简化为相对简单的子过程,并把混杂的、互相干扰的结果分类为依赖于不同条件的子结果。在这些子系统、子过程和子结果中,我们可容易的归纳出可信的结论。随后,我们可逐步提高模型的复杂度,使其逐步接近真实情况,并最终获得对研究问题的认识。这种“分而治之”和“从简单到复杂”的策略已在学术研究中广泛应用。然而,过分简化可能令某些因素变得毫无用处,或忽略了研究问题的本质。例如,某些语言特性(如句法)只会出现在具有某种复杂度的交流系统中(如语言所描述的意思有一定的结构,无法单用词汇表达),过于简化的模型会导致这些特性无法出现。同时,过分专一也会影响模拟结果的意义,因为仅包含某些因素而无其他因素影响的理想情况在现实中并不常见。

除简单性和专一性外,由于缺乏足够的直接证据和量化评价方法,直接比较模拟结果(特别是语言涌现模型的结果)与实际数据有时是不可能的。其他领域的发现和技术可在一定程度上克服这一局限。例如,考虑到不同CAS的相似性,我们可比较语言涌现的动态过程与物理现象中观测到的非线性过程。另外,实现模型的过程也不可避免的涉及一些主观因素(如设置群体大小、语言成分数量,及处理能力的水平等),而且任何在参数设置、编码、结果分析上的疏忽都会导致模型产生与编程人员初衷不符或与实际数据不匹配的错误结果(Galán et al.2009)。为避免这种情况,我们要尽量清楚、合理的定义和实现模型,并采用系统分析方法处理模拟结果,如结合数学工具(如统计分析等)综合评估模型在不同初始条件和参数设置下的结果,以归纳出客观、普遍的模拟结果。

6 结语

计算机模拟近年来加入了研究演化语言学问题的行列。本评论总结了此方法对语言演化研究的必要性、优势和局限,并介绍了模型的分类标准,开发模型的主要步骤及常用手段。我们希望本评论能帮助感兴趣的语言学学者正确理解和评估计算机模拟,并能够在此新兴领域开展自己的研究。

同时,从对计算机模拟及其他已有研究手段的介绍可以看出,演化语言学研究本质上是跨学科的;只有结合各领域的知识、手段和发现,我们才能调节互相理论的冲突,收窄目标问题的解空间,并排除那些在单个领域看似合理的解释(Bickerton & Szathmáry 2009)。可以预期,未来演化语言学的发展将建立在语言学与计算机模拟仿真,及其他学科(如考古学、人类学、心理学、遗传学、脑科学、认知科学、动物行为学等)的合作之上(王士元2012)。令人欣喜的是,最近的国际演化语言学会议(如Evolang,见Cangelosi、Smith & Smith 2006; Smith、Smith & Ferrer-i-Cancho 2008; Balter 2010; Smith et al.2010; Norlmile 2012; Scott-Phillips et al.2012)、暑期学校(如Gong et al.2010)及专题讨论会(如Gong & Coupé 2011)正越来越重视跨学科的合作研究,国内一些学者也开始倡导并采用跨学科的角度研究语言演化及其他语言学问题(如卫志强1992;胡壮麟2007;卫志强、何元建1996)。

①通过社会性学习机制,如模仿、教授和语言等,在个体间传递信息的过程。(Mesoudi & Whiten 2008)

标签:;  ;  ;  

语言进化的计算机模拟研究_语言学论文
下载Doc文档

猜你喜欢