语言的系统状态和语言类型,本文主要内容关键词为:语言论文,状态论文,类型论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
语言结构是一种系统,高度有序是语言系统的共性。在语言的历史发展过程中,不同语言都会形成一些不同于其他语言的特点,或者说是表现为不同的语言结构类型。一种语言系统的宏观状态可以包含各种不同的微观状态,这些微观状态的差异及其所表示的语言知识的差异是导致语言结构类型不同的重要原因。本文拟通过对一些具体语言参项宏观和微观状态的分析,讨论语言系统状态和语言类型分类的关系。
一 系统状态的含义
一个系统的宏观状态可以包含各种微观状态。微观状态的分布是一个连续统,其中有两种典型的或极端的分布类型,一种是结构项比较集中地分布于某一相空间(微观状态1),另一种是结构项比较均衡地随机分布于各个相空间(微观状态2)。这两种微观状态如下图所示:
微观状态1 微观状态2
相空间1 相空间2相空间1 相空间2
++++++++ ++++
++++++++ ++++
++++++++ ++++
从统计学角度上说,微观状态1要求结构项不能或很少可以交换分布位置,所以出现的概率或容配数小;微观状态2允许结构项有多种交换分布位置的可能,所以出现的概率或容配数大。如果某一系统的宏观状态对应于概率小的微观状态(如微观状态1),则称非平衡态或远离平衡态;如果某一系统的宏观状态对应于概率大的微观状态(如微观状态2),则称平衡态或近平衡态。
系统状态的物理学意义在于,包括微观状态数目少的远离平衡态的系统有序(秩序)度高,有序能量大;包括微观状态数目多的近平衡态的系统无序(混乱)度高,无序能量大。热力学对系统无序度描述的指标是熵,熵的计算公式为:
S(熵)=k(玻耳兹曼常数)log[,e](自然对数)W(系统宏观状态对应的微观状态数)
显然W(系统宏观状态对应的微观状态数)作为函数是决定系统熵值的关键因素,即微观状态数越大,宏观系统的熵值越大,无序度越高;反之则熵值越小,无序度越低。热力学第二定律区别于第一定律(能量守衡定律)的关键在于,一个封闭系统从始态到终态的变化,总是表现为从有序变为无序,即熵增的必然趋势。热力学第一定律认为能量是守恒的,能量的转化没有时间的方向性;而根据热力学第二定律,有序能量通过作功转化为不能再利用的无序能量的过程是不可逆转的。如果要维持或降低封闭系统的熵值,即保持系统继续处于有序的、作功的状态,必须从系统外部摄取能量(输入负熵),但同时必然造成外部系统的熵增,也就是说系统有序度的增加,是以外部环境无序度的增加为代价的。比如一杯热水的水温只能逐渐趋近周围的环境温度,而不可能自发地恒温或增温,除非用其他热源来加热水温。
从信号学角度理解系统状态,尤其是语言结构的系统状态具有重要的意义。在热力学系统中,熵态反映的是系统的有功(有序)能量和无功(无序)能量的对比状态,而在信号系统(包括语言系统)中,熵态反映的是系统的有序信息(信号)和无序信息(噪音)的对比状态,因此又叫信噪比。信噪比(有序度)越高的系统,信息传导能力越强,因此越是理想的信号系统。比如上述微观状态1,某结构项集中地落到某个相空间,这些结构项对该相空间来说可以起到标志的作用,因此是信号;而微观状态2,某结构项随机地落到各相空间,这些结构项对任何相空间都起不到标志的作用,反而可能对其他有用的信息起干扰作用,因此属于噪音。信号系统同样要服从热力学第二定律,即系统也会必然地从有序状态趋于无序状态,其结果是信号越来越弱,噪音越来越强。这对于一种信号系统,如一种语言来说是不理想也是不允许的。为克服这种趋势,或者说为保持或降低语言系统的熵,语言使用者必须通过对语言结构的不断规范,即随时有意识或无意识地纠正不正确的言语表达来维护语言结构有序的系统状态。信号系统不是物质的或能量的,保持系统的有序化熵态不是通过外部能量的摄入,而是通过信号使用者的主观意志的干预来实现的,因此可以说意志或智能也是一种负熵。
自然语言作为信号系统,是由许多语音、语法、语义、语用等层面的子系统构成的,各子系统都允许“噪音”在一定合理的范围内存在。换句话说,不同语言各子系统对应的微观状态可能是多种多样的,这种系统状态的多样性是造成不同语言知识体系不同的原因,也是造成不同语言结构类型不同的原因。因此从语言系统状态的角度来说明语言的类型差异是有解释力的。
二 系统状态和语言类型学的关系
语言类型学研究有特定的范畴和方法。下面通过一些形态结构和语音结构的实例分析来说明结构的系统状态和语言类型学的关系。
实例一:动词使动范畴分布的微观状态
许多语言动词的语态范畴都有使动或使役的用法。例如我国的藏缅语族诸语言和阿尔泰语系语言普遍存在动词使动态和自动态的对立,并且普遍运用动词附加成分的手段来表示这一范畴的语法意义。如果按传统的语法范畴和语法手段分析很难区分这些语言在结构类型上的异同。但是从范畴子系统的微观状态构成来看不同语言是有区别的,因此就可以断定这些语言在类型上也是有区别的。
藏缅语族语言的使动态只分布于或倾向分布于不自主和不及物动词中,而自主和及物动词则倾向于不用使动用法,因此以下两种句法结构在藏缅语中是很少见的:
1.S+O+自主-使动V
主语使宾语发生某自主行为
2.S+O1+O2+及物-使动V
主语使宾语1发生某支配宾语2的行为
但是在阿尔泰语言中,使动不仅可以出现在不自主、不及物动词中,也可以出现在自主、及物动词中,动词的使动用法在上述两种句法格式中都是很自然的。
因此藏缅语和阿尔泰语的使动态分别对应着不同的微观状态(c代表使动态特征):
藏缅语使动态的微观状态 阿尔泰语使动态的微观状态
不自主不及物动词 自主及物动词 不自主不及物动词 自主及物动词
cccccccccccc
cccccccccccc
cccccccccccc
使动态微观状态的分布差异表明藏缅语和阿尔泰语动词的语态范畴属于不同的类型。
汉语在发生学上与藏缅语有关系,同时(至少对北方汉语来说)又和阿尔泰语言有密切的接触关系。汉语语法研究没有直接使用“使动”这一术语,从跨语言的角度看,不同语言都可以用不同的形式表现同样的范畴。就使动态来说,汉语可以使用表示使成意义的动词,但是由于形态类型的不同,汉语表示使成意义用得更普遍的是分析式的句法格式。我们同样可以通过这些动词格式的宏观状态所对应的微观状态来观察汉语的“使动”类型。
有使成意义的动词是由不及物动词或形容词充当的使动动词,如“灭(火)、熄(灯)、滚(铁环)、端正(态度)、严格(手续)”等,很明显这些不及物动词或形容词“灭、熄、滚、端正、严格”等作自动用法时都是不自主的和不及物的,而当它们充当使成动词的时候则是自主的和及物的。
现代汉语表示使成意义的句法格式主要是使成式(动结式),另外我们认为兼语式(递系式)、处置式和被动式在很大程度上也是表示使成意义的句法格式。
使成式的第二个谓词性语素如“(打)倒”、“(杀)死”、“(晒)干”、“(染)红”和单纯使成动词一样也都倾向是不自主的和不及物的。
兼语式至少要用两个动词,如:
让你白跑了一趟 请客人吃饭 派他当代表
处置式和被动式的动词一般也不用单个的动词,而要使用动词的复合形式,其中用得非常普遍的形式就是动词的使成式,如:
把房子打扫干净 把我气糊涂了 (处置式)
杯子被他打破了 衣服全给淋湿了 (被动式)
这三种句法格式不仅都明显地倾向于表示使动意义,并且它们的第二个动词也明显地倾向于使用不自主的和不及物的动词(或形容词)。所以可以说,汉语兼语式、处置式、被动式在很大程度上是表示不同话题的使成(使动)式的变换句法结构。
汉语的兼语式、处置式、被动式是表示使成(使动)式的句法结构还可以通过藏缅语言、阿尔泰语言使动态和汉语的对译形式得到证明。这些粘着型的少数民族语言中使动态只有少数动词在汉语中可以对译为单纯的使成动词,而用得更普遍的是分析型的兼语式、处置式、被动式。例如:
汉语和动词有使动用法的少数民族语言的对比研究可以支持这样的说法,“古代汉语中,动词使动用法的用例最多,不及物动词和及物动词都有这样的用法,前者极多,后者相当少。现代汉语中,情况基本也是如此”(刁宴斌)。可见汉语在使动范畴的类型上更接近藏缅语而不是阿尔泰语。
实例二:声调分布的微观状态
声调是汉藏语普遍具有的语音特征。汉藏语的声调普遍性表现为:(1)声调的数量和词的音节长度成反比;(2)有声调语言的音节界线都是很清晰的,而无声调语言的音节界线大都是不清晰的,韵律特征也有明显的区别;(3)大多至少有两三个舒声韵的调类和一个对立或不对立的促声韵的调类;(4)根据清高浊低的规律,声母的清浊通常再区分出对立或不对立的阴声调和阳声调。
不同语族语言的声调不仅在发生机制和结构功能上有差异,在共时的微观分布上也有区别。具体表现为,汉语、壮侗语和苗瑶语的声调数量较多(通常有八类),这和它们词的单音节性有关。从微观分布状态看,汉语、壮侗语、苗瑶语的声调在不同声母、韵母的相空间分布中是相对无序的(尤其在舒声调和促声调、阴声调和阳声调对立的情况下)。而藏缅语的声调分布和汉语、壮侗语、苗瑶语有很大区别,它们不仅声调数量相对较少,更重要的是这些语言声调在不同的相空间下不是随机地分布而是受到制约的。例如:藏语(拉萨话)有4个声调,其中“54调和12调只出现在短元音韵母的音节,55调和14调只出现在长元音、复元音和带r韵尾的音韵母的音节”。羌语(桃坪话)有6个声调,其中“升降调只出现在固有词中而不出现在汉语借词中,全降、低升两个调多半出现在汉语借词和构形中。”景颇语有4个声调,本调的变调很复杂。第1调和前后不同音节的组合可以变为第2调或第4调;第2调在松元音韵母中读高平,在紧元音韵母中读高升;第4调只出现在特殊的语义、语法用法方面;此外多音节词的第一音节多读不稳定的轻声。克伦语只有3个调,其中中平调不能出现在促声韵母中,在单音节词中也较少出现。类似的声调特有的微观分布状态在藏缅语中比比皆是。汉藏语言学家早已指出藏缅语和汉语、壮侗语、苗瑶语的声调系统属于不同的语言类型,这种类型上的差异主要反映在不同语言声调系统微观分布上的差异,也即系统有序度和信噪比方面的差异。
三 系统状态和一般语言知识类型的关系
类型分类是人类的一种重要的思维模式,它可以广泛地用于众多的认知领域。人们关于语言的知识是多方面的,不仅包括对语言结构的认识,也包括诸如语言的谱系关系、语言的地区分布、民族分布、功能分布等语言的社会知识。这些知识的分类体系也具有一般类型学的意义,并且它们在类型上的差异依然和系统的微观状态差异有直接的关系。
实例三:从关系词分布的微观状态看语言的关系类型
语言之间有音义对应的词叫关系词。若设高阶词(核心词)和低阶词(非核心词)为不同的相空间,关系词的分布则有三种典型的微观状态:主要分布于高阶词、主要分布于低阶词和随机地分布于不同的词阶。几种微观状态如下图所示(r代表关系词):
系统状态1系统状态2系统状态3
高阶词低阶词高阶词低阶词 高阶词低阶词
rrr
rrr rrr
rrr
rrr
rrr rrr
rrr
rrr
rrr rrr
rrr
前两种分布都是有序的,也叫有阶分布。据有关学者研究,有阶分布的两种状态性质不同,是区分语言之间是同源关系(如壮侗语族语言之间)还是接触关系(如壮侗语族语言和汉语之间)的重要标准。第三种分布是无序的,也叫无阶分布,它既可以反映没有任何联系的语言之间的偶合关系(显然大多数语言是这种关系),也可以反映语言或方言之间高度密切的同源关系(如诸突厥语言),同时还可能反映某种前两种分布无法证明的更加复杂的语言关系。关系词系统不同的微观分布状态所代表的上述同源、接触、偶合和尚不明确的复杂关系等类别也可以看作是广义的语言知识的类型分类。根据熵增定律,如果同源关系的分化或非同源关系的接触停止发生作用从而导致语言在发生学或接触过程意义上回复为相对封闭状态时,前两种有序的关系词系统始态应该趋于无序的第三种系统终态。
实例四:从语言使用分布的微观状态看语言的使用功能类型
语言是重要的社会交际工具。语言的使用功能类型最直观地可以分为口头交际功能和书面交际功能,或者说人们是把口头交际和书面交际看作语言使用的不同的相空间。在这样大的相空间下,不同语言还可以使用或不使用于各种复杂的社会交际领域和场合,因此我们还可以把语言使用领域进一步区分出各种政治、经济、文化、教育、司法、宗教等活动的次相空间。语言在不同相空间和次相空间的微观分布状态可以作为语言使用功能的分类依据。
例如我们通常认为有文字和没有文字的民族语言在使用功能上是有重要差别的。对没有文字的民族来说,他们的书面交际活动以及一定范围的口头交际活动只能通过使用其他民族的语言文字来实现。在有民族文字的语言中,我们通常把人口众多、本民族文字有较长使用历史和较大通用范围的蒙、藏、维、哈、朝等民族语言放在社会使用功能最强的等级,就是因为这些民族语言可以较广泛和自足地用于各种社会语言交际领域,可以很大程度地满足本民族内部以至局部地区不同民族之间语言社会交际的需求。对那些本民族文字通用程度相对不高的彝、傣、锡伯、柯尔克孜等民族语言,以及那些民族文字创制使用历史不长、通行范围不大的壮、布依、侗、黎、苗、景颇、载瓦、哈尼、拉祜、傈僳、纳西、佤、土族等民族语言来说,它们在诸社会使用的相空间的分布是不平衡的,一般来说是用于较低的层次和较少的场合,因此为了维持语言使用相空间的平衡,推行双语教学和双语使用在这些民族的社会中就显得非常重要。
在一个多民族、多语言的国家里,各民族语言不同的使用发展水平是在历史过程中逐渐形成的。从积极的意义看,不同民族语言使用发展水平的不平衡是促成国家通用语言文字和地区性通用语言文字有序化和一体化格局的基础。一个国家总体的语言使用宏观状态包含了许多复杂的微观状态,其中每一种民族语言局部的使用宏观状态也包含了许多复杂的微观状态。同样根据熵增原理,如果仅靠各种民族语言自然的互动,往往会导致语言关系和功能的失衡或失序。因此政府通过语言政策、语言规划以至语言法规(这些都相当于信息熵)来干预、调整、规范各民族语言的关系和功能,是促使国家总体和局部社会语言可持续发展优化系统状态的必要措施。
四 余论
语言结构的类型和共性(普遍性)是一对对立统一的语言结构特性,代表了不同的抽象层次。语言类型是通过归纳各种具体语言结构特征的异同抽象出来的语言类别,语言共性则是通过对不同语言类型普遍联系的进一步抽象。系统宏观状态包含的微观状态不仅可以解释语言类型的形成机制,也应该可以解释语言共性的形成机制。
语言的共性通常被划分为绝对共性、倾向性共性,蕴含共性、非蕴含共性。可以这样用使动态微观状态分布来描述语言的各种共性的形成机制:(1)所有语言的某一参项都毫无例外地分布于特定的相空间,则构成语言的绝对共性。例如假设所有语言的动词都可以有不同形式的自动态和使动态的对立,就构成一种人类语言语态范畴普遍存在的绝对共性。(2)分布可以有少数例外,则构成语言的倾向性共性。比如上述藏缅语族语言的使动态只分布于不自主和不及物动词中是有少数例外的,因此这一规则就是藏缅语使动范畴的一种倾向性共性。(3)几个参项的相空间分布在许多语言中都具有内在的相关联系,则构成语言的蕴含共性。如上述藏缅语的使动态一般只出现在不自主和不及物动词中,但不自主动词和不及物动词不一定都能使动化,则表明藏缅语动词的使动态蕴含着动词的不自主性和不及物性。(4)某些参项的相空间分布没有联系,或者个别语言内部的联系没有跨语言的普遍性,则构成语言的非蕴含共性。比如上述阿尔泰语动词可以普遍使用的使动态,如果在诸多普遍使用使动态的语言中看不出它和动词的其他语法范畴有什么内在联系,就属于非蕴含共性。就这几种普遍的语言共性而言,倾向性共性和蕴含共性是可以被现实语言事实和隐含的系统状态所证实的,但是所谓绝对共性和非蕴含共性却不那么容易被证实。因为人们的现有认识能力在穷尽所有语言事实和揭示更深层次的语言微观状态方面都是有局限性的,所以人们对语言共性的分类或许只是反映了以人的观察能力为尺度所得出的结果。
语言的类型和共性在微观分布状态上还有一层关系,就是语言类型在表层结构上都是对立的,比如有声调和无声调的语言;有数范畴和无数范畴的语言等,因此一种语言类型某参项的有序必然蕴含着另一语言类型同一参项的无序(如音高参项对有声调语言来说是有序的,而对无声调语言来说则是无序的)。语言共性是比语言类型更深层的关系,是有序类型之间的内在联系,所以语言共性总是高度有序的,这也是语言作为人类有效交际工具的客观要求。
语言的历史演变包括语言的类型变化(在正常的情况下类型变化是非常缓慢的,在这种意义上语言类型分类和语言谱系分类通常是一致的)。正是因为语言结构对应的微观状态是一个连续统,从一种微观状态到另一种微观状态的变化无论是渐变还是突变只要不违反语言的共性原则理论上都是允许的,因此可以观察到的语言历史类型演变事实都可以从所对应的微观状态的变化得到解释,同时并不影响语言共性对这些变化的制约。
结构主义语言学的分布理论实际上是系统状态的另一种表述形式,例如互补分布相当于某种非平衡态(系统熵值较低),自由分布相当于平衡态(系统熵值较高)。然而系统状态原理的优势在于可以更广泛地用于描述各种自然的和社会的系统;并且由于系统的各种微观状态被看成为一个连续统,因此可以说明不同分布之间的联系。同时从始态到终态的变化(在封闭的系统中)必然表现为不可逆的时间上的单向动态趋势,因此系统状态在系统的动态变化方面可能比语言结构静态的分布描写更具解释性。
标签:相空间论文;