共时材料中的历时分析——从《根本说一切有部毗奈耶破僧事》看汉语词汇的发展,本文主要内容关键词为:汉语论文,词汇论文,材料论文,说一切有部毗奈耶破僧事论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]H13 [文献标识码]A [文章编号]1006-0766(2004)05-0066-06
根据专书作语言研究,通常定位在共时平面,忽略其中语言现象的历史背景,这样,可以在一个相对确定的范围之内发现不少有价值的材料。如果要在专书的研究中引入历时的分析,一般是把两种或几种不同时期的专书作对照。现在的问题是,我们能以一种专书为基础范围展开历时的分析研究吗?这样做的价值在哪里?本文尝试就此在研究的思路和方法上作一些探讨。
一、共时、历时及其关系的认识
以专书材料为共时对象、以不同时期材料展开历时研究的指导思想,主要源于索绪尔的语言时间观。索绪尔说:“有关语言学的静态方面的一切都是共时的,有关演化的一切都是历时的。”[1](119页)在语言研究中提出共时和历时的概念及其区别,使我们注意到产生于不同时代的语言材料之间的系统差异。我们可以根据这些差异,去探寻语言系统本身的变化。语言系统建立在共时的基础上,是对语言的静态认识的结果。动态的历时研究其实是把若干个静态现象串连起来的描写或者分析,正如索绪尔所说,共时和历时之间存在着相互的依存关系[1](127页)。核心思想仍然是共时的研究。
但是,一种有生命的语言,总是处在变化中的。不论出于有意还是无意,语言运用中各种新的说法随时随地会产生,引起语言的渐变,这也是语言生命力的一种表现(注:虽然这种偶发性变异大多在系统的规范作用下被匡正了,但总有一部分被保存并且流行开来。)。因此,我们在共时理论指导下通过对某个时期的语言状况描写所得到的静态,只是一种相对的稳定状态,由此得到的共时关系也是相对的,绝对的共时关系只存在于理论上(注:在这方面,人口调查是一个很好的例子。人口具体状况总是处在不断的变化之中,而人口调查以某一个时点的人口状况作为调查对象,从而获得一个共时的人口状况数据。绝对的语言共时系统其实也应该用这样的手段获得,比如以某一天中人们活动最活跃的某个时点为准,汇集所有在这一时点上出现的语言形式。但是,语言的使用具有随机性,并非所有存在的语言形式(如词语)在某一时刻都会被使用,因此,真正的共时语言系统还应该以某一时点人们所可能使用的语言形式为基础,在此基础上才能得到一个绝对的共时描写。)。因此,我们一方面可以把某个时段的汉语,比如现代汉语看成共时的范畴进行分析,同时却也可以说“现代汉语的形成和发展”之类的话,甚至在现代汉语的范围内作历时研究。这引起了我们对索绪尔语言时间学说的重新思考。对此,朱德熙先生有非常深刻的论述,他说:“德·索绪尔区分共时的和历时的语言研究方法的学说,给本世纪的语言研究带来深刻的影响。这种影响有积极的方面,也有消极的方面。积极的方面人所共知,用不着说。消极的方面,指的是由这种学说导致的把对语言的历史研究和断代描写截然分开,看成是毫不相干的东西的倾向。”[2]陈保亚先生则提出了语言研究的“泛时观”,表达了同样的思考:“泛时语言学认为共时与历时必须有机地结合起来,在研究共时系统的同时参考历时因素,在研究历时演变的同时以共时结构为基础。”[3]
语言事实告诉我们,处在某一共时系统中的语言成分,不是在一朝一夕之间产生的,而是通过漫长时期的筛选、累积、融合而成的。因此,可以反过来说,在一个共时系统中保存了以往不同历史时期产生的相关成分,我们可能在一个语言的共时平面中看到来自不同时间层面的丰富的历史遗存(注:俞理明曾以《太平经》中的“者”作为考察对象,根据此书中反映不同发展阶段的“者”的用例,讨论“者”从名词之后向定中之间的变化过程。参《〈太平经〉中的“者”和现代汉语“的”的来源》,见《汉语史研究集刊》第四辑。)
。具体说来,我们关心在这个系统中,构成句子的实质材料及其相互关系都是来自哪一个时代。因为语言研究的核心任务之一是描写共时系统并揭示其运行机制,这也是索绪尔的核心思想。自然,要达到这些认识可以有多种考察步骤和观察角度。本文尝试在一种专书的范围内展开汉语词汇的历时研究,并讨论这样做的价值。
二、共时系统中的历时层面及其分析
基于以上的考虑,我们利用唐代高僧义净(635-713)翻译的《根本说一切有部毗奈耶破僧事》(以下简称《破僧事》)(注:其中的“根本说一切有部”,为小乘二十部之一,是佛陀灭后三百年,由上座部分出,此后犊子部等部又由此部分出,故对于由其所分出之诸部而言,称为“根本”。“毗奈耶”为三藏之律藏的音译词。“破僧事”则反映了本经的具体内容,即分散僧众之事。)一书作专书词汇分析。该书二十卷,约15万字,主要通过讲故事的方式反映了释迦牟尼与其堂弟提婆达多之间发生的各种斗争,纪录了早期佛教的许多史实。全文语言浅显平易,绝少生僻用语,可读性极强。以该部佛经为研究语料,基于笔者对其口语价值的认可。
在分离出全书所有的词语之后,我们利用现有的成果和研究手段,考察每一个词语的早期用例(注:其中会有一些误差,比如没有真正找到早期的用例,或者某些词语产生较早而文献记载较晚;另外,有些古文献中出现的用例可能是后人改入的。该项工作最大的难点在于处理字与词的关系、词的认定上。但是这些问题存在于所有的同类研究中,而且数量不会太大,对我们观察汉语词汇演变的大势的影响有限。),然后,区分为佛教用语(注:此处所谓的佛教用语包含佛教术语和佛经中专用的人名、地名和物名等专名用语。它们是佛经文献的宗教氛围和异域氛围的形成者。)和一般词语(注:排除了佛经用语,这些一般词语似乎可以看作是当时汉语的相对稳定的基础部分。)两大类。由于佛教用语的专门性以及佛教传入中国的时间上的限制,不大适于作为本研究试图对汉语词汇作全程历史分析的依据(注:当然,它们的存在,肯定会对整个系统产生影响,但是本文对此暂不考虑。)。因此,我们的讨论暂不包括这部分词语,只是将《破僧事》中的一般词语作为当时词汇系统的一个抽样样本,即把它们看作一个独立的词汇系统。按这些词语的文献初见例以先秦、两汉、六朝、隋唐(注:此据向熹先生《简明汉语史》的分期。其中,先秦含上古前期和中期,两汉为上古后期,六朝为中古前期,隋唐为中古后期。这里需要交代的是,有的词从产生来看来源于先秦,但其意义在后代有了变化,对这些成分,本研究仍然归入了先秦类。由于篇幅限制,此处没有详细交代处理细节。)四个时期分别归类,并进行统计分析。
本书共使用了6968个词(词量),这些词在句中共出现109694次(词次)。其中佛教用语1319个,占18.9%,出现13623次,占12.4%;一般词语5649个,占81.1%,出现96071次,占87.6%。对书中全部一般词语的个体数量(词量)和累计使用次数(词次)以及每个词语平均使用的次数(频次),按每个词语形式初例的发现时代分类,得出以下统计结果,见表一。
我们把书中所出现过的词的数量(除去重复),称为词量。从词量上分析,先秦产生的词语占46.1%,不到一半。大量的新词语随着时代的推移纷纷涌现,来自秦以后的词语占了一半以上,其中两汉产生的词语占21.3%,六朝产生的词语占22%,在隋至唐初的一百多年中,又有百分之十强的新词语产生。大致上每四百年有百分之二十以上的新词语产生,时代偏近,这个比率还偏高一点。本书中使用的词语,有一半以上是在不到一千年的时间内出现和流传下来的。词汇新生成分的数量,十分可观。
表一:
先 秦两
汉 六
朝 隋 唐 合 计
词量 2607 46.1% 1205 21.3% 1236 22.0% 601 10.6%
5649
词次 83317 86.7% 7724 8.0%
4019 4.2% 1011 1.1%
96071
频次 31.966.41 3.25 1.6817.01
这个数字向我们提示,各时代所产生新词语在后代文献中的保留,似乎与时间的推移有着更多的关系。社会相对稳定的两汉与社会比较动荡的六朝,时间长度大体相当,这两个时期产生的词语留存在《破僧事》中的数量也没有太大的不同。从调查数据来看,似乎社会的变化并没有使词汇更替的过程(或者说是新词语的产生)明显地加快或者减缓,剧烈变化的时代并没有给后代留下更多的新词语。这里有两个可能,一是变化剧烈的时期在社会生活的某些方面产生的新词语要多些,但是由于人们注意力的转移,在社会生活另外一些方面产生的新词语却相对减少,因此,在某些方面出现的大量的新成分,并不能改变新成分发生在总量上的平衡。还有一种可能是,变化剧烈的时期确实产生了更多的新词语,但是,其中被淘汰的比率也大大增加,结果能留存到后代的数量并没有明显增加。总之,我们以为,依存于社会的语言有自身的发展节奏,它像一个充满生命力的机体,在保持自身稳定的基础上,随时进行着新陈代谢活动,在一定的时期内,词汇中会有相应数量的新词语产生,并流传下去。社会的影响,或者说是外部的影响,似乎主要应该体现在新词语表现的内容上,而不是在数量或形式上(注:我们这个认识的前提是对居于基础部分的一般词语而言。如果将佛教词语纳入观察,将是另一种情景,产生于汉代和六朝的词语数量会有相当数量的增加。不过,宗教用语具有行业性(社会方言性),我们排除这一部分词语,可以在一定程度上抵消《破僧事》这一文献的行业背景所带来的词语偏向,而更好地反映当时一般生活中的词语情况。)。
把书中每个词所使用的次数累加在一起,即整个语言材料的线性排列中切分出来的所有词汇单位的数量总和(包括重复),为词次。从词次来分析,我们可以看到一组与词量分析大不相同的数据,而这样的数据常常被人忽视。
根据词次统计,在本书的所有语句中,有86.7%的用词是先秦就已产生的,8%是两汉产生的,4.2%是六朝产生的,唐代产生的只有1.1%。也就是说,在阅读中,我们看到的每一百个词语中约有八十七个词语是先秦就产生了。新生词语尽管个体数量可观,但在句子中出现的机会很少,像占词量10.6%的隋唐时期出现的新生词语,它们的出现率只有1.1%。就平均而论,全书中每个词语平均使用17次,但是,来自先秦的词语的使用率平均近32次,几乎高出全书平均水平的一倍,是产生于两汉的词语近五倍,是六朝产生词语的近十倍,是隋唐产生词语的近二十倍。因此,尽管本书中已经有了大量产生于两汉以后的新词语,我们随处可以看到的却仍是先秦产生的词语。这也让我们深信,汉语在先秦以前已经走过很长的路程了。
这个随时代接近而递减的词语使用率,向我们揭示了汉语词汇在语用中保持稳定的一个重要因素。由于旧有的词语成分的高使用率,它缩小了各个时代用语之间的差异,体现了语言的延续性和稳定性,保证了它作为交际工具而得以长期的使用。
由此可见,新词语尽管在个体数量上占优势,但是,它们并没有成为词汇的主干部分,或者说是基础部分,它们大多属于词汇的边缘部分。对于语句而言,它们多是一些陌生的、低使用率的成分,进入语句的机会并不太多,可以用“一鳞半爪”来形容。它们处于不稳定的状态中,淘汰的机率比较高。这种现象表明,在同一个词汇系统中,这些来自于不同时代的词语所处的地位是不一样的(注:张联荣先生在讨论归并义位时认为:“动物指人以外的牲畜野兽这一义,所以会被单独作为一个义位看待,就是因为它的出现频率很高,在现代汉语中已经成了一个常用义,如果仅用‘特指’来说明,实际上是降低了它的地位。”(《古汉语词义论》北京大学出版社2000年,27页)张先生提到了频率和地位的话题及其之间的关系,值得深入思考。)。
三、在共时平面中看词汇复音化的进程
汉语词汇的复音化研究现在有了很大的进展,不过,研究多集中在复音词语个体数量的讨论方面,对复音化的进程,还有不少地方可以深入讨论。这里,我们仍以《破僧事》这一共时平面为基础,探讨汉语词汇复音化的历时表现。以下是在表一的基础上,据词语的单音和复音的区别所作的统计(见表二,表中比率为该项与整个基数之比)。
单音与复音相对,单音词的使用情况,从侧面反映了汉语词汇复音化的状况。《破僧事》中使用的单音词词量,从产生时代来看,以先秦为高峰,两汉以下大幅度递减,说明了汉语单音词从那时开始,已经不是新生词语的主要形式,单音形式的造词能力大大减弱,新生的单音词对后代的影响也大不如前了。
而各时期产生的复音词语沿用的数量却保持稳定,隋唐以前各时期产生的复音词语进入《破僧事》的数量,都在五分之一左右,几乎是均等的,即使隋唐时期产生的复音词语,也在总量中占十分之一以上。从词量上看,两汉以下,复音词语在产生和继承方面的持续不减,与同时期单音词的产生和继承锐减的情况形成鲜明对比,显示了复音形式在造词方面的巨大生命力,和它在汉语词汇中越来越大的影响。
复音词语的使用率虽然不高,但是相当稳定,大体上时代稍古一点的使用率就稍高一点,时代稍近一点的使用率就稍低一点,没有大起大落的现象。两汉以下,新生的复音词语大量出现,与少量的单音新形式形成对比,但是,两汉以下新生的复音词语和新生的单音词,在《破僧事》中的频次相差不大(10.61∶6.09;3.92∶3.23;1.00∶1.69),符合新生词语在历时的运用中逐步稳定、使用率逐步提高的特点。
表二
先秦词语 两汉词语
六朝词语
隋唐词语
共 计
单 词量 1396 24.71% 85 1.50% 36 0.63% 4 0.07% 1521 26.93%
音 词次 74124 77.16% 902 0.94% 141 0.15% 4 0.004% 75171 78.25%
词 频次 53.10 10.61 3.92
1.00
49.22
复 词量 1211 21.44% 1120 19.83% 1200 21.24% 597 10.57% 4128 73.07%
音 词次 9193 9.57%
6822 7.10% 3878 4.04% 1007 1.05% 20900 21.75%
词 频次 7.596.093.231.695.06
比较之下,复音形式成为新创词语的优先形式,也成为后代继承前代词语形式时的优选形式。在《破僧事》的六朝词语中,复音词语有1200个,单音词语有141个,而在隋唐时期新创的词语中,有597个复音词语,只有4个单音词。复音词语数量的迅速增长,致使复音词语个体的数量大大超过了单音词语,从这个角度来看,唐代汉语词汇的复音化已经达到极其可观的程度。《破僧事》一般词语中复音词语达4128个,占73.07%,单音词只略多于四分之一,在这个层面,复音词语的数量相当于单音词的三倍,已经占据绝对优势,可以说汉语词汇的复音化程度已经很高。
但是,从语用层面上看,我们所感受到的复音化程度并不如词量统计所显示的那么高,语句中看到的多数都是单音词。从整体上看,《破僧事》中复音词语的频次只有单音词的十分之一(5.06∶49.22),其中,略高于总词量四分之一(26.93%)的单音词,占有了四分之三以上(78.25%)的词次。也就是说,在阅读《破僧事》的时候,每一百个词语中,我们只能遇到二十几个复音词,其余的七十多个都是单音词。
因此,尽管我们找到了大量的复音词语,可是在具体的语句中,遇到的大多数还是单音词,从语用的层面上看,组成语句的主要词汇形式还是单音成分,复音成分在语句中并不占据主导地位。这表明在唐代,汉语词汇的复音化程度“已经很高”的说法还要大打折扣。
四、从共时平面所得到的一些历时认识
很多时候,我们感到迷惑,为什么在一些新词语比例很高或者复音化程度很高的语料中,我们并没有遇到太多的新词语或者复音词?上述分析表明,词量与词次是两个不同的概念。从语用的角度来说,一个只使用一次的词与一个使用几十次甚至上百次的词在语言系统中的作用、地位和影响是不同的。词量是一种可能的量,它存在于词库的聚合中,未必使用。而词次才是现实的量,它是我们可以直接感受的词汇形式的使用情况,它体现在语流的组合中。这里也有一个聚合和组合相互转化的关系。可见,在研究词汇新陈代谢和描写词汇面貌的时候,词量的统计分析和词次的统计分析都是必不可少的,片面的统计分折得出的片面数据,会传递给我们不够准确的信息。比如,对于像词汇复音化这样的发展变化,应该从词量和词次两个方面逆行考察,并且从这两个方面提出适当的指标,来衡量和说明汉语词汇复音化的程度。
我们在上述分析中也看到,词汇成分的稳定性与它的产生时代有关。不论从哪个角度,就整体而论,新生成分的使用率,总是不如原有成分高,以本文所分列的四个时段而论,产生得较早的词语的使用率总体比后来产生的成分使用率要高。词汇成分新旧更替是正常现象,旧有的词语的淘汰是存在的,但是,在淘汰的同时,被保留下来的词语就有了更高的使用率,这种优胜劣汰的结果,使一批被保留下来的旧有词语有了很高的使用率。因此,词汇的新陈代谢并非除旧布新,而是新旧交杂,新成分面临着更为严峻的选择和淘汰,通过这样的选择,一批旧有成分成了词汇中的基础成分。
由此,我们还看到了词汇中的基础成分对汉语使用的稳定作用。一些历史悠久的词汇成分,具有很高的使用率,所以它们虽然个体数量并不太多,但是,重现率高,保持了词汇系统的稳定性。尤其是产生于先秦的单音词,尽管在词量上不到四分之一,但是,由于平均53次的高使用率,它们的词次达到了总词次的四分之三以上,这使得后代语言的大体面貌没有像词量那样发生变化,保持了语言的稳定性和可解读性。而新成分的个体数量虽然十分可观,在组配话语的时候,它们却往往不是基础性的成分。
同时,我们也由此认识到,一种语言的词汇系统在接纳新成分,或者说在新陈代谢的过程中,是有容量限制的,即在一个相对长的时期中,只能有相对数量的新成分进入其中,这样才能保持这个系统的有效运行。而这种容量也是通过词量和词次两个方面的不同比例反映出来的。具体情况还有待于深入的研究。
五、从共时看历时的特殊价值和有关问题
在语言研究中引入共时和历时的观念,目的是为了解决早期研究中“把共时与历时混为一谈的后果”[1](138页),推动了语言学的发展。而从共时平面研究历时层次,是从另一种角度把两者结合起来,从比较的角度看,它有一些好处。
在共时材料,尤其是专书的基础上作历时分析,可以保证材料的一致性和可比性。影响历时比较的材料的一致性和可比性的因素,大致有这么一些方面:语体、文体、记载内容、作者的语文观或用语习惯、方言特征等等差异,这些差异往往会导致统计的结果有较大的差别。利用共时材料所作的历时比较,排除了这些干扰,提高了材料的可比性,可以在很大程度上避免由于这些方面的差异而造成的误差,而且便于采用相同的界定标准(注:张联荣先生《汉语词汇的流变》(大象出版社1997年)对有关专书复音词的研究结果有一个综合比较,发现各家对同一部书的复音词统计结果有很大的差异。如《左传》的复音词,程湘清统计有284个;马真统计有489个;还有人认为是788个,最多的则认为有955个。对于这些问题,张先生认为:“最重要的原因恐怕还是对复音词的标准掌握不大一样。”详参该书162-163页。笔者也一直在思考,判断复音词的标准是否也涉及历时方面的因素。)。同时,这类研究的深入开展,也有利于就某个专门的方面作更为精细准确的分析研究。
另一方面,这样的研究向我们显示了共时层面内部的历史痕迹,我们可以从中看到语言各方面的稳定程度或者变化程度。鉴于语言变化是一种持续的、不间断而又有偶发性的变化,我们可以通过对某一共时平面中新质和旧质消长情况,描写出这种变化的过程,并在此基础上作进一步的分析研究。比如,如何看待《破僧事》中见于先秦时期的词语与实际的先秦时期词汇系统的关系?这是一个反观的视角,有很多话题值得探讨。类似的深入分析也许会带给我们新的知识,让我们重新评价一些语言现象在历史语言学研究中的价值。
立足于共时平面的历时分析,可以加深我们对某些语言材料或语言现象的理解,帮助我们利用现有的材料获得更为深刻的认识,从而推动汉语史研究的发展。当然,还有许多问题和难点需要思考,在复杂的语言系统面前,我们的任何一项工作都显得那样微不足道。本文的具体工作是基于一种假想,因为在事实上我们永远不可能获得一种反映完整词汇系统的材料,现有的任何语言材料都只能保留一个系统的随机的抽样样本,因此,我们姑且把对象视为一个语言系统的有代表性的样本,没有作相关的言语成分的剥离工作,如把文言、个人创新、方言成分,以及佛典原语影响等都纳入系统加以考察。这是今后需要深入思考的题目。这样的思路还要面临一些批评,例如,是否机械地割裂了词汇的系统性?似乎我们应该把认识论和方法论区别开来,因为词汇系统的复杂性也许远远超过我们的想象,在没有更为理想的描写手段的情况下,本文试图用这样一种机械的办法,去探索词汇的系统性在某一方面的属性,促进这方面研究的深入。
可以肯定,通过在共时层面中对语言材料中的历时因素作深入的研究,不但可以看到很多在共时平面上看不到的东西,还可以看到很多不同材料的历时比较中看不到的东西,它的价值是无庸置疑的。
[收稿日期]2004-02-12
标签:先秦历史论文;