语言基本结构单位的识别标准、基本特征及其与语言理论建构的关系_语音编码论文

说“字”——附论语言基本结构单位的鉴别标准、基本特征和它与语言理论建设的关系，本文主要内容关键词为：论语论文,它与论文,基本特征论文,理论论文,语言论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

字需要“说”，人们可能难以理解，但实际上现在已到了不得不“说”的时候，因为自我们提出字本位理论以后，除了一些表示支持和理解的（李瑞华，1996,XV、354、450；潘文国，1997,162-184）以外，已有不少误解，其中最重要的有两个方面：第一、把字与语素混为一谈，认为字本位实际上就是语素本位；第二、否认字这个概念的所指的模糊性或多义性，认为字仅仅是书写的单位，与语言的结构单位无关，因而提出“在文字发明以前，人们说话的结构单位是什么”的问题。这两方面的误解涉及到一个根本的理论问题，即我们应该根据什么样的标准去确定一种语言的基本结构单位？在特殊的语言现象背后是不是隐含有一般的结构原理？所以，就这两个方面的误解展开一些讨论，说明语言基本结构单位的鉴别标准，分析特殊语言现象的研究与语言理论建设的关系，这是有普通语言学的理论意义的，并且对汉语研究如何摆脱“印欧语的眼光”的束缚也有重要的价值。

一字与语素相互间没有可比性，不能把它们混为一谈

语素是语言中有意义的最小结构单位，是词的构成成分，人们往往据此认为汉语的字就是语素。最早提出这个看法的好像是吕叔湘(1963,39-45)，认为“汉字、音节、语素形成三位一体的‘字’”。从我们今天的语言观来看，这个论断自然有可以挑剔之处，但在当时它无疑具有革命性的意义，因为人们都把字看成为一种书写单位，排除出语言研究的范围。吕先生的汉字、音节、语素三位一体的看法已明确地说明字有语言的性质，应以此为基础去研究汉语的结构，而词在汉语里“本来没有这样一种现成的东西”，“讲汉语语法也不一定非有‘词’不可”。这些论断涉及到汉语研究的方向，意义非同一般。但遗憾的是，当时和此后的一个很长时期，吕先生的论断都没有引起学者的注意，自然也不会有相应的研究。90年代，我们提出字本位的理论之后，有些学者认为字“大致上相当于语素”（李宇明，1997,20），字本位实质上就是一种语素本位。这种观点见之于文字的还不多，但日常与我交换意见的同志持此意见的却不少。为什么人们会把字混同于语素？可能是“最小”，用语言中“有意义的最小结构单位”这一标准来衡量，它们都是“最小”。根据这种表面的相似性就把字看成为语素，这一方面可能是由于习惯的力量，因“印欧语的眼光”的影响而自觉或不自觉地用印欧语的语法理论来分析汉语，另一方面也是由于字本位理论的创导者和支持者还没有把两者的本质区别说清楚。关于字和语素的原则区别，徐通锵(1994b,8-9)曾从结构的线性和非线性、功能的单纯和复杂、字中可隐含若干个不同的词三个方面进行过分析，虽然涉及到两者的差异，但还没有抓住问题的关键。关键是什么？应该是它们在系统中的不同地位和音义关联的差异。只有弄清楚这些关键问题，我们才有可能确定语言基本结构单位的鉴别标准，并进而据此弄清楚字与语素的原则区别。

语素这个概念产生于本世纪初叶，是布龙菲尔德1926年首先在《语言科学的一套基本原理》中提出来的，指的是“一个最小的形式就是一个语素(morpheme)，它的意义就是义素(sememe)”；“最小的”的实际含义是“一个最小的(minimum)x就是并非全部用更小的x的x所组成的x”。从此之后，语素就成为结构语言学的一个最重要的概念。为什么结构语言学如此看重语素？这扎根于它对语言系统的独特看法：语言的结构可以分为表达(expression)和内容(content)两个方面，语言学只研究表达的方面。语言的表达系统是一种线性结构，高层的结构单位由低层结构单位的线性组合构成。音位是表达系统的最基本的单位，数量有限，一种语言只有几十个音位，但整个表达系统就是以这些有限的单位为基础构成的。语素是表达系统的第二个基本单位，通常由一个或几个音位的组合构成；它是和内容系统相联系的一种表达系统的基本单位，“语言学家把音位和语素作为基本单位来研究就可以建立语言表达系统的完善理论……这通常称为描写语言学”(A.Gleason,1961,1-13)。这就是说，语素只是语言表达系统的一种结构单位，虽然它与内容系统有联系，但研究的时候不必涉及内容，以便有效地说明“语素由音位的组合构成”的原理和语言结构的二层性。这是结构语言学的方法论基础，如强调词，由于它不是“最小的”，就无法用“组成”说来解释非“最小的”词如何由音位的组合构成的结构关系。“语素由音位的组合构成”的“组成”说是不能成立的，已有很多学者进行过批评（霍盖特，1961；帕默，1971,133），这里不赘。结构语言学为什么不研究内容？格里森列举了三点原因：第一，语言学家对语言两面性的真正意义认识太晚，因为表达系统的有成效的研究使语言学家比较关注语音的分析，而忽视内容的研究；第二，缺乏精确的、严格的方法；第三，内容系统太复杂，本质上是人类经验的全部总和，难以进行全面的研究。这里虽然已经感到不研究内容的遗憾，但结构语言学的线性结构理论无法解决表达与内容的相互关系问题。这是方法论的局限的一种具体表现。

语言是现实的编码体系，是人类最重要的交际工具，它的本质是一种非线性结构，线性只是其中的一种局部情况，因而适合用结构关联的概念来分析它的结构（徐通锵，1991）。着眼于线性，利用“最小”把字等同于语素，这是观察视角的一种误差。“字”的实质是非线性的，它着眼于音义的结合，是一种表达与内容相统一的结构单位。如果说得绝对一点，也可以说它是内容系统的结构单位，因为它有顽强的表义性，语义是它的核心。汉字和汉语的关系、汉语研究的传统、借字的意译化改造、变音（如儿化之类）的语义基础等等都可以清楚地说明这方面的问题。文字必需适应它所记录的语言的结构特点。独立形成的文字体系都与它所记录的语言的结构特点有密切的联系。汉字在它的发展中始终坚持它的表义的方向，没有通过假借而走上拼音化的道路，就是由于它适合汉语结构单位“字”的顽强表义性要求。汉语的研究传统俗称小学，以字的研究为基础，分文字、音韵、训诂，其核心就是语义。我国最早出现的四本语文学著作《尔雅》《方言》《说文解字》和《释名》就是从不同的侧面研究字的语义（杨树达，1941）。如果说，印欧语的研究传统主要是语法，亚里斯多德的语法理论、特勒克斯(D.Thrax)的《希腊语语法》对后来的语言研究产生了巨大的影响，那么可以说汉语的研究传统主要是语义，我们从来没有离开过以字为基础的语义研究轨道。千百年来形成的研究传统是对语言结构性质的最好说明。借字的意译化改造是人们熟知的事实（徐通锵，1994b,3-4），这里不赘。儿化之类的变音也是以字的语义为基础的，只有那些语义上能具体地名物化、且能寄托语言社团某种感情色彩的字才能进行儿化之类的变音（如刀儿、玩儿、蔫儿等等），而不是以名词、动词、形容词的划分为根据。字就是字，它的核心是语义，是构成内容系统的基础，与语素不是一种性质的东西，相互没有可比性，不能给字戴上语素的帽子。

字与语素尽管都是各自语言里的一种结构单位，但在系统中的地位却有原则的差异。字是汉语的基本结构单位，但语素不是印欧语的基本结构单位。这就涉及到确定基本结构单位的客观标准问题。语言非线性结构的基础是音义结合的统一体，它的各级结构单位都是音义结合的产物；音位只是语音层面的结构单位，不能与语言结构单位相提并论。结构语言学以“语素由音位的组合构成”的方法论为基础把语言看成为一种线性的二层结构，在理论上是说不通的。音义结合的结构单位在语言中有好几个，分属于不同的层级，像印欧语就有语素、词、词组、句子等。哪一个是“最基本”的？这不决定于线性组合的大小，而决定于音义结合的关联，看关联点选择在哪儿；只有成为音义关联点的结构单位才有资格成为一种语言的基本结构单位。语言是现实的编码体系，把现实转化为语言的“码”的最基本的思维单位是概念，所谓音义结合关联点的“义”应该是和概念相对应的语义，具有相对的独立性，即能单说，而且说出来人们就能知道它的所指。为行文方便，不妨直接称为概念。从传统语文学到洪保特、索绪尔的语言理论，在这一点上从来没有发生过疑议。根据这一标准，音义结合的关联点，汉语是字，印欧语是词，因而它们是各自语言中的最基本的结构单位。这种结构单位具有如下的特点：一、现成的（吕叔湘，1963,45），拿来就能用；二、离散的，很容易和它相邻的结构单位区别开来；三、在语言社团中具有心理现实性，即使是文盲，也能知道一句话中有几个结构单位，例如说汉语的人知道一个句子有几个字，说印欧语的人知道一个句子有几个词。语素是印欧语的最小结构单位，但不是基本结构单位，因为它一不是“现成”的，需要语言学家去寻找，而且找起来很困难，成为印欧语研究的一个难点；二不是离散的，同一个语素在不同的词中的语音分界线不一定相同；三是在语言社团中没有心理现实性，没有受过专门训练的人是意识不到语素的存在的，更谈不上从句中找出语素来。现在一般讲语言基本结构单位的时候由于着眼于语言结构的线性性质，因而常常强调“最小”，其实“最小”不一定是基本结构单位的最重要的特点，如语素，它虽然“最小”，但不具备基本结构单位的三大特征。它是到本世纪初才被人们认识的，并被看成为语言的一种结构单位。这不是历史上各个时代的语言学家的无知或失误，而是语言结构单位的性质所使然。一种语言的基本结构单位的确定必须着眼于音义关联的基点和由此而形成的现成、离散、心理*

实性三大特点，不然就无法对语言进行有效的研究。

前面的分析表明，字与语素是两种不同性质的语言现象，相互没有可比性，混淆两者的差异或张冠李戴必然会影响汉语研究的发展方向。

二语音感知方式、感知单位的特殊性和字的特征

音义结合的关联点或音义关联的基点，这是一种语言的结构基础和枢纽；不同语言的关联基点的差异隐含着语言结构的原则区别。语言研究必需抓住这种音义关联的基点，抓住了它就等于抓住了控制结构全局的枢纽，就有可能把握住语言结构的脉络和正确的研究方向。印欧语研究历来都以词为基本结构单位，把它纳入封闭性的主谓结构框架进行研究，建立主语、谓语这些句法结构成分与名、动、形的词类划分的结构关联（徐通锵，1997,91-106）。这抓住了关键，因而取得了重大的成就，并对世界其它地区的语言研究产生了深远的影响。现在需要进一步讨论的是，不同语言的音义关联的基点为什么会不一样？它对语言结构有什么影响？我们从这种差异中能得到一些什么启示？要探究这些问题，就必然会涉及到语言编码机制以及其它的一些深层次问题。

汉语体现音义关联基点的结构单位是字，它的特点是“1个字·1个音节·1个概念”的一一对应，就是一个音节可以包装一个概念。印欧语体现音义关联基点的结构单位是词，如果仿效汉语的结构格式，它的特点就是“1个词·n个音节·1个概念”。字和词都是各自语言的基本结构单位，因而比较这两个公式，唯一的差异就是音节的多少，即汉语和概念相联系的音节是1，而印欧语是n(n=1,2,3……)。这个简单的差异隐含着两个语言社团的语音感知方式、感知单位和两种语言的编码机制、结构模式等的一系列原则差别。这是引导我们深入观察语言结构奥秘的一个很好的向导。

汉语和概念相联系的语音形式是音节。它是一种非线性结构，是一个以"1"为特征的层级体系（徐通锵，1991,253;1997,127-134）。它一分为二，先分出声母和韵母；韵母再细分为头、腹、尾。韵母的细分是专家的研究成果，汉语社团的一般成员不会意识到这种微细的差异。这就是说，汉语社团能直接感知到的最小语音单位是声和韵，双声、叠韵的联绵字结构和汉语的诗歌押韵传统就是这种语音感知单位的最好注释。声和韵，或者粗略地说声母和韵母（韵和韵母是两个不同的概念，这里不细究），用现代音素分析的语音学来看，是两个模糊的概念，因为其中能容纳几个音素有很大的弹性。韵或韵母中的音素可以是1，是2，是3，这是人们熟知的事实，不必重复；声母的位置也可以容纳几个不同的音素，上古的复辅音和汉藏系语言的前置辅音就是这种弹性或模糊性的具体表现。比较麻烦的还有一个介音。介音的特点是“介”，它不属于声，也不属于韵，或者既属于声，又属于韵。传统反切的处理办法是声、韵两属，使上下字和谐地相切（赵元任，1940；李荣，1952），而根据现代音系学的响度顺序原则（石毓智，1995），它应归属于声。这就是说，汉语社团的语音感知方式是声、韵的对立二分，最小的语音感知单位是声母和韵母，不是音素；字音中的韵腹、韵尾与声母，或前置辅音与韵母，都不处于同一个层次上，说明它是一种非线性的结构，而不是音素的线性组合。这种声、韵二分的拼合机制所透视的最重要的信息就是"2"和"1"的矛盾运动，即"1"可以分为"2"，而"2"也可以合为"1"。孤立地考察字音中的声母和韵母，人们难以捕捉这种矛盾运动的线索，如果联系汉语社团的两点论的思维方式（徐通锵，1997,38-52）、音义的相互转化机制、文字与语言的关系等来分析（参看后面的分析），就会发现这种矛盾运动具有系统的性质，是把握汉语结构的关键。这种声与韵的合二而一的拼合机制使汉语的音节具有很强的内聚力，而和语流中的其它相邻的音节则保持着很强的离散力，彼此界限分明。音节是汉语中一种自足的编码单位，一个音节就可以表达一个概念，编出一个“码”，形成“1个字·1个音节·1个概念”这样一一对应的结构格局。

和汉语相反，印欧语体现音义关联点的词在语音上有n个音节，就是说，音节不是印欧语的自足的编码单位。印欧语的结构单位，语素、词、词组、句子，没有一个单位是和音节有强制性的对应关系的。如一个词有若干个音节，而语素呢，它的语音可以是一个音节，也可以不到一个音节，也可以是几个音节，总之，音节在印欧语的结构中没有如汉语音节那样的表义作用，而是一种与表义无关的纯粹的语音结构单位。青年语法学派和布龙菲尔德关于音变是一种纯语音过程的论断看来是有它的语言结构基础的依据的。为什么会形成这种差异？这是由于印欧语社团的语音感知方式、感知单位与汉语社团不一样。它的感知单位不是声和韵，而是音素；感知方式不是音节的声、韵对立二分，而是以元音为核心的音素的多分线性组合，依据出现的先后次序一个一个地拼读出来，每一个音素都占有和其它音素相同的发音时间。这种语音感知方式、感知单位给语音结构带来的明显影响就是：音节仅仅是一种语音结构单位，不是特定语言结构单位的语音形式，因而造成语流中的音节界限不清，甚至词与词之间的语音界限也可以消失。例如，a name的读音与an aim相同。印欧语为什么需要研究音渡或音连(juncture)？原因也就在这里。和汉语的音节相比，它缺乏内聚力和离散性的特点，而外连的拼合能力却很强，只要前一音节的末尾是辅音，后一音节的开头是元音，就可以打破音节之间的界限，以这个元音为中心，使其前后的辅音凝聚在它的周围。如：a pear and an apple读起来好像是apea(r)-ran-da-na-pple。为什么会形成这种特点？就是由于它不是表义的语音单位，语义对它没有强制性的制约作用。这是以音素为语音感知单位的语言的一种重要的语音特点。文字是记录语言的书写符号系统，必需适合它所记录的语言的结构特点。印欧系语言的拼音文字就是和音素这种感知单位相适应的书写符号系统，一个字母记录一个音素，然后把它们一个一个地拼起来，“拼”到能表达一个概念才算拼到了头，然后留出一个空格，再开始第二个词的拼写。索绪尔(1916,51)早就清楚地意识到这一点，认为表音文字体系的“目的是要把词中一连串连续的音模写出来”，并且强调“我们的研究将只限于表音体系，特别是只限于今天使用的以希腊字母为原始型的体系”，而不涉及汉字的表义体系。这清楚地表明，语音感知单位的差异和音义关联方式的不同使汉语和印欧语的语音组合方式呈现出各自不同的特点，“汉语中元、辅音本身不明显，最清晰的单位是音节。*

音和元音不是慢慢地拼合，而仿佛是一个共生的板块，一团一团地往外扔，与英语作比较，就更加明显：sway与‘岁’、why与‘外’、lie与‘来’等”（潘文国，1997,154）。这一观察是比较符合两种语言的实际状况的。

前面的分析说明，不同语言的音义关联点的差异扎根于语言社团的语音感知单位、感知方式的差异，并由此造成语言基本结构单位的差异。音节如与概念性意义具有强制性的一一对应关系，它就是表义的语音单位，具有自足的编码功能，由此而形成的语言基本结构单位的特点就是“1个结构单位·1个音节·1个概念”。汉语的字就是这种类型的结构单位的典型代表。字的特点是形、音、义三位一体，或者换一句话说，是最小的书写单位（方块汉字）、最小的听觉单位（音节）、最小的结构单位（字）三位一体，如果说得更简洁一点，就是写、听、说三位一体。这是字的最重要的特点。印欧系语言由于音节与概念性意义没有强制性的对应关系，不是表义的语音单位，因而就没有这种三位一体的特点，而是三者相互分离：书写单位是字母，听觉单位是音节，基本结构单位是词。形、音、义三者关系的这种差异形成不同语言的音义关联点的差异，使一种语言的基本结构单位具有自己独特的特点，并给语言结构的差异、文字体系的差异和文字的发展方向带来了决定性的影响。汉字的表义体系不是“表义——意音——表音”文字发展三阶段的一个阶段，而是和表音一样，代表文字发展的一个方向（何丹，1996,1997）。它和印欧语文字的表音体系都各有自己语言结构的基础，各自适合语言的结构特点。

有人可能会就我们的“三位一体”说提出质疑，认为形、音、义三位一体指的是书写的方块汉字，不是语言的结构单位；语言的结构单位是不管“形”的，语言和文字在语言研究中应该严格地加以区别，不要受文字的干扰。我们在这里想说明两点。第一，字首先是说的，用书写形体写下来的方块字是第二性的，只是把口说的字书面化而已。比方说，要人家说话说得慢一点，只能说“请你一个字一个字慢慢说”，绝不会是“你一个词一个词慢慢说”。这一点，无论是山村老妇，还是语言学的泰斗，都得这么说，概莫能外。这就是说，字是汉语社团中具有心理现实性的结构单位，是用来“说”的，在文字发明以前，汉语社团就是用字说话的。现在有点本末倒置，把写的字绝对化，认为字只是用来“看”的，与“说”无关。否！字的所指模糊，或者说，所指多义，“既可以指口说的音节，又可以指它的书写形体，还可以兼指两者”（赵元任，1975,241），《文心雕龙》的“夫人之立言，因字而生句”的“字”则是指音义结合的语言结构单位（吕叔湘，1963,40）。这种“模糊”或“多义”实际上就是从不同的角度去观察“三位一体”的字而形成的结论。徐通锵(1994,1-3)曾就这个问题进行过专门的讨论，由于人们的习见太深，往往把字绝对化为一种书写形体，因而我们不得不在这里再强调一次。“三位一体”的字即使排除了“形”，留下来的音与义和口说的字是一致的，音义二位一体。这里的具体问题我们后面再讨论。第二，语言研究应该充分利用文字所提供的线索，不要把两者对立起来。自结构语言学诞生以来，普遍流行着一种说法，认为语言学的研究对象是口语，任务是描写，应该排除文字的干扰。这种说法虽有其合理的一面，但在实践中把它绝对化了，甚至陷入了自欺欺人的境地。谁都知道，在有文字的社会中，没有一种语言研究是不利用文字所提供的线索的，因为文字（特别是那些独立形成的文字体系）需要适应它所记录的语言的结构特点。没有文字的社会是不会有这种“学”那种“学”的，其中自然包括语言学；如果说有语言学，那也是有文字的社会的学者们建立起来的，美国描写语言学对印地安语的研究和我国学者对某些无文字的少数民族语言的研究就是这方面的例证。我们现在所知道的语言研究，无论是希腊－罗马或印度的语法研究，还是我国传统的小学，都是根据文字提供的线索对书面语进行详尽研究的结果。现代的结构语言学虽然标榜口语的描写，但除了那些无文字的印地安语的研究以外，排除文字干扰的语言*

究实际上也只是一种假象，因为语言学家都在自觉或不自觉地利用文字所提供的线索，即使是音渡或音连(juncture)，也得比较诸如a name和an aim之类现象的异同才能进行相应的研究。现代计算机科学的发展也为语言与文字的紧密联系提供了新的证据，没有文字的科学处理，人类无法一步登天，直接进入人机对话的时代。语言研究应该充分利用文字所提供的线索。

语言社团语音感知方式、感知单位的差异给语言结构会带来如此重大的影响，这是一个值得深思的问题。现在可以追问：汉语社团和印欧语社团为什么会选择不同的语音感知单位？音义结合的关联点为什么会呈现出如此重大的差异？音节在两种语言的音系结构中的地位为什么有那么大的区别？回答是：汉语和印欧语的基础性编码机制有异，即汉语是以理据性为基础，而印欧语是约定性。情况大致是：音节如果与概念形成一对一的对应关系，是表义的语音单位，语言的基础性编码机制以理据性为准，反之，就以约定性为基础。汉语和印欧语就是这两种编码机制的典型代表。自索绪尔创导语言符号的任意性学说以来，语言基本结构单位的音义关系已有既定的模式，都认为是任意性或约定性；理据性或可论证性只是以此为基础而派生出来的第二性现象。在汉语的研究中人们还捧出我们的老祖宗荀子的“约定俗成”说，认为我们早于索绪尔二千多年就已有语言符号的约定性理论。这些都把复杂的问题简单化了。徐通锵(1997，28-38；265-294)曾从语言与文字的关系、汉语独特的研究传统、“约定俗成”说在荀子正名说中的地位和实际含义以及汉语字族的结构等方面进行过具体的讨论，这里不赘，只想就理据性问题再说几句。理据，一般都认为是概念得名的理由，讨论语言基本结构单位的音义可论证性联系，这自然不错，但理解似乎偏于狭窄。其实，理据的实质是语言与现实的关系，讲语言如何接受现实规则的投射而形成自己的规则。这就是说，理据是语言规则的语义基础，研究规则的成因，任何语言的研究都在研究它自己特有的理据。一种语言的基础性理据在哪一个层次，哪一个层次就会成为该语言的研究重点。汉语基础性编码的理据存在于字（符号）中，因而字就成为汉语传统研究的重点，形成文字、音韵和训诂三大部门，分别研究三位一体的字的形、音、义三个方面。印欧系语言的基础性编码理据表现为符号和符号的组合，即语素与语素的组合、词与词的组合之类，因而构词法和造句法就成为研究的重点。两种语言为什么会形成各自不同的研究传统？就是由于基础性的理据存在于不同的层次，汉语是符号（字），而印欧语是符号的组合，而这种差异的成因则可以追溯到不同语言社团的语音感知方式、感知单位的差异和音义关联点的差异。“失之毫厘，谬以千里”，语音感知方式、感知单位的初始的“失之毫厘”的小差异必然会导致不同语言结构的“谬以千里”的大区别。

三音、义的相互转化和字的生成机制

不同语言社团的语音感知方式、感知单位的差异和语言的音义关联点的差异，必然会给结构单位的生成机制带来重大的影响。这里所谓的“生成机制”就是现在一般语法书所说的构成新词的方法，即构词法。汉语构词法的研究大体上都是根据印欧语语法理论的模型建立起来的，并不适用于汉语的结构。为什么？印欧语的构词法是一种线性的构词方法，讲如何以词根为基础加上前、后缀而构成新词以及词干如何加词尾而使一个词发生不同的形态变化。这是由其特定的音义关联方式和编码机制决定的构词与变词的方法，不讲音、义之间的关系，音节在这种构词法中没有任何地位。汉语没有词（吕叔湘，1963,45；赵元任，1975,246），它的基本结构单位或“中心主题”是字，是一个音节表达一个意义，是一种非线性结构，很难以线性的原则为基础进行相关的分析。因此，要想弄清楚字的性质和特点，我们还需要根据它本身的固有特点，即音、义的关系来研究它的生成机制、运转机制以及它的演化轨迹。

前面说字是形、音、义三位一体的单位，这个说法不错，但显然过于笼统，难以说明它的生成机制和运转原理。“三位一体”中的“形”属于书写的范畴，只能作为辅助的标准，重点应该研究音与义的关系，因为它们都是纯语言的问题，音、义一体，相互间有理据性联系。所以，字的生成机制和运转原理的实质就是要弄清楚字中音、义的关系以及它与语言基本结构单位的形成、演化的关系。它在语言结构中的地位相当于印欧语的构词法，不过它是一种非线性的结构，无法用印欧语构词法的线性原则来分析，而应该联系语言社团的思维方式的特点对音、义的关系进行非线性结构的分析。自然，我们这里限于篇幅，无法就这种机制和运转原理展开全面讨论，但可以清理出一个简单的线索。这种线索大体上可以通过以下的几个阶段或时期来认识：

一、音、义一体时期，它的文字表现形式大体上就是以象形、指事、会意等为特点的书写形式，体现语言社团对字的理据性的认识；

二、音、义相互转化的时期，它的文字表现形式就是形声字。这是承前启后的一个关键时期，既坚持字的理据性，又为非线性理据性向线性理据性的转移开辟前进的道路；

三、由于理据性向线性的方向转移，从而形成不同类型的字组，使汉语基本结构单位的生成和运转进入一个新的时期。

文字的产生比较晚，但这种土生土长的文字体系完全适合它所记录的语言结构的特点，因而可以利用文字发展的线索推断语言的某些生成机制，从文字看语言。上述几个时期的划分就是参照文字的发展作出的。不过这只是一个大致的划分，以便认识每一时期的理据性问题的主要特征。音、义一体时期，理据性的重要特征是字中音与义之间存在着可论证性的关系，是汉语社团根据临摹性原则(iconicity)直接接受现实规则的投射，因而可以说出概念得名的因由。《释名》的目的就是要说明字中音、义的理据性联系，但是由于语言的发展，音与义都发生了重大的变化，就一个个单字来说，《释名》已无法实现它想“论叙指归”“百姓日称而不知其所以之意”的音义理据性联系的目标，因而一些解释陷入主观，以致后人对它的批评多于褒扬。但这不能成为否定字的理据性的根据，因为汉语与汉字的关系和汉语特有的研究传统，如果离开这种理据性，我们就得不到合理的解释（徐通锵，1997,28-38）。联绵字是汉语早期编码机制中的一种重要现象，是音、义一体的活化石，因为“夫双声、叠韵之字，其义即存乎声，求诸其声则得，求诸其文则惑矣”（王念孙：《广雅疏证》卷六上“犹豫”条）。语言是一种组织严密的体系，基础性的编码机制是统一的，联绵字“其义即存乎声”的编码机制可以成为音、义一体的字的理据性的一个有说服力的注释。至于联绵字为什么是两个音节，形成“2个字·2个音节·1个概念”的结构，和字的单音节结构有异？那是由于联绵字的主要任务是摹声和摹形，声和形不像日、月、人这些现象那样，有具体的物可以作为摹写的凭据，因而只能增加一个音节，使其尽可能与所摹写的对象一致，所以王力(1944,384-392)干脆称它们为拟声法和绘景法。各种迹象显示，字的生成机制就在于它的理据性，基本上是一个音节表达一个意义，编成一个“码”，联绵字的结构只是这种基本结构方式的一种变体。这里还要附带说一句，就是理据的表现形式要受制于语言系统的结构，不同的语言即使是面对由相同现实而形成的理据，它们也会有不同的表现形式。这只要比较一下不同语言的拟声词的结构，就不难得出相应的结论，例如英语的拟声词是决不会“拟”出汉语那样的联绵字的结构的。人们不必为承认语言编码的理据性而担心会否定语言结构的多样性和丰富性，因为不同语言社团的不同的语音感知方式、感知单位和不同语言的不同音义关联方式不允许出现类同的语言结构。

根据临摹性原则，音、义一体，生成有理据性的字，这种编码方式自然有其严重的局限性，因为现实中有很多现象比较“虚”，难以找到临摹的标杆；如果死守这一原则，语言中字的数量就会受到限制，无法满足日益增长的交际需要。借助于转注和假借，从义和音两个角度扩大一个字的运用范围，但仍有其局限。转注是“一字具数字之用”，会“愈转而愈远”（朱骏声《说文通训定声》），相当于现在一般所说的多义字；“转”虽然仍旧维持着音与义之间的理据性或可论证性联系，但其范围终究会受到本义的限制，不能无限制地转下去。假借的方法论基础是音义结合的任意性或约定性，与汉语社团的理据性编码原则矛盾。它可以因交际的需要而使用一个时期，但无法改变和代替汉语社团的理据性编码机制，因而最终被放弃，改用形声字，重新走上理据性的道路。由于形声的体系适合汉语理据性的结构特点，因而它一经形成就获得了强大的生命力，一直沿用到现在。形声字所透视的汉语最重要的生成机制和运转机制就是声与义在一定条件下的相互转化，即“声”由义转，“义”由声生，以“声”为核心，形成汉语的一种特殊的向心性字族；字族中每一个字声义一体，维持字的理据性。这种转化的机制是汉语社团两点论的思维方式在字的生成和运转中的具体体现（徐通锵，1997,38-52,265-294）。

以“声”为核心的一族字，声同义近或声近义通，写出来每个字不一样，但说或听起来相互间并没有多少差别，好像是同一个字。例如“吕”声的字族，据杨树达(1934,44-45)的系联研究，有如下几个字：脊骨谓之吕、伴谓之侣、二十五家相群侣谓之闾、军五百人谓之旅、屋楣谓之梠、缝衣使相连谓之絽、禾四秉谓之稆、木之叶密布者谓之榈、屋上杄谓之栌，除旅、栌二字暂不考虑外，其它几个字都是“吕”声，如不管“形”，听起来就是一个字。语言是说和听的，原来形、音、义三位一体或说、听、写三位一体的字在这时候出现了一些矛盾，过多的同音字势必会干扰交际的顺利进行。语言是一种自组织系统，会对这种矛盾作出自发的调整。调整的办法就是增加字的长度，找一个意义相关的字与之组合，使之成为双音字，例如律吕、伴侣、情侣、僧侣、尾闾、闾里、闾巷、棕榈等，或者另造字组，如缝衣代替不常用的絽，这样就可以使原来音同、音近而书写有异的字区别开来。这一调整对汉语的发展产生了重大的影响，使“1个字·1个音节·1个概念”的基本结构格局受到了严重的冲击，形成大量“2个字·2个音节·1个概念”的结构单位。语言的结构格局是很稳固的，它可以改变它的表现形态，但很难改变它的结构原理。随着双音字的大量产生，音、义之间的关系也就出现了新的表现形式，这就是以字义为核心而产生诸如儿化之类的一分为二和合二而一的变音（徐通锵，1997,400-410）。其次，字的理据性也增加了一种新的表现形式，出现了字义线性组合的理据。这种理据的新形式是以字的非线性理据为基础的，是声、义一体经过声、义相互转化而形成的，因而不能破坏字的“三位一体”的理据性原则，不能因字的“声同”而写成同一个字，或用其它同音字代替。“别字”的概念可能就是因字的理据性表达的需要而产生的。西方语言只有错字，没有别字；别字是汉语的特产，是字的理据性的一种很好的注释，或者说，是从书写上杜绝音义结合任意性的孳生道路。别字的概念始自两汉，是和形声字体系的完善、双音字的产生和发展相呼应的。所以，为克服说、听、写三位一体的一些矛盾而发展起来的双音化过程是汉语发展中的基本结构单位的一次重大的自我调整，使字义线性结构的原则在基本结构单位构成中的比重中渐次增加。

调整结构格局的办法不是从天上掉下来的，而是汉语的结构本来就具备这种调整的机制，这就是联绵字的结构。如前所述，联绵字的结构是“2个字·2个音节·1个概念”，在编码体系中处于次要地位，是基本结构格局“1个字·1个音节·1个概念”的一种变体。联绵字的单个音节不承担意义的表达，只有两个字联成一个整体才能表达一个概念。这种和一个概念相联系的双音节结构为汉语基本结构单位构造原则的调整准备好了结构框架，办法就是用实义字代入联绵字中无意义的字音，使之成为交际所需要的一个结构单位。所以，双音字在其产生之初往往带有联绵字的痕迹，会受到双声、叠韵的限制，而后语音的限制逐渐放松，只要意义上有联系，就可以组合起来构成双音字，使汉语在非线性的音义结合的理据性基础上又逐步向线性组合的理据性转移（徐通锵，1997,348-361）。结构原则的变体在语言发展中的这种重要作用是语言自组织系统的结构原理富有弹性的一种表现，它可以为适应日益增长的交际需要而变动常体、变体在系统中的地位，使之灵活有效。不同的语言在发展中都有这一类灵活变动的调整。英语动词过去时的表现形式是在动词词干后面加-ed，而take～took之类的现在时和过去时的转换形式则是一种例外。但在古英语中情况正好相反，take～took之类的ablaut（元音变换）是时的变化的主要规则，而加-ed则是次要的例外形式。语言会根据交际需要而灵活调整各种表达手段在结构中的地位和比重，英语过去时表达形式的演变和汉语联绵字的“2个字·2个音节·1个概念”的结构格式成为基本结构单位向双音化过渡的桥梁，就是这方面的两种重要的例证。

双音字组（辞）是汉语基本结构单位的一种新形式，它的构造原则是什么样的，传统的汉语研究从来没有碰到过这方面的问题。如何分析，人们就教于印欧语的语法理论，因而就仿效动宾结构、主谓结构等格式来分析双音字的构造原则，结果把汉语统一的语言事实弄得支离破碎，人们难以得其要领。此路为什么走不通？主要是汉语结构单位的生成机制与印欧语有别，应该根据自己的特点进行向心、离心的分析，整理出统一的结构规律（徐通锵，1997,362-390）。

四字的研究和语言理论建设

我们前面从音义关联、语言社团的语音感知方式和感知单位、结构单位的生成机制等方面讨论语言基本结构单位的特点，强调字的结构的特殊性，说明不能用印欧语的语法理论来套汉语的结构，也不能用印欧语的语法单位代替汉语的结构单位来研究汉语。人们可能会就此提出问题：像你这样来研究语言现象的特殊性，那还有没有可能建立人类语言的一般的、普遍适用的理论？回答自然是肯定的，因为在特殊现象的背后隐含有一般的、普遍的特征，只是需要人们去挖掘、去转化，揭示出隐含于特殊现象背后的规律，阐释它的理论价值。这方面最有说服力的一个例证就是汉语音节结构规则所隐含的普遍理论意义。汉语的一个音节可分声、韵、调三部分，我们已讲了一千多年；声调是控制整个音节的一种超音段特征，在我们的语言学著作中也已讲了几十年，但都局限于就汉语论汉语，没有进一步揭示隐含于它背后的普遍理论价值。美国语言学家在这方面比我们强，在汉语音节结构规则中发现了它所具有的普遍理论意义，创立了韵律单位层级说，促成了非线性音系学、生成音系学的发展。据生成音系学的初始人M.Halle告知，他们在各种语言的韵律规则的研究中都发现了辅音在音节首和音节尾的功能不同，因而发现汉语音韵学的音节结构层次说原来是一种普遍的结构模式，其惊人的解释力令许多音系学家震惊（王洪君，1994,310）。这一事实的含义是明确的，就是不同语言的语音感知方式、感知单位可以不一样，但相互之间存在着某种转换的机制，例如印欧语的音素多分线性组合的感知方式可以转化和改造为二分的结构模式进行分析；声调和重音虽有原则的区别，但都可以从非线性层级结构的角度来分析它们与音段的结构关联。这种“转化”就是语言理论建设，不然无法在两种不同结构类型的语言之间建立起语言共性的联系桥梁。所以，要赶上国外语言学的理论水平，我们认为主要不是去追赶人家不断翻新的理论形态，用某一种理论或方法来解释汉语，而是要改进我们的思维方法，从特殊语言现象的研究中去挖掘隐含于它背后的规律，认识它的普遍理论价值。

特殊性和普遍性是一对对立统一的范畴，没有特殊性也就谈不上普遍性。语言的研究应该立足于特殊性，设法从个性中探索共性的规律。词是一种特殊的语言现象，是从印欧语的研究中总结出来的，但它隐含有语言基本结构单位的普遍特征，这就是前面谈到过的现成性、离散性和在语言社团中的心理现实性，人们可以此为基础研究语言线性结构的普遍规律，并为语言非线性结构的研究奠定必要的基础。印欧语研究的成就已为此作了很有说服力的注释。字是汉语的结构单位，具有特殊性，但它同样隐含有语言的共性规律，具有语言基本结构单位的现成性、离散性和心理现实性三大特点。除此之外，我们还可以以此为基础去窥探语言非线性结构的奥秘，具体地说，我们至少可以从中得到三方面的启示：一、语言系统的非线性结构的性质；二、语义在语言系统中的核心地位；三、语义是语句生成的基础。我们如能在这些方面找出语言的共性结构规律，就能对语言理论建设作出重要的贡献。印欧系语言，由于其语言社团的语音感知方式、感知单位和音义关联点的特殊性，它的基础性的编码机制取约定性或任意性原则，因而它的研究偏重于通过符号的组合来弄清楚语言的线性结构，整理出以“主语－谓语”结构为纲的词法和句法。语言的线性结构是表层的，固守线性结构的原则就很难弄清楚音义关联的原则和语法与语义的关系，迈进语言非线性结构的大门。结构语言学无法解释语言各结构层次之间的关系、转换－生成学派诞生以后理论上的激烈震荡等都与此有密切关系。印欧语的研究现已开始探索语言的非线性结构的性质，美国菲尔墨的格语法、雷可夫的生成语义学、切夫的语法理论和英国韩礼德的系统功能语法等都已在这条途径上迈出了重要的一步。但是，印欧语的研究由于线性的语法结构的干扰，至今也还没有找到解决语法与语义的关系的钥匙，难以进窥语言非线性结构的奥秘。语言非线性结构的实质是与理据性相联系的音与义的关系以及以此为基础的语义结构。汉语的字是体现这种结构性质的结构单位，传统的汉语研究也为我们积累了丰富的经验，是研究语言非线性结构的理想的向导。我们前面讨论的是字的特殊性，但始终是围绕着以语义为核心的非线性结构展开的，想从中探索一些带有普遍理论价值的规律；生成的问题涉及到整个语言结构，无法全面展开，只能就本文涉及的范围作一些必要的说明。据我们观察，语言的非线性结构的性质、语义核心和语言的生成机制是语言学当前需要攻克的堡垒，研究的重心已明显地向着这些方面倾斜。印欧语研究要解决这些问题的难度比汉语大，因为它需要克服以主谓结构为框架的表层语法规则的干扰。汉语对这些问题的解决有其自己得天独厚的优越条件，因为字的性质已为此奠定了坚实的基础。

现在有两种思维方法阻碍我们的语言理论研究。一种是就事论事，没有在“论事”的基础上进一步讨论在“事”的背后的规律。另一种就是所谓“印欧语的眼光”，用印欧语的理论来套汉语的结构。这两种思维方法是殊途同归，都看不到汉语结构的特殊性和隐蔽于特殊语言现象背后的普遍理论规律。就当前的研究来说，“印欧语的眼光”影响更大。本文就字的特征进行理论探索，目的是想摸索改进语言理论研究的思维方法的途径，从汉语特殊现象的分析中揭示隐含于它背后的规律。

标签：语音编码论文; 拼音音节论文; 语言表达论文; 书写系统论文; 语言学论文; 音节论文;

语言基本结构单位的识别标准、基本特征及其与语言理论建构的关系_语音编码论文

猜你喜欢