“字料库”背景下汉字字际关系理论探究论文

“字料库”背景下汉字字际关系理论探究

孙建伟

(陕西师范大学 汉学院, 陕西 西安 710062)

[摘 要] 字际关系指在汉字这一封闭区间内,字与字在形、音、义三要素的任何一个或几个维度上呈现出来的关系,它与词际关系、字词关系并立而存。字际关系所指类型众多,依据不同的判别标准可以得出不同的字际关系框架及其关系项。以形体、功能、音读三个参数作为共同的判别标准,且保证关系项及其内在逻辑是均质的,进而得出能够纳入这一体系的字际关系,即异体关系、通假关系、同形关系、分化关系、书写讹误关系。对以上几种汉字关系做进一步分类:从形体入手,分为同字形和不同字形两类;从功能入手,分为同字种和不同字种两类。字际关系整理可在思路上做如下转变:由疑难字考辨为主转向疑难字与常用字二者并重;由字组模式转向字群模式,由对单字形义关系的揭示转向对字群形义理据的挖掘;由平面考察转向立体分析。那些未能纳入该体系的文字关系或属性,比如正俗、通用、繁简、古今等,可与音读、释义、书证等原始信息,连同字际关系考辨的结果,以立体、多维、互动的方式展现出来,而“字料库”便是实现这一目标的重要手段。

[关键词] 字料库;字际关系;词际关系;字词关系;字群;模式

在以大数据、云计算为时代发展特色的今天,汉字的整理可以而且必须借助新的研究思路。在这一背景下,“字料库”作为汉字研究的创新,指“收集实际使用中能够代表特定文字或文字变体的真实出现过的文字书写形态,运用计算机技术建成的具有一定规模的大型电子文字资源库”。[1]要构建科学的“字料库”,其核心环节之一是对目标汉字进行整理。

从存在方式入手,整理对象可细分为“使用状态的汉字”和“储存状态的汉字”两大类。后一类主要指收录于文字、音韵、以及具有训诂性质的语文辞书中的汉字,一般而言,这类汉字大都经过一定程度的整理。不过,由于受编纂者撰作目的、水平、时代以及学术理念等因素的影响,语文辞书中所释的汉字只有经过再次整理,才能在“字料库”中进行标注。与此同时,对“储存状态的汉字”的整理无法替代对“使用状态的汉字”的整理。而不管对哪种类型的汉字进行整理,都需要一套行之有效的操作方案,字际关系理论便是能够进入相关方案的核心方法之一。有鉴于此,本文重点从字与字实际存在的种种关系及便于整理规范的角度入手,构建字际关系的框架,优化其内部要素,并对要素间的边界进行厘析,以利于当下的汉字整理和“字料库”建设。

一、字际关系相关问题研究现状

对汉字字际关系的整理与研究由来已久,早在东汉,许慎即已用“重文”这一术语来处理汉字间的一些关系,用古文、籀文、篆文、奇字、秦刻石、或体、俗字、今文、通人说等用语标明重文的来源等属性。许慎的标注客观上揭示了相关汉字形体间的关系,同时对后世辞书处理文字关系给以重要启示。魏晋时期,社会动荡,文字的使用亦处于颇为混乱的局面,针对此种现象,唐时大兴正字之风,《干禄字书》《五经文字》等多用“俗”“通”“正”等用语处理相关文字之间的关系,而且魏晋至唐也是汉译佛经大量出现的时代。佛经本就难读,翻译佛经则更甚。在这种情况下,专门解释佛经疑难字词、收录佛经特殊用字现象的佛经音义类著作应运而生,比如《玄应音义》《慧琳音义》《可洪音义》《龙龛手鉴》等,多用“正”“俗”“俗作”“古文”“误”“非”等用语处理相关文字之间的关系。到“小学”昌明的有清一代,以段玉裁、王国维为代表的语言文字学大家将汉字字际关系的整理与研究推向了一个高峰。紧承其后的语言文字学大师章太炎、黄侃也对汉字的字际关系,尤其是异体字关系多有探究。在《说文略说》中,黄季刚先生将职能相同的异形字分为“正、同、通、借、讹、变、后、别”[2](PP.13~15)八种类型。新中国成立后,在汉字整理、规范工作的推动下,学者们将汉字字际关系的研究推向了更加科学的高度。综合观之,历代学者对于汉字单种关系的考察非常多,比如通假字、异体字等,韩琳《字际关系研究述评》从“起始、突破、发展”三个阶段,结合学者们的研究,对假借字、古今字、同源字、同义换读字、通用字等术语的产生、发展、演变进行了梳理。[3]对此本文不再赘论,而是着重考察学者们对字际关系体系及相关概念、构成要素等问题的探究。

1.3 统计学分析 采用SPSS 20.00进行统计学分析。计量资料以(±s)表示,两两比较行t检验,计数资料采用%表示,行χ2检验。P<0.05为差异有统计学意义。

相较于汉字间的具体关系,直接对字际关系这一体系进行界定的学者不多,主要有黄德宽、韩琳、罗卫东等。黄德宽和韩琳的观点比较接近,黄德宽先生《关于古代汉字字际关系的确定》一文认为,字际关系指“形、音、义某一方面相关联的一组字之间的关系”[4]。韩琳《字际关系研究述评》一文认为,字际关系指“形、音、义某方面相联系的一组字之间关系”[3]。罗卫东《汉字字际关系的界定与表述析论》认为,字际关系指汉字在历史传承和共时使用的时候造成的字与字之间的各种关系。[5]以上几位学者的共同认识是,字际关系为字与字之间的关系;所不同的是,黄德宽和韩琳从汉字的形、音、义三要素入手来定义字际关系。不过,目前学者在定义字际关系时,并没有明确指出字际关系的逻辑存在。

为进一步提高《右江民族医学院学报》办刊质量,加快审稿速度,缩短稿件刊用周期,提高审稿质量和效率,进一步提升学报的学术影响力,经本刊编委会研究决定,拟组建一支充满活力的青年编委队伍,诚邀在医学相关专业领域内有一定学术影响力和研究成果的青年专家、学者加入青年编委会团队,凡符合以下条件的专家、学者均可报名。

除了对字际关系进行定义外,学者们对隶属于此体系的具体关系也进行了列举。蒋绍愚先生在《古汉语词汇纲要》中,将异体字、同形字、假借字、区别字、同源字放在一起进行讨论。[6](P.185)黄德宽先生《关于古代汉字字际关系的确定》指出,异体字、通假字、同形字、古今字、同源字、繁简字等都是从字际关系的角度提出的。[4]在《字际关系研究述评》一文中,韩琳将假借字、古今字、同形字、异体字、同源字、同义换读字、通用字、分化字纳入同一字际关系体系。[3]罗卫东《汉字字际关系的界定与表述析论》认为,字际关系主要包括异体字、通假字、古今字、繁简字等。[5]显然,上述几位学者对字际关系体系的构成要素存有不同的看法。另外,值得注意的是,罗卫东认为通假字也涉及词际关系。这意味着她注意到了在字际关系之外,还有词际关系这一存在。

汉字与汉字之间的关系即字际关系,其核心是在汉字这个区间内考察目标字群在形体、功能、音读方面的关系。尽管有些汉字的功能与其所记录的词义是一致的,但考察字际关系的重要环节是将汉字的功能与所记录的词的意义进行分离,其理论支撑是汉字与汉语词分属不同的符号系统,汉字是书写符号,属于视觉系统;汉语词是声音符号,属于听觉系统。汉字与汉语词虽有联系,但在本质上二者分属于不同的范畴,其结果是汉字与汉字的关系成为一种独立的存在。

从元素组合的视角看,汉字、词这两个范畴在逻辑上可以形成三种关系,即汉字与汉字的关系、词与词的关系、汉字与词的跨界关系。

二、字际关系的逻辑存在及判定参数

从上文对字际关系研究现状的分析可知,目前学者在考察字际关系时,并没有对与字际关系直接相关的词际关系、字词关系等现象进行剥离。而我们之所以考察这三种关系的分界问题,一方面是为了更加明确地将字际关系这一范畴厘析出来,另一方面也有助于构建更加科学的汉字字际关系体系。

由于人员在跑步机上可以获得指定的运动速度,所以数据采集过程主要利用跑步机,在不同速度下获取到基于脚部IMU的惯性数据。由于人体运动过程中的能量主要集中在15 Hz以下[15],所以采用截止频率为20 Hz的巴特沃斯低通滤波器对惯性数据进行滤波获得去除高频噪声的惯性数据。然后采用基于的峰值检测方法对惯性数据进行单步划的定义如下:

(一)字际关系的逻辑存在

从整体来看,学者们在探究字际关系理论或考察汉字间的具体关系时,常常将异体字、通假字、母字分化字、区别字、同形字、讹误字、同源字、古今字、正俗字、繁简字、同音字、同义字、通用字等术语归置在一起。然而,需要深思的是,上文列举的众多术语是否都属于同一个范畴?是以汉字为区间,还是以汉语词为区间,抑或是关注汉字和汉语词的交互区间?究竟哪些术语可划归同一个体系,哪些又是从不同的角度进行的考察?在考察具体的文字关系时,判定的标准是什么,以什么样的模式进行,整理结果又以何种方式呈现?那些未能纳入同一体系的文字关系或属性,在最终的整理结果中如何处理?下面我们将从字际关系的逻辑存在及判定参数、字际关系理论体系的实指与构成、字际关系的梳理模式与呈现方式等方面,对上述问题做进一步的探究。

也有学者用分系统的方法考察了字际关系体系及其构成要素。李运富先生在《汉字汉语论稿》中,从文字系统和文献系统分别厘析了汉字的字际关系类型。[7](PP.118~136)在文字系统中,有同音字、同义字、同形字、异体字、同源字五种关系;在文献系统中,有本字—本字、本字—借字、借字—借字三种关系。在《汉字学新论》中,李运富先生又从书写、结构、职能三个角度分别考察了汉字的字际关系。[8](P.223)李先生的做法有利于更加深入地勘查汉字在不同层面的属性和独特关系。

汉语词与词之间的关系即词际关系,该关系是从汉语词这个层面来说的。从构成要素论之,词有语音形式的能指,还有语义内容的所指。此外,在通常情况下,词还有书面上的区别符号。虽然它与汉字的三要素有相通的地方,但二者都是独立存在的,所以词际关系与字际关系相并立而存在。

当先导阀口未开启时,阻尼孔R1与R2中无油液流动,主阀芯上下两腔压力相等,主阀芯在复位弹簧的作用下保持关闭。当系统压力增大至使先导阀口开启时,压力油经R1和先导阀口流回油箱。因阻尼孔R1、R2的作用,主阀芯上腔的压力p2小于主阀芯下腔的压力p0,由压差(p0-p2)形成的液压力克服主阀弹簧力使主阀芯向上移动,主阀口开启,实现溢流作用。

汉字与词的跨界关系即字词关系,这是汉语语言学的核心论题之一。该关系主要关注的是汉字与词这两个不同范畴间的联系与区别。二者的联系主要表现在汉字是为记录汉语的词而造的,它对汉语的词有固化作用。王宁先生在《论汉字与汉语的关系》中指出,汉字不但直接参与了汉语造词的过程,而且在区分汉语同音词时是最直接的手段。[9]二者的区别主要表现为汉语词是第一位的,汉字是第二位的;汉字与汉语词并非一一对等,有时表现为一字数词,有时表现为数字一词。此外,汉字虽然因汉语词而生,但汉字又有游离于汉语词而相对独立的特性。

与从汉字的形、音、义三要素入手考察字际关系不同,古今字是从词入手进行考察的,指记录同一个词时先后使用了不同的字,时间在先的称作古字,时间在后的称作今字,合称古今字。从形、音、义的综合视角看,这些字之间,有的是异体关系,有的是通假关系,有的是母字与分化字关系。蒋绍愚先生在谈及古今字与区别字时认为,“古今字”这一提法不够精确,没能揭示出此类字的特点。[6](P.209)事实上,古今字现象所包含的文字关系并不在同一维度上。因此,古今字这种关系无法与异体字等纳入同一字际关系体系。

(二)字际关系判定的参数

上文从逻辑上对汉字、汉语词两个范畴间的关系进行了推衍,但在具体考察字与字、词与词、字与词之间的关系时,则需要有借以衡量或判定的标准。从汉字、词的关系事实入手,形、音、义是三个核心参数。从汉语词论之,其判定参数是词音、词义、词形;从汉字论之,其判定参数是形体、功能、音读。虽然汉语词范畴和汉字范畴都涉及形、音、义,但在具体操作时,我们要辨证地看待两个问题。

泉州东濒台湾海峡,境内河川密布,仅流域面积在100km2以上的溪流就达34条。其中,晋江水系15条,九龙江水系5条,闽江水系9条,单独入海5条。泉州人民的“母亲河”晋江,流域面积5 629km2,河长182km,是福建省第三大河流,多年平均水资源量51.2亿m3,是泉州文明的发祥地和主要供水来源,承担全市80%供水任务。

一方面,繁体字与简体字相依而存,另一方面,繁简关系又处在变动之中。比如“—塵—尘”,相对于“”来说,“塵”是简体字;相对于“尘”来说,“塵”又是繁体字。在工具书、规范字表中,如《汉语大字典》《通用规范汉字表》只列出了“塵—尘”的繁简体关系,即繁简字更多是一个操作概念,是从某一时期社会用字规范的角度定义的,而且这个提法只揭示了字形笔画的多寡。从形体与功能的组合看,大部分繁简字属于形体不同、功能相同的一类,比如“涙—泪”“筆—笔”,本质上属于异体字。但有的“繁体字”原本并没有相对应的简体字,为了书写简便,人们便用同音字替代的方法为其“造”简体字,比如“鬥—斗”“醜—丑”等,这是一种典型的人为规定。综合来看,繁简字关系也无法与异体字等纳入同一字际关系体系。

其二,辨证地看待不同范畴内形、音、义的价值。形、音、义三要素在汉语词范畴和汉字范畴内,呈现出不同的功能序列。就汉字而论,字形和功能为核心要素,字音往往由功能决定,也即在判定字际关系时,读音为伴随参数。

此外,为便于表达不同层面的“字”,我们借用周有光先生提出的“字形”“字种”两个概念[10](P.198),并对其定义如下。字形指书写完成的一个汉字形体,字种指读音、功能都相同的一个或几个字形;前者所指的“字”不跟词挂钩,后者所说的“字”跟词有直接联系。

三、字际关系的实指及相关焦点问题

在认可字际关系是与词际关系、字词关系相并立而存在的前提下,结合字用事实,明确字际关系的实指,进而厘析出专属于某一判别标准的字际关系体系和关系项,并对那些不能纳入同一体系的焦点问题进行讨论。

(一)字际关系的实指

结合上文的分析,我们认为字际关系指在汉字这一封闭区间内,符号与符号之间所形成的关系;从汉字形体、功能、音读三要素的任何一个或几个方面入手,都可得出不同的字际关系框架及其关系项。但在整理汉字时,需要综合考虑形体、功能、音读,因此需要确定出专属于此的字际关系体系和关系项。鉴于音读是一个伴随参数,故而这里重点对形体和功能进行组配,再利用汉字间的具体事实去判别逻辑组合的结果。除了形体相同、功能相同这一无效组合外,有效组合主要有四种。

三是形体不同,功能不同,且形体与形体、功能与功能间多无滋生、分解关系。有时候一些不同的形体有自己的专属职能,但在实际文献中,因音同、音近的缘故,本该用甲字的地方,却使用了乙字,这类现象为通假关系。[13]比如“才—裁”“颁—班”等。

一是形体不同,功能相同。两个或多个形体的写法不同,功能相同,即几个不同的形体具有相同的记词职能,它区别于词范畴内的“同义词”。前者还暗含了一个事实,即几个形体间的读音是相同的。这种组合具体表现为以下两类关系。第一类,两个或多个形体间的笔形演变有规律可循,或不同形体在构意上相通,且后世“字书”多认可这种演变或组合,则其间为异体字关系。[11]比如“冰—氷”“丘—坵”等。第二类,如果某个形体由另一个形体书写变异而来,但与原形体间的关系较远,不易识别,且历代“字书”多不认可这种形变,这类现象为书写讹误。在这类现象中,有时某个字在书写时会讹同另外一个字,比如“援”讹作“授”、“”讹作“劫”、“尽(盡)”讹作“书(書)”、“捭”讹作“”等。这种情况,对其读音没有直接影响。

二是形体相同,功能不同。有些写法相同的形体有各自的功能,但这些功能间没有任何联系,且不同于借“果”去记录“果敢”义这类借字记词现象。从来源上看,这些形体有的本不同形,而是后世书写变得同形。比如“胄”,《汉语大字典》在设置字头时,分列了“胄1”和“胄2”[12](P.2208),“胄1”从肉由声,指帝王或贵族的后代;“胄2”从冃由声,指古代作战时保护士兵头部的帽子。有的字是造字时偶然而成的同形,但它们都有自己的专属职能,其形义关系是可溯源、可解释的。比如“隻”,在一段时期内,既可以表示“擒获”义,又可以表示“一只”义。就音读而论,这类现象不同形体的读音可以相同,也可以不同。其原因在于读音并不是一个决定性因素,甚至不是一个判别要素。

(3)电磁吸附式试验平台设计及制造 本工装主要由下部支撑框架、电永磁吸附式上部装配平台、气动压紧式上部装配平台三部分构成(见图1)。

四是形体不同,功能不同,且形体与形体、功能与功能间多有滋生、分解关系。有的时候,字的某个或某些形体的功能由更早期的一个形体分解而来,而且在大多数情况下,后出形体由较早的形体通过变异、添加或改换构件而成。在文献用字中,这类现象之间一般为母字与分化字的关系。[14]比如“匮—柜(櫃)”“孚—孵”等。在母字分解出新形体的过程中,后出分化字不但继承了母字的功能“基因”,而且也继承其声音“基因”,故而其间在读音上往往相同或相近。

步骤1:初始化,t=0,t为当前迭代次数,N为种群大小。若k≥N,则根据适应度值从小到大选取前N个作为初始值将(xP1,yP1),(xP2,yP2),…,(xPi,yPi),…,(xPN,yPN)赋值给(xW1(t),yW1(t)),…,(xWi(t),yWi(t)),…,(xWN(t),yWN(t)),i的取值为1~N;若k

(二)对相关焦点问题的讨论

字际关系所指众多,为了进一步明确属于形体、功能、音读这一综合判别标准下的关系项,还需要对以下一些焦点问题进行讨论。古今字、正俗字、繁简字、同源字能否与异体字等纳入同一字际关系体系;假借现象是否属于字际关系,如何看待通假与假借的关系;如何区分异体关系与书写讹误现象等。

笔者认为,把字、词间的关系以元素组合的方式进行排列,再根据汉语、汉字的实际情况,有则存之,无则去之。这样既能够避免遗漏,又可以从理论上划清界限,还有助于理清学术史上对于汉语、汉字关系的不同认识,依据其类别分而归之。

对于俗字,张涌泉先生认为,它是“区别于正字而言的一种通俗字体”[15](P.1)。从文字发展的视角看,所谓正俗,呈现为一种变化的态势,此时代为俗字,彼时代或变为正字。比如《慧琳音义》所载“习—”,在“身体受风而致的痛痒”这一用法上,一开始由“习”字承担,佛经中有作“”者,慧琳斥之为俗,然后世该用法上“”为正字。又如“橃—筏”,在船筏义上,早期“橃”为正字,后来“筏”为正字。显然,正俗字是从社会用字规范的角度来说的,它并没有揭示出这类字内在的形义特征。从形、音、义的综合视角看,“习—”为母字与分化字关系,“橃—筏”为异体字关系。由此可知,正俗字内部的文字关系往往不在同一个维度上,无法与异体字等纳入同一字际关系体系。

其一,辨证地看待汉语词和汉字的关系。尽管在早期一个字往往就是一个词,字和词的一致性比较强,但随着双音节词的大量出现,字和词的对应性逐渐发生偏移。其结果是,字的功能和词义的发展间或呈现出非同步化和不一致性。但这并没有改变汉字对汉语词的依附性,所以在考察汉字的功能时,可以通过梳理汉语的词义入手。

讨论同源字之间的关系问题,关键在于对其实质的理解。同源字是同源词的书写形式,从根本上讲是词的同源,而非字的同源。王力先生在《同源字论》中指出,他所谈的同源字就是同源词。[16](P.5)就记录同源词的两个或多个字的相互关系而言,只有在通用的时候,彼此才会发生关系,从汉字使用的既定事实看,这种关系本质上是通假的一种。[17](P.52)进而可知,在字际关系范畴内,同源通用字现象隶属于通假关系一类。

降脂效果的评定标准[5]:(1)显效。TC与TG降低20%以上,HDL-C增加0.26 mmol/L以上。(2)有效。TC与TG降低10%以上,HDL-C增加0.18 mmol/L以上。(3)无效。未达到上述指标者。(4)总有效=显效+有效。

微信用户数量一直处于平稳增长状态,截止2018年3月微信用户数量超过10亿。现在我们对于沟通的理解已经不再是传统意义上的面对面的交流,随着移动互联网的快速发展、各种手机社交软件的不断涌现,其中微信便是其中的佼佼者。随着微信用户的激增,微信公众平台营销也在迅速的展开。与传统推广方式相比,微信公众平台营销是实施现代营销媒体战略的重要组成部分,有着自身的优势。

假借现象是否属于字际关系体系,通假与假借的关系该如何看待?从符号与其功能的对应性看,假借是就同一个字的功能而言的,指某个字除承担其本身的记词职能外,又被借去记录其他用法,其功能得到了扩展,是一种积极的语言文字现象;通假则不然,指两个或两个以上的字各有本用,但在用字写词时不取本字,而是借用一个音同、音近的字来替代,是一种消极的语言文字现象。另外,就文献解读而言,借义往往没有本字,人们无需甚至无从求其本字;在通假情况下,必定要求得本字,才能顺畅地理解文义。[13]此外,通假关系还存在一种“久假不归”的情况,即被借字废弃不用,借字则固定地承担了被借字的某个或全部功能。比如“冲—盅”,在空虚义上,《说文》本作“盅”,但后世文献中借字“冲”通行。在这种情况下,被借字与借字之间仍是通假字关系,借字与借义之间为假借关系。再比如交错义上的“错—逪”、豪杰义上的“豪—”等。综上,假借现象不属于字际关系术语体系,因为字际关系是对至少两个形体来说的,假借只是一个形体的功能而言,与通假有本质的区别。

书写讹误现象与异体字的关系。与书写讹误存在争议的主要是异体关系中的异写现象,因为二者都是由书写造成的,本质上并无二致。对于此种情况,我们的看法是,有轨迹可循且语文类辞书认可的书写变异现象均视作异体关系;相反,轨迹不可循且后世“字书”未予认可的变异现象则视为书写讹误关系。

(1)根据烟台市地下水水质评价结果显示,区内水质总体一般,较差区域的超标因子主要有亚硝酸盐、硝酸盐、氯化物、溶解性总固体(TDS)、总硬度、氨氮、镉、铅、挥发酚等。

总之,综合考察汉字的形体、功能、音读,再用汉字实际情况予以验证,且必须保证要素内部的关系在同一维度上,最终得出能够纳入这一判别标准的字际关系项,即异体关系、通假关系、同形关系、分化关系、书写讹误关系。这几种关系还可以从不同的角度进行分类:从形体入手,可分为同字形的字际关系和不同字形的字际关系两类,同形关系属于同字形的字际关系,其余四种属于不同字形的字际关系;从功能入手,可分为同字种的字际关系和不同字种的字际关系两类,异体关系、书写讹误关系属于同字种的字际关系,其余三种属于不同字种的字际关系。具体来看,异体关系又进一步分为异写关系和异构关系,通假关系可进一步分为同源通用关系和同音借用关系,同形关系主要有造字同形和书写变异同形两种情况,母字与分化字关系可从功能分解的角度分为本用分化、转用分化和借用分化三类。而上文辨析的那些未能纳入此字际关系体系的文字关系或属性,在展示整理结果时,会连同音读、释义、书证等原始属性,标注在基础信息中。

四、字际关系的梳理模式与呈现方式

明确字际关系理论体系的实指与内核是问题的一个方面,问题的另一个方面是如何在整理思路和模式上适时做出转变,将字际关系梳理推向更高的学术水准;如何与“大数据”“云计算”“人工智能”的时代特色相结合,将梳理结果以更加立体、多维的形式展现出来。

(一)字际关系梳理模式的转变

从《说文解字》起,历代“字书”编纂者相继对所收录的汉字的字际关系进行了整理,但是从目前来看,整理力度明显不够。诚如杨宝忠先生所言,古代“字书”呈现出“重编纂而轻考据,重贮存而轻整理”[18](P.633)的特点。其结果是“字书”中沉积了大量的“死字”,这也是近几十年来部分学者将研究重心放在考辨疑难未识字方面的根本原因。不过,随着学术的进一步发展,梳理汉字的字际关系在思路上可适时做出如下转变。

一是由疑难字考辨为主转向疑难字与常用字二者并重。时贤们将“字书”中的繁难字作为重点考辨对象,解决了字际关系中的一批疑难问题。然而,从实际使用情况看,不少疑难字的功能相对简单、使用频率较低,有的疑难字是在文献传抄过程中因笔误造成的,甚至从来没有在实际文本中使用过,从而与其他字或形体的关系较易确定。比如《慧琳音义》卷五十六“拗胵”条下收录的“[19](P.560),高丽本讹同“搪揬”之“揬”,其他“字书”均不载此用法。反倒是一些常见的字,因其功能复杂、使用频率较高,虽已识但往往存在或形义关系不协、或演变轨迹不显、或形体来源不明、或生成理据不清等问题。比如“耗—秏”“斛—”,在这两组字中,后者的生成理据不甚清晰;再比如“村—邨”,“村”的产生动因、替代“邨”的过程等,都需要我们进一步的思考。

二是由字组模式转向字群模式,由对单字形义关系的沟通转向对字群形义理据的揭示。由于受整理理念的影响,传统上对汉字字际关系的梳理大都以字组的模式进行。普遍做法是将目标字与关系字系联为一组,继而指出目标字是某个已识汉字的异体字或讹误字等,比如《汉语大字典·石部》“”下云“‘礣’的讹字”[12](P.2639),或者考订被释字未详或阙失的形、义、音等属性。这样一来,只能孤立地看待字与字之间的关系。但事实上我们可以采用聚合的方式系联出“字群”,进而在字群这一系统内考察目标字的造字和用字等问题。就现有研究看,台湾地区的《异体字字典》是个很好的范例,它将历代“字书”中的汉字进行了聚合。不过,从学理角度论之,《异体字字典》更多是依据“字书”已有的解释,把其中的结论静态地展示出来。而事实上,我们需要在字际关系理论的指导下,以字群为单位,对“字书”中沟通的关系进行再梳理,由对单字形义关系的揭示提升到对字群形义理据的挖掘。

三是由平面考察转向立体分析。整体来看,汉字字际关系梳理的重点是异体字,常见的做法是对单组文字进行认同或别异,再据此整理出字表,比如刘雅芬的《慧琳〈一切经音义〉异体字整理表》[20]、韩小荆的《〈可洪音义〉异体字表》[21](P.339)。然而,异体字内部经常存在层级,这些不同的层级构成“异体字树”。每个“异体字树”可优选出一个代表字,代表字下常由异构字或异写字按形体属性分层布列,而异构字本身时常也会有不同的异写字;有时,看似是同一级别的异写字,在形体关系上却也存在层级性。[11]由此来看,运用立体分级的方法考察异体字,有利于对其形成过程进行描写和分析。比如表示群车声的“轰(轟)、輷、”等,这些形体并非处在同一个层级:“轰(轟)”为《说文》所收形体,从三车会意;“輷”为“轰”之形声别构,书写或讹变为“”“”,又或变异作“”;“”为“轰”之会意别构体,从车从马会意。总之,在考察异体字字群关系、衍生关系、层级关系等的基础上,可以使字际关系的整理模式进一步立体化。

(二)字际关系整理成果的呈现方式

“字书”汉字或文本汉字整理的结果以何种方式呈现,是一维展示还是多维呈现,是静态存放还是互动联结,与文章一开始谈到的“字料库”的深层关系是什么?这是字际关系理论探究的又一个主题。

从汉字呈现方式看,字际关系整理的代表性成果总体上可分为两类。第一类,以单字为字头,其下对字头进行解释。这类以《汉语大字典》为代表,其他如《汉语俗字丛考》《疑难字续考》等。第二类,以某个字为主字头,在其下把相关的汉字类聚在一起,但未能进一步展示主字头与类聚群中诸形体的关系。比如郑贤章《〈随函录〉俗别字谱》在“枯”字下聚合了三个形体[22](P.563),但这些形体跟“枯”是什么关系,形体之间又是什么关系,没能够得到展现。再比如韩小荆《〈可洪音义〉异体字表》在“啀”字下收录了三个不同的形体[21](P.343),亦未能展示其内在关系。由于受编撰目的、体例等因素的影响,上面的两种展现方式都没能很好地把整理的过程和结果展示出来,而学术的发展却需要我们对这些结果进行全方位的展现。比如《慧琳音义》释文中在“应答、酬答”义上沟通了“荅、、畣”几个形体,我们需要展示出相关演变过程:应答义上本作“合”,后来加“曰”旁变作“”;“”书写又作“”;“”手书又或讹作“畣”。[23]

反过来看,“字料库”作为汉字整理与研究的新的思路和方法,并不是简单地把储存状态的汉字和使用状态的汉字录入到数据库中。因为这样的“字料库”仅仅是便利了部分信息的检索,远未达到智能化的效果,对汉字的整理和汉字理论研究的价值也非常有限。实际上,在构建字料库的过程中,“采集字形、识别字形、填充属性”[24]等环节都需要对目标汉字进行整理,比如采集哪些字形,其间有什么样的关系。如果不梳理目标字的字际关系,“字料库”便是一个空壳,既不能全面展示“字书”所释文字的表层属性,如字头、释义、音读、书证、例证、按语等,又无法直观呈现字与字之间的深层关系,如我们所说的字际关系,更谈不上字群内部的联动。举例来看,《慧琳音义》释文中在“遁逃”义上沟通了“遁、遯、、盾”数字,若仅仅是录入《慧琳音义》的相关释文,而不去整理这组文字的字际关系,我们既无法确定慧琳的判断合理与否,也无法直接利用慧琳的结论。

1980年7月,梅宏高考全县第一名、全省第三名竟然差点落榜!追查下来,梅宏的体检表格被错调了。梅宏被补录到了陌生的“南京航空学院”且还是“计算机应用专业”。

总之,借助“字料库”将字际关系的整理结果以立体、多维、互动的方式呈现出来,并对具体字的属性进行多维展示,使字群内部以互动的方式进行联结,既能够推进对汉字字际关系理论与实践的研究,也能够方便学界对相关整理成果的参考和利用。需要说明的是,在“字料库”中如何实现对字际关系整理结果展示的既定目标,将专文予以讨论。

余论

概念内涵与外延的清晰度及概念间分野的清晰度是衡量一个学科发展水平的重要标准之一,学科发展水平越高,对概念的清晰度的要求也就越高。字际关系作为汉字学的重要论题之一,其内涵和外延有很多疑而未定的问题,这就需要我们在梳理相关学术史的基础上,结合汉字事实,为其下一个科学而严谨的定义,并在此基础上确定其内部要素,进而厘清诸要素间的关系,划清字际关系与非字际关系的界限。本文主要从形体、功能、音读入手,对此判别标准下的字际关系理论体系及其关系项进行了厘析与界定。此外,我们尚需要对与字际关系直接相关的词际关系、字词关系进行系统考察。如此,在进行全汉字整理时,我们才能从更加科学的理论视角看待具体的文字事实,进一步提升汉字整理的效度和信度。

[参考文献]

[1]李国英,周晓文.字料库建设的必要性与可行性[J].北京师范大学学报(社会科学版),2009,(5).

[2]黄侃论学杂著[M].北京:中华书局,1964.

[3]韩琳.字际关系研究述评[J].励耘学刊(语言卷),2005,(2).

[4]黄德宽.关于古代汉字字际关系的确定[J].中国文字研究,2003,(1).

[5]罗卫东.汉字字际关系的界定与表述析论[J].语文知识,2008,(2).

[6]蒋绍愚.古汉语词汇纲要[M].北京:商务印书馆,2005.

[7]李运富.汉字汉语论稿[M].北京:学苑出版社,2008.

[8]李运富.汉字学新论[M].北京:北京师范大学出版社,2012.

[9]王宁.论汉字与汉语的关系[J].民俗典籍文字研究,2015,(1).

[10]周有光.语文闲谈(上册)[M].北京:三联书店,1995.

[11]孙建伟.异写字与异构字考论[J].江苏大学学报(社会科学版),2016,(2).

[12]汉语大字典编委会.汉语大字典(第二版)[Z].成都:四川辞书出版社,2010.

[13]孙建伟.假借和通假研究综论[J].宁夏大学学报(人文社会科学版),2015,(2).

[14]孙建伟.汉语分化字的实指、生成模式及制约机制研究[J].内蒙古社会科学(汉文版),2017,(5).

[15]张涌泉.汉语俗字研究(增订本)[M].北京:商务印书馆,2010.

[16]王力.同源字典[M].北京:商务印书馆,1982.

[17]王宁.训诂学原理[M].北京:中国国际广播出版社,1996.

[18]杨宝忠.疑难字考释与研究[M].北京:中华书局,2005.

[19]中华大藏经编辑局.中华大藏经(第五十八册)[Z].北京:中华书局,1993.

[20]刘雅芬.慧琳《一切经音义》异体字研究[D].台北:成功大学,2007.

[21]韩小荆.《可洪音义》研究——以文字为中心[M].成都:巴蜀书社,2009.

[22]郑贤章.《新集藏经音义随函录》研究[M].长沙:湖南师范大学出版社,2007.

[23]孙建伟.慧琳《一切经音义》疑难俗字考辨七则[J].西南交通大学学报(社会科学版),2017,(1).

[24]朱翠萍,等.基于字料库平台的字书整理研究[J].中国出版,2013,(23).

[中图分类号] H02

[文献标识码] A

[文章编号] 1003-5281( 2019) 05-0156-07

[基金项目] 教育部人文社会科学研究项目“基于字料库的《慧琳音义》文字整理与研究”(编号:15XJC740004);国家语委科研项目“清末民国汉字简化研究信息库建设及相关研究”(编号:ZDI125-59);中央高校基本科研业务费专项资金项目“基于佛经音义的‘字料库’理论构建与应用研究”(编号:16SZYB09)。

[收稿日期] 2019-05-20

[作者简介] 孙建伟,男,陕西师范大学汉学院副教授,硕士生导师,博士。

DOI: 10.14137/j.cnki.issn1003-5281.2019.05.023

(责任编辑 李静丽)

标签:;  ;  ;  ;  ;  ;  ;  

“字料库”背景下汉字字际关系理论探究论文
下载Doc文档

猜你喜欢