定量限制是语法分析的出发点之一_数学论文

作为语法分析起点之一的数量性限制，本文主要内容关键词为：语法论文,数量论文,起点论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

一、理论推导体系中大前提的最简性和普遍性

科学理论最基本的特征是建立在演绎法基础上的推导性。（冯胜利2003，金立鑫2007，朱晓农2008）演绎是科学体系的内洽性所必须的。演绎推理的基础其实就是“凡人都要死，苏格拉底是人，所以苏格拉底要死”这样的简单推理。此外，演绎需要大前提。大前提包括“公理”（基本事实）和“公设”（基本假设）。大前提也就是“初始起点”（陆丙甫、曹德和2005），应该具有“最简性”，因为科学体系是个从简单到复杂的推理系统。本文主要讨论公理问题，公设问题将另文讨论。

我们以欧几里德几何学第一条公理为例，其表述是“由任意一点到任意一点可作直线”。这是一个简单得不能再简单的现象，平凡得形同废话。构成这条公理命题的概念“点”和“直线”也都是最简单的概念。“点”是没有面积和体积的，当然是最简单的空间概念。“直线”就是方向保持不变的线条，比起不断改变方向的曲线当然是更简单的。欧几里德几何学其余几条公理也都平凡、简单得形同废话，然而整个欧氏几何学的宏伟理论大厦就是以这些简单公理为起点，加上演绎逻辑的推理而构成的。

美国诗人米雷（E.S.V.Millay 1892-1950）用诗的语言赞叹说，“只有欧氏见过赤裸之美”。我们换个角度说，只有欧氏看到了“赤裸裸的最简单的事实的伟大力量”。

“数学是科学的科学”，数学的理论架构是所有科学的基础和模式。数学公理的特征也是其他科学中公理的应有特征。

语言学也不例外，如石定栩（2011）这样强调：“现代语言学的基本手段之一是建立初始概念。”“初始概念是往往不加论证而直接认定有效的、公理性的东西”。

“不加论证而直接认定”的东西，往往也是最简单的。“简单性”又蕴含着“普遍性”，最简单的也就是最普遍的，因为任何复杂事物、现象都由简单事物、现象构成，或者说任何复杂事物都可以分化、还原为简单的构成单位。

总之，“越简单的，就越普遍”。而普遍性越大，意味着能概括、解释的现象的范围越大，由此建立起来的理论就越强有力。此外，最简起点的确定，是避免各种形式的循环论证的有效保证。因此，选择最简起点，是构建理论体系的关键第一步。下面讨论一些我国语言学界追求最简起点的情况。

二、我国语言学中一些追求最简起点的例子

吴为善（1989）曾注意到“很勇敢、好雨伞、有影响、我也有”等“1+2”结构前面的单音节上声都变为半上，而“也许有、展览馆、领导我、旅馆少”这类“2+1”结构中单音节前一音节（也就是第二个音节）的上声则变为阳平。由此得出“1+2”结构比“2+1”结构松散的结论。这里，所观察的“1+2”和“2+1”结构分别包括了各种结构类型，即抽象掉了具体的句法关系，反映了对最简起点的追求。

柯航（2007）在吴为善（1989）的基础上，进一步用更简单、没有任何语法关系的数字串的连读变调来证明上述现象。如“599”和“559”两个数字串，虽然没有内部语法结构，但是由于人类的认知趋向于把相同事物组合在一起，会下意识地把两串数字分别念作“1+2”节奏的“5+99”和“2+1”节奏的“55+9”。“5+99”中的数字“5”变半上而“55+9”中的第二个“5”都会变调成阳平。这样就进一步证明了“1+2”和“2+1”节律组合内部的松紧差别。

冯胜利（1998）为了证明“自然音步”的节律，用没有内部语义和语法结构的音译词“加利福尼亚”为例。由于排除了内部语义和语法结构的干扰，可以认定为最简结构。在没有语义、语法干扰的情况下所表现出来的“2+3”（加利+福尼亚）节律，就反映了自然音步的节律。

端木三（2007）用“信息重音原则”（信息量大的词比其他词读得重）来概括种种重音规律。由于信息量是个超越种种具体语义、语法范畴的更基本的概念，也反映了对最简起点的追求。

沈家煊（2010）提出“虚实像似”，用“虚、实”的区分来统一说明种种节律跟句法之间的互动现象。当然，他所说的“虚、实”超越了传统的虚词、实词界限，认为同是实词，里面的虚实程度也不同，如动词比名词虚，因此可以解释动词通常比名词短小这一常见现象。

上述这些理论起点的设立，都建立在比“词类、句子成分”的语法范畴更初始的“信息量、轻重、松紧、虚实”等概念上，或者用这些比语法范畴更基本的概念去说明语法现象，都反映了寻找更简单起点的思路。

这些理论起点，都跟语音节律有关。语音是语言的物理基础和形式基础，这种从语音入手的处理方法都很容易理解。但是，在句法内部，我们是否也能找到一个初始起点呢？本文下面将探讨这个问题。

三、语法学中可作为起点公理的最基本现象

我们现在来讨论什么是句法中最普遍的而且可看成起点的现象。语言交际过程是个“编码、解码”的过程。首先，解码者（听话者、阅读者）的立场比编码者（说话者、书写者）的立场具有更大普遍性，因为一个编码者必须同时是解码者：他必须同时监听、监阅自己所编码的内容，而解码者基本上不可能同时是个编码者。因此，解码者的立场具有更普遍的意义。

而解码的基本过程是一个“组块”的过程（陆丙甫1986），即把能够组合成一个个结构体的成分组合起来，不能组合的单位就暂时当作一个个离散的单位放在短时记忆中。请看图示（数字表示听到该处时脑子中要记住的块数）：

①人类自然语言的理解是一个组块过程。

　1 2 1

11 2

34 1

在这种边接受信息边组块的过程中，脑子中要记住的离散板块或高或低地不断变化着。虽然组块的许多具体细节还有待于深入研究，但是这个过程中离散块数不会超过“7”块左右（7±2）是很明显的基本事实。（Miller 1956b）

“语言结构受短时记忆的限制”，这就是人类语言中的最简单而普遍的结构共性现象。这可以作为我们分析语言结构的起点。下面我们来讨论，从短时记忆对语言结构的限制这一平凡而又普遍的现象中，我们能推导出多少重要的跟语言学密切相关的内容。

四、从短时记忆限制到“核心”概念

既然语言解码过程中从起点到任何一个时刻的言语片段中含有的离散板块都不会超过7块左右，那么，任何一个句法结构体（包括短语、句子）也都不会超过7块左右，即不能超过7个左右的结构成分，因为句法结构体属于“从起点到任何一个时刻的言语片段”。

“从起点到任何一个时刻的言语片段”包括成结构体的言语片段和不成结构体的言语片段，后者如听到“一”时，整个片段不成结构体，而是由三个结构体组成，它们分别是一个名词短语“人类自然语言的理解”、一个动词“是”和一个数词“一”。很明显，“从起点到任何一个时刻的言语片段”的数量远远多于成结构体的“言语片段”，后者是前者的一个子集。既然连“从起点到任何一个时刻的言语片段”中的结构块数都受到“7”左右的限制，语言结构体内部的块数当然也受到这个限制了。

需要注意的是，上述“从起点到任何一个时刻的言语片段”并不等于“任何一个言语片段”，因为前者必须包括这个语言片段的起点，而后者可以不包括起点而在中间截取一段而成，如从上文例①中截取“的/理解/是/一”这样一个片段，在“一”处的离散块数是4个，比包括起点但截止点相同的片段“人类自然语言的理解/是/一”就多出了“一”块。事实上，很容易构建一个远超过“7块”的“任何一个言语片段”。假设如下面②a那样，有一个由3个板块组成的结构体[H…][H][…H]，其中[H]是全局核心，两边两个从属语内部分别由7块组成，里面的H是从属语内部的核心，表示不同的附加语。

所谓“结构”，就是各组成成分之间的关系。分析语言结构，首先要把一个结构体明确地分解成若干成分。但是一个结构体到底该分成多少块，如果不考虑短时记忆的限制，单纯从结构上看，有多种可能性。提出组块理论的G.Miller（1956b）自己也感到无法解决这个问题。

“我们通常能够把一个二十个词组成的句子听过一遍之后加以复述。这句子包含多少单位？100个字母？30个音节？20个词？6个短语？2个分句？抑或1个句子？我们可以知道它包含了大约120比特的信息，因为比特的定义独立于我们对句子的主观组织。但是板块的本质在于它是人为的。比如，一个除了字母以外对英语一无所知的人会认为这句子里有100个单位；但一个英语很好的人会认为这句子里只有6个单位。我们不能离开了听者去定义组织的单位。”

其实这个问题不难解决，我们当然应该以操本族语者的语感为标准。语言结构受短时记忆的限制，为结构切分提供了一个有用的参考标准。Miller（1956）认为，一个英语很好的人会把上述句子处理成由6个短语构成的结构体，这个数字接近“7”，看来不是偶然的。但是他没有细谈这些短语是如何得到、如何定义的。

前面我们说过，任何语言结构体都不会超过7个左右的结构成分。现在的问题是要解决，使用怎样的分析方法才能保证得到不超过7个左右的结构成分。解答这个问题可以分两步。第一步，确保得到有限的结构成分。对这个问题的回答是：只要确定一个固定的核心，把它作为一个静止参照点，就能保证得到有限的结构成分。原因有二：一是从范畴上看，语言结构可以无限递归，就是因为核心不断转移，核心的确定，消除了语言结构无限递归的根源。（陆丙甫1983）核心身份转移，就像母亲身份的转移，孩子数量就是无限的，因为母亲生女儿，女儿变母亲又生女儿，这个过程可以是无限的。一个固定核心所带的从属语（包括论元和附加语）的范畴必然是有限的，正如一个母亲所生的孩子数量必然是有限的。二是从语言实际处理来看，一旦核心固定，朝一个固定的核心上不断添加从属语，后添加的从属语，就会离核心越来越远，远到一定程度，我们的认知就很难在该从属语跟核心之间建立起联系。所以一旦核心确定下来，所带从属语的数量便不再可能是无限的。

接下来的第二步，是如何从有限到“7项左右”，即如何进一步保证得到不超过7个左右的结构成分？这就可以根据组块过程受短时记忆限度的制约这一点推导出来。这是一个经验事实的问题。事实证明，一旦确定了一个核心，不仅其从属语的数量必然非常有限，而且从属语的数量也不会超过7个左右。例如：

因此，精确地说，上面这个句子，是由6个从属短语加上1个“核心词”组成的，而不仅仅是像Miller所说的只有6个短语。②

总之，我们无法离开一个确定的核心词去定义作为语序单位的短语。从外部来看，一个短语只有依附于一个外部核心，才能成为一个有语义角色的句法成分。并且，从内部来看，除了并列结构外，一个短语必须内部有一个自己的核心词。

“核心”是当代语言学，特别是形式学派最重要的概念之一。（陆丙甫2006）上述分析表明这个概念跟短时记忆限制关系密切。

我们把核心词及其所有从属语称为“直属成分”或“直系成分（Direct Constituent）”，以区分于“直接成分（Immediate Constituent）”。“直属成分”也就是“语序单位”。（陆丙甫2008）“直属成分”跟总是两分的“直接成分”不同，由两分直接成分组成的结构序列，虽然远远低于短时记忆的限度，但却没有反映出人类语言对短时记忆限度的充分利用。

因此，根据“直属成分”，我们可以说人类语言不但受限于，并且也充分利用了人类大脑短时记忆的限度。

五、从“核心”到“轨层”，从表层差异到深层共性

由核心词加上其从属语组成的结构中，各个从属语根据跟核心词的语义紧密程度，构成一个轨层结构。这个轨层结构具有极大的概括性，反映了人类语序的某些基本共性。例如：

④a.[他[上星期[[在实验室[用计算机[连续地[工作了]]]]]三天]]]

b.[He[[[[[[worked]continually]with computers]in the lab]for three days]last week]]

不妨把问题简化一下，去掉主语，结果还有“时位（T）、时量（D）、处所（L）、工具（I）、方式（M）”和动词核心这样6个成分，数学上可能的排列应该有6×5×4×3×2=720种。

但是我们目前调查到的作为某种语言中的无标记语序只有下列6种。请看下面的图示：

⑤轨层结构图

根据这6种语序，可以建构起上图6个成分组成的垂直轨层序列，它反映了5个从属语跟核心动词的距离近远。由于这个轨层距离顺序的限制，每个从属语都只能在自己的轨层中落实两个位置，理论上可能的排列就下降到2×2×2×2×2=32种（作为某种语言中无标记的基本语序）。

实际上可能的排列要少得多，我们目前只发现以上6种（俄语中第5和6两种顺序都很常用）。这是因为除了轨层的限制外，还受到其他一些限制，其中之一就是“如果时位T和时量D分置动词两旁，只能是时位在前而时量在后”，（即[T…V…D]，如汉语的“上星期…工作了三天”）。据此，包含[D…V…T]的8个序列就从32种语序中被排除了，排除它们的原理就是“整体-部分”的优势顺序（陆丙甫2009）。这样，剩下的理论上可能的基本语序就剩下24种了。但这仍然是实际发现的6种的4倍，等待我们去发现其他的规则来进一步排除实际上没有发现的语序。

据此我们提出“共性度”和“差异度”这两个概念，来衡量某项性质的跨语言的异同程度。假设“差异性”和“共性”是两个密切相关的概念，并且两者间存在某种反比例的关系，那么，可以假设两者间的关系（如下面⑥a），并由此可以把“差异度”和“共性度”分别落实为⑥b和⑥c。

⑥“差异度”和“共性度”的关系：“差异”表现在实际存在的不同形式；“共性”表现在数学上可能存在，但因受到某种原理的限制而实际上不存在的形式。

“差异度”跟“共性度”成反比关系。

a.差异度（实际存在的不同形式的数量）+共性度（数学上可能存在而实际不存在的形式）=100%（数学上可能的全部形式）

b.差异度=实际上可能存在的形式的数量/数学上可能的形式的数量

c.共性度=实际上不可能存在的形式的数量/数学上可能的形式的数量

在上面的语序现象中，数学上容许的6个元素的排列是720种，而为轨层顺序所允准的只有32种，那么，就会得到如下的结果：

⑦根据轨层所容许的语序数量得到的差异度、共性度

a.差异度=32/720=4.4%

b.共性度=100%-4.4%=95.6%

为什么用轨层允准的语序去表达跨语言的语序差异程度呢？由于那些允准的语序之间互相不同，而恰恰就是这些不同就反映了语序的多样性，即差异性。

“差异度”和“共性度”也可以分别看成“差异指数”和“共性指数”。不难发现，这两者其实是同一硬币的两面，可以根据其中之一推算出另一个。

事实上，32种轨层允准的语序虽然反映了各别语言的个性，即语言间的差异性，但实际上也同时反映了共同的轨层限制，所以又是深一层共性的体现。因此，所谓“差异性”或“个性”，不过是共性的不同具体落实形式而已。换言之，这种表面的差异，到了一个更深的层次，又成了共性。

这个深一层的共性，就是轨层所反映的各从属语跟核心间稳定的相对近远关系。这个近远关系等级概括了正、反两方面表现的基本共性，反映了“万变不离其宗”的语言共性。

上述轨层允准的32种语序，仍然跟实际存在的语序数量相差很大，因为还有一些限制没有考虑进来或还没有发现。如果仅仅考虑实际上发现的变体，那么，会得到如下的结果：

⑧根据实际调查到的语序数量得到的差异度、共性度

a.差异度=6/720=0.8%

b.共性度=100%-0.8%=99.2%

由此可见，人类语言的共性程度，至少在某些结构的语序方面，远远超过其差异程度。

当然，以上的异同程度分析是最宏观的，如果深入下去，还应该考虑各种语序的出现率。如S、O和V三个成分，数学上容许的排列是6种，实际存在的也是6种，不考虑6种语序的出现率差异，结果就是差异度为100%，没有任何共性度。但事实上6种语序出现率相差极大，SVO和SOV构成了绝对优势，OSV作为一种语言的基本语序几乎不存在。但从中同样能发现人类语言的基本语序共性。轨层⑤中的6个语序，明显占优势而大量出现的是序列互为镜像的1和6，而这实际上又可为上面所得到的已经很大的共性度另外加分。

从表面的不同看到深层的共性，是科学发展的标志。如人类跟猩猩表面差异很大，但是如今科学家发现两者的基因结构的相同度几乎是100%，而人类基因跟狗和老鼠的相同度也达到了99%。显然，正是这种对共性的认知的扩展，反映了生物学的进展。

六、从空间性的语义关系到时间性的语用关系

上述轨层结构反映了各从属语跟核心之间的相对稳定的距离顺序。那么，这个距离顺序的本质是什么呢？是“语义紧密度等级”，也就是各从属语跟核心词之间语义紧密度所决定的空间距离。轨层结构反映了“语义靠近原理”。③

“观念上靠近的成分在结构上也靠近”这一“语义靠近原理”早就有人提出，如Behaghel（1932）就把它作为语序第一定律。但是，在没有明确提出多分的轨层结构前，其应用是非常有限的，通常只用于比较“可让渡”和“不可让渡”这种两项式的比较。一旦用于轨层结构，它就成了一条适用于任何多项式句法结构的语序共性，不仅适用于以动词为核心的结构，而且也适用于以名词为核心的名词短语内部。（Lu 2009）轨层结构也适用于复合词内部，如轨层结构在构词平面也同样存在。金立鑫（2000）在Bybee（1985）的基础上，总结出下面这样的动词词缀轨层：

⑨人称-模态-时-体-动词词根-体-时-模态-人称

还有人根据日语的情况，又把这个轨层扩展为：

⑩人称-模态-时-体-语态-词根-语态-体-时-模态-人称④

总之，轨层结构大大地扩大语义靠近原理的应用范围。

语义靠近原理之所以普遍适用，是因为它抽象掉了语序的表层时间因素，反映了抽象的纯空间结构近远的关系，适用于不同的表层语序。而且，抽象掉了时间因素而只反映空间近远关系的轨层结构，当然比有时间因素的表层语序简单得多，因此更具有普遍性，更适合作为语言结构的初始起点，至少比表层语序更接近初始起点。

此外，由轨层所决定的“内外”区分，可以作为“内小外大”（陆丙甫1993）这一语序现象（靠近核心的成分趋向短小）的起点。由轨层所决定的“近远”区分，可以作为“距离-标记对应律”（陆丙甫2004a）这一形态分布规律（离核心越远的成分越需要标示其跟核心语义关系的形态标志）的分析参照。

由此可见，“核心”具有空间定位标准的作用。空间认知和空间定位，是人类认知中最早发展出因而也是最基本的认知概念。因此认知科学认为，空间认知是人类认知的初始起点，时间认知就是从空间认知发展来的，如表示时间关系的介词等，多数从表空间的语言单位发展来，如汉语的“前、后”就是如此。因此，可以说受到短时记忆限制的轨层结构是语言结构的初始起点。

从空间距离性的语义关系，再发展到时间顺序性的语用关系（从已知旧信息到新知、未知新信息），应该是语法研究推导的正常程序。不仅认知过程是如此，从本体论上看也是如此。因为语用意义总是附加在一定的语义成分之上的。通俗地说，语义是皮，语用是毛，“皮之不存，毛将焉附？”。

七、从短时记忆限制到其他数量限制

短时记忆限度对语言的限制是一种数量性限制。

老子曰：“道生一，一生二，二生三，三生万物。”一千七百年后，秦九韶进一步说，“万物莫逃乎数也。是数也，先天地而已存，后天地而已立”。这种对数的看法，跟古希腊毕达哥拉斯“万物皆数”的提法一致。其弟子菲洛劳斯说，“一切可能知道的事物，都具有数，没有数而要想象或了解事物是不可能的。”因此，可以说这表达了数是世界的基本属性。这从另一角度证明数量性共性可以作为句法分析的起点。

洪堡特曾认为人类语言的最大特点是“用有限的手段表达无限的内容”，这一说法被广泛接受。“有限”、“无限”就是数量概念。重要的问题是要落实“有限”。最明确的落实就体现在组块过程和句型成分的“7左右”的限制。

除“7左右”之外，语言结构的数量性限制还有多种表现。比如“4”也是个重要的结构性数目。“7左右”是短时记忆和注意力分配的上限，而“4”是能够轻松处理的“敏感点”。（陆丙甫2009）如人类各种语言的句子结构中，组成句型的“句型成分”（不可缺少的成分，论元加核心动词），都不会超过4个。此外，下面这条语言共性也跟数量限制有关（Newmeyer 2005）：

（11）语法计数不可能超过“二”，也就是说，不可能有一种形态-句法操作会用“第三个位置”、“第四个位置”等表达去定义。

迄今所指的语言现象，都支持这条共性。比如，并列连词“和”和and的常规位置是“倒数第二位置”。并列连词的位置还有其他，据Haspelmath（2004），主要有三个位置，按照出现率排列，分别为“倒数第二”、“顺数第二”、“倒数第一（末位）”。据李占炳（2010）对中国境内57种民族语言调查，结果基本相同，最常见的依次为上面三种，还有其他一些，但完全没有发现有“第三位置”的。

当然，结构中“第三个位置”是存在的，但是没有句法意义。比如在SVO语言中，通常直接宾语在动词后第一个位置，间接宾语在动词之后第二个位置。汉语中动词后的确有“第三个位置”，但是没有句法意义。如“给他一杯水喝吧”，其中“喝”若以主要动词为定位标准，是“动词后第三个位置”，但是我们的语言直觉是这个位置应该定义为“动词短语最末一个位置”，“倒数第一位置”，“吧”则是“句末位置”。

在SVO语言中，可以有首、尾和核心动词三个定位标准，根据上述共性，就有9个在操作中能够轻松定位的句法位置，即[1-2…2-1-H-1-2…2-1]：除靠句首、靠句末四个位置外，以核心动词为定位原点得到核心动词，动词前、后各有第一、第二位置。在SOV、VSO等语言中，这样的位置则有6个。这方面又显示了跟“7左右”的某种联系。

八、短时记忆的限制与“先天语言机制”

轨层结构反映了短时记忆对语言结构的限制，因此可以看成是人类语言机制的一部分。这跟Chomsky的观点相反。Chomsky（1965）认为：

语言学主要研究在某个单纯的话语社区的理想的说话-听话者，他充分掌握了这种语言，并且不受影响于那些跟语法无关的因素，如记忆限制、分心、兴趣转移以及其他种种在具体运用中发生的失误（包括偶然性的或特色性的）。

Chomsky的这段话正确指出了语言学研究的是理想的编码/解码者，就这点上可以说是纠正了Miller对定义语言结构中的“板块”之可能性的消极看法。但是另一方面，没有看到像“短时记忆限制”这类在人类语言处理过程中时刻存在的限制因素跟偶发性的注意力转移等不同，应该是语言机制或者语法的一部分。正如Du Bois（1987）所说，“语法所编码的是说话者最常用的”。既然短时记忆限制在解码、编码过程中时刻存在，它应该是语法中不可缺少的一部分，而且正如本文所分析的，是最基本的一部分。就我们的讨论来说，也就是“语法必须对解码过程中无所不在、无时不有的短时记忆的限制加以编码”。

形式语法认为语法规则具有先天性和自主性。事实上，在数量限制上这一点表现得最明显。“7左右”和“4”的限制，就反映了人类语言结构的先天性限制。若把语法看成人类一种微观社会行为的法则，认为它的产生跟人类宏观社会行为的礼仪、法律有共同点，那么，约定礼仪、制定法律必须考虑到人类趋利避害、荣辱感等天性，从这个角度看，礼仪、法律也有先天性。语法规则的先天性也类似于此，而这一点首先表现在数量限制的共性上。而且，如同法律的主要内容是消极性的限制，即定义和禁止非法行为，而不是积极性的，即定义合法行为。现代法律的一个默认原则就是“非法之外，皆为合法”，这就为人的创造提供了无限的空间。语法机制和规则也是如此，只能规定不合格形式，无法穷尽合格形式。

九、余论：平凡事实的深入分析

本文分析表明，语言分析如同其他学科一样，也可以从最简单、最普遍的基本现象为初始起点，通过推导得到一些语言结构的基本规律。

但是越是普遍存在的现象，越容易为人们所忽视，这正类似于重力、空气的存在长期以来为人类所忽视。然而，科学理论不但不能忽视最常见的平凡现象，而且应该把平凡现象当作理论推导体系的起点。在语言研究中强调这一点，对于语言学进一步向自然科学接轨不无好处。

最简性和普遍性，加起来就是“最基本”。“公理”就是因最简单、最普遍而显得最平凡的基本“常识”。因而爱因斯坦说，“整个科学不过是日常思维的提升。”所谓“日常”思维，就是“常识性”的思维。这也意味着科学体系可以从常识中推导出来。竺可桢（2004）也认为，“科学并不神秘，不过是有组织的常识而已。”⑤数学之外，其他一些根据常识建立起理论的例子也很常见。达尔文生物演化理论就是建立在“遗传”、“变异”和“自然选择”这三个常识性现象之上。生物体的上下代之间总有相似处，这就是“遗传”，是谁都知道的常识。但上下代生物体又不能完全一样，总有差异，这就是“变异”，也是谁都知道的常识。

至于“自然选择”，即不利于生存的变异个体容易被淘汰，这也是常识。但一般人对此只看到结果明显的例子，如残伤的后代不容易生存。而达尔文看到了微小的变异差别，经过时间长河的积累、放大，结果也会很明显。或者说明显的适应变化现象是通过微小的变化积累而成。比如1000个适应能力稍微差一些的人，跟另外1000个适应能力稍微强些的人比较，其适应结果粗看并不明显。比方说其中可能只有1%的人在总体上表现出不适应生存的结果。大部分人会看到99%而说这种差别对生存没有影响，而达尔文就能看到这1%经过时间的放大，会产生巨大的后果。这种超乎常人的“见微知著”洞察力，正是达尔文的伟大之处。有人在赞扬达尔文这种洞察力时说，“渺小的心灵只关注异常现象，而伟大的心灵却关注平凡之事。”其实，这种洞察力不仅是“见微知著”，同时也是“见著知微”，看到明显的甚至极端的变异现象的效果而联系到不明显的细微的变异的效果。在极大和极小之间看到了“一致性”。

其实，生物育种中的“人工选择”跟“自然选择”，原理是一样的。世界各民族都有丰富的育种经验，人工选择是很常识的方法。达尔文不过把人工选择延伸到物种的自然演化中而已。

人们通常把常识现象看成倾向。但是，“倾向是受到干扰、污染的共性；共性是净化、抽象的倾向”，从常识性倾向中提炼出共性原理，这是科学的普遍方法。（陆丙甫2004b）

作为常识的科学基本要素的普遍存在，不妨用庄子的一段论述作为比喻来总结（假设“道”就是无所不在的基本原理）：

东郭子问于庄子曰：“所谓道，恶乎在？”庄子曰：“无所不在。”东郭子曰：“期而后可。”庄子曰：“在蝼蚁。”曰：“何其下邪？”曰：“在稊稗。”曰：“何其愈下邪？”曰：“在瓦甓。”曰：“何其愈甚邪？”曰：“在屎溺。”《庄子·知北游》。

这段文字表明：“道”（根本法则）的无所不在。比如生物学家在以屎为生的屎壳郎中，同样也能发现自然淘汰、适者生存的物种演化原理。语言学不应该也是如此吗？

著名媒体人白岩松近年来一直强调我国道德建设需要“捍卫常识，建设理性，追求信仰”。对于科学研究来说，就不仅是“捍卫常识”的问题，而是“深度发掘常识”的问题。

注释：

①其实，即使“任何一个言语片段”也很少会发生包含块数远超过“七”左右的情况。因为不同结构会有将核心置于同一侧的核心定位的“跨范畴和谐原理”。（Hawkins 1983）

②至于这七个成分切分出来的程序，就是“向心切分”（每次切分都在上一次切分得出的两个直接成分中的核心部分进行，切分到表达核心是词为止），见陆丙甫（1993）。至于“核心”和“核心部分”的定义，主要是语义的（陆丙甫2006），是实词性的，不包括虚词充当的“功能核心”，如加在整个句子上的语助词“吗、呢”等。形式语法认为它们是功能核心。功能核心可以处理为“语法标志”，不是句子句型成分，既非论元argument又非附加语adjunct。

③当然另外还可能有其他原因，如“稳定性原则”，名词的性、数、格标志中格标志总在最外层，因为所指相同的一个名词，在交际中性、数不会变，但是格会经常变化。将稳定因素当作内核而把临时变化因素置于边缘。这符合认知原理。

④“模态”在金立鑫原文中是“语态”。当然，这个轨层也只是个底层结构，落实为表层时会受其他因素的干扰而出现偏离，如土耳其语的gel-e-sin-iz（来-虚拟模态-第二人称-复数），意思是“你们可以来”。又如Munda语中的Kharia、澳大利亚西北部的Ngarinjin等语言中有[动词根-时-体]的序列；Osumi语中的Tinrin、Salish语中的Klallam、Saanieh和Sooke等语言中有[动词根-模态-时]序列；中部海岸Salish语中的comox语有[动词根-模态-时-体]序列。（Cinque 2006）有趣的是，这些偏离都发生在后缀，这里面也显示了某种左右不对称现象。（Lu 1998）

⑤当然，科学理论发展到一定程度，有超越常识的一面，主要是在微观世界和宏观世界。但是语言学的研究远没有到达这个程度。

标签：数学论文; 短时记忆论文; 语法分析论文; 语义分析论文; 有限空间论文; 共性与个性论文; 认知过程论文; 公理系统论文;

定量限制是语法分析的出发点之一_数学论文

猜你喜欢