马太效应的定量表述,本文主要内容关键词为:马太论文,定量论文,效应论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
马太效应(matthews effect)是一个社会心理学的术语,意指社会舆论与行动上难以避免、又利弊俱现的偏态心理反应、行动趋势以及据此而产生的种种后效。它是美国著名社会学家默顿(R.Merton)论证科学建制——科学评价与奖励时,援引“圣经”中一段陈述而得名的。《新约全书·马太福音》25章有一句话:“因为凡有的,还要加给他,叫他有余;没有的,连他所有的,也要夺过来。”马太效应是起源于科学社会学中有关科学奖励机制的一个讽喻,但是却真实地概括了整个人类社会中的心理反应,以致产生行动的惯性趋势。它描绘了社会非常普遍的优势与劣势的积累过程及效果状态。它在社会科学中特别是情报科学的实践中十分典型和常见,以致可以视为支配人类情报行为及活动的基本规律之一[1]。其实,我国古代的思想家早就有类似的论断,老子在《道德经》中写道:“天之道,损有余补不足;人之道损不足奉有余。”这里的“道”即是指规律,自然界的规律是削平多余的,补足欠缺的;社会的规律则是掠夺不足的,加强过剩的[2]。马太效应的本质是,一旦优(劣)势出现,就会不断地加剧,自行强化运作、滚动。当然这应该是在一定条件下出现的现象和反应。马太效应既不是必然的,也不是永恒的;超过一定的限度,也会不能再现或消失。马太效应只是一种心理趋势的反映以及由此可能产生的宏观行动的结果。它是强大的,却不是不可以克服的。它既是一种推动力,有时也可能是一种阻力。它既是积极有利的,也可能是消极不利的,问题在于我们如何诱导、培育和利用。
对于马太效应的表征大都是定性的、陈述式的,定量的表述与刻划则不多。常见而直观的有:卢梭定律和“20 ∶80”律。但是利用数据对此进行深入的探讨与分析,则是更为少见的。本文拟对这两个定量表现马太效应的定律进行介绍,从中试图找出一些原则,以期深化我们对定量表述马太效应的认识和理解,使之拥有实际应用的具体概念和尺度。
卢梭定律一般亦称平方根定律。美国著名的科学家、科学史学家普赖斯(Price)声称该定律出自他本人,在他那部颇有影响的《小科学,大科学》一书中有如下的论述:“在同一主题中,半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作者总数的平方根”[3]。其实,卢梭定律在此前的18世纪,业已由法国政治学家卢梭(Jean-Jacques Roussean1712-1778年)开发出来,卢梭本人对此曾有这样的表述:“在任何产品集合N中,品质优良的产品数量,约等于全部产品N的平方根,亦即。”[4]我们可用数学语言来进一步表达卢梭定律,为此要作一些规定:T为全部作者人数:M为全部作者所撰写的文章数量;Xmax为撰写文章最多的那位作者撰文数量,亦即这一作者集团中最高产作者的撰文数量;h为高产集团的临界值,亦即高产人群的集团中,撰文最低的那位作者的撰文数。根据普赖斯的论述可有:
(1)式表明,高产作者集团(即从撰写h篇到最高产篇Xmax)撰写论文的数量占全部论文的一半。
(2)式表明,据式(1),高产集团的作者数量为全体作者数的平方根,平方根定律盖因此而得名。文献计量学的定量实践表明,这一定量规律的准确性较差,一旦运用便会发现误差非常大,多数情况下实际的数据集合并不符合上式的定量关系。本文就是试图通过分析找出其内在的某些条件。
此外,一般认为“20∶80”律的主旨是由犹太人经济学家巴特莱率先提出的,因此亦称“巴特莱法则”。若画一个正方形,再画一个内切圆,那么圆的面积与正方形所余面积之比大约为0.78∶0.22。不仅几何图形如此,空气中的氮与氧之比也是0.77∶0.21。据此种种,意大利经济学家维弗利根据“巴尔特大原则”提出一个近似的原理,即琐碎的多数与重要的少数——“80∶20”律。其意义是,在任何特定的群体中,重要的因子通常只占少数,而不重要的因子则占大多数。因此只要控制少数,即可控制全局。在经济、科技、管理等领域只要掌握好“20∶80”规律,就能产生意想不到的有利效果。巴特莱认为事物的80%价值集中在20%的组成部分中。对此有人曾作过验证性的统计,商店里20%的顾客占据了80%的销售额,抑或20%商品品种满足了80%的顾客的购物需要;《新华字典》收入单字12000多个,其中普通汉字约有8000多个,常用的字只2000多个,也是“20∶80”的关系。人的十个指头,利用率最高的也只有两个:拇指和食指,更是“20∶80”的关系。1969年图书馆学家特鲁斯威尔(Trueswell R.)把这一原则引进图书馆的文献馆藏管理中,提出文献的“20∶80”律[5]:“流通量的80%系由大约馆藏量的20%所提供的”。一时曾被图书馆界所接受,并且认为这一定律“很好”地描述了“馆藏应用的实际”。
1985年英国图书馆学家伯勒尔(Burrell Q.)著文提出商榷,他问:“80∶20”律是图书馆的学科知识,还是统计规律?”经他反复验算后强调:大体上是20~40%馆藏支持着80%的流通量[6]。本文作者通过验算同样发现:特鲁斯威尔对“巴尔特大原则”的移植,只是照搬挪用,对于“20”的解释是含糊不清甚至是矛盾的;不能把这一定律在图书情报学领域内奉为严谨的定量规律[7]。
“20∶80”律虽然形似定量,但在实际运用中表明,其准确程度也同样很低。究竟能不能应用?本文亦拟给出初步的判断。
格普塔(Gupta B.M.)的文献(8)提供了有关人口遗传学领域论文著述的数据。就此,我们可以在这一数据的基础上开展进一步的分析。格普塔的数据规模是充分且足够的,前后累积了80年,该领域的作者共有3194位,总计撰写11136篇文章。文献(8)中集合的数据有两种形式,其一,每间隔10年的分段统计数据;其二,以10年为单位的逐年累积一体的统计数据。如上述文献(6)的提议,本文选择以作者总数的30%对应论文80%为据,同时为了探索定量性规律本文认为应选择累积值来进行定量的分析为宜。具体如下表所示:
人口遗传学领域的作者著述情况
序累积期作者论文 作者总数对应论作者总对应论文
号 总数总数 的平方根文的% 数的30%
总数的%
1
23
4 5 6 7 8
1 1900-2037 796.08
49.67 11.10 64.58
2 1900-30109309
10.44 53.13 37.20 72.94
3 1900-40221708
14.86 53.51 66.30 77.62
4 1900-50301930
17.34 48.07 90.30 75.97
5 1900-605561859 23.57 38.64 166.8076.04
6 1970-701532
4849 39.01 30.46 456.6075.29
7 1900-803194
11136 36.51 27.05 958.2077.03
从上表可见:
(1)对于卢梭定律(平方根数据),一开始对应论文的百分比略微上升,及至第3期(1940年)则开始下降,随着作者规模的不断扩大,对应的百分数呈明显的递降趋势。我们试图以表中的列5(作者的平方根数)为x,列6为xf(x)来拟合两者的概率分布,经实验多次没有找到理想的概率分布关系式。但是两者间的定量关系还是隐约可见的:开始呈上升状,然后迅速下落。是不是可以这么估计,卢梭定律在规模很小的时候尚可对应,而被观察的数据规模过大时,就明显地背离了。例如,当总数为2时,2的平方根为1.14,而1.14仅为总数2的50%;当总数为1000时,1000的平方根为31.6,而为总数的3.2%,两者差异甚大。因此我们不应机械地、孤立地去理解卢梭定律,应当辩证地看,在一个固定的规模来研究,这种表述并不是毫不可取的。不管怎样,这条定律刻划少数“精英”的重要作用,至于其定量的叙述则是很勉强的,我们不应也没有必要求全兑现。
(2)总数30%的作者对应的论文数量,与上述情形不尽一样:开始呈上升状,然后曲线趋于平滑,以致几乎保持不变,似乎与作者规模的扩大无关。这条曲线类似于劳伦兹曲线,显示出这列数据对作者规模的大小并不敏感。似乎说明相当于总数30%的作者的马太效应在超过一定数值之后(例如,在本例中为累积的作者人数超过全体作者人数的5%以后)已经成为定势。所以运用这一定律,最好选择在数据规模较大的区域内。但是这一推论是否有普遍的意义,尚需进一步积累数据加以验证。
(3)从以上分析可见,卢梭定律与“20∶80”律的马太效应的发育是有一个累积过程的。以卢梭定律表述的马太效应易于形成和兑现。一旦形成后,随着规模的扩大,马太效应(这里表现为“集中”现象)便出现衰减,以致当考察全部作者时,对应的论文数量仅达到27.05%。所以当数据规模小时,亦即平方根数值不超过总数5%时,卢梭定律的内容是可能兑现的,再增大时卢梭定律所表述的马太效应就荡然无存了。但是数据规模较小时,运用马太效应的意义也是有限的。“20∶80”律最好应该理解“20~40∶80”律或者是“30∶80”律。它所表述的马太效应一旦形成后,对于进一步扩大数据规模似乎并不敏感。也可以这样认为,以“30∶80”律表述的马太效应是比较稳定的,它的应用范围较为广泛。
以上是我们试图找出的卢梭定律和“20∶80”律的应用区间和条件。
所得出的若干认识,可能是初步的,尚需更进一步扩大验证。当然对上述所谓定量的表述,仍然是采取宏观的、粗线条的态度为宜。我们必须在总体上把握和理解才是。否则如同对待其它文献计量学定律一样,可能是不得要领的。
标签:马太效应论文;