对文献计量学研究的一些看法,本文主要内容关键词为:计量学论文,文献论文,看法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 文献计量学目前的状态
文献计量学存在着定义多、模型多、争论多的问题,总的说来,对文献计量学是什么,研究什么,还存在分歧,突出表现在以下3个方面。
1.1 对文献计量学基本问题意见的不统一
文献计量学的概念有多种,文献列出了有关文献计量学的9种定义,这些定义总体上对文献计量学的“计量”特点看法一致,分别使用了“计量技术”,“定量化处理”,“数量分析”等词汇,但对于文献计量学的学科研究对象却莫衷一是。普里查德认为,文献计量学的研究对象是“图书和其它形式的书面交流”,后又进一步解释,“我们计量的对象是情报传输中的过程变量”。英国标准局的定义认为文献计量学的研究对象是“文献使用情况和出版物”。还有诸如“文献的书目特征”,“被记录的论文”等。对文献计量学的范畴和目的也存在各种看法[1]。
1.2 经典定律研究中的混乱
三大定律的问世均比“文献计量学”一词要早,它们在文献计量学中占据着重要的地位。但是这三大定律都存在着一定的缺憾,多年来一直被学者们所验证、补充和修正。以布拉德福定律为例,布鲁克斯、莱姆库勒、维克利、威尔金森等都曾对布氏定律有过研究。文献[2]将现有的22个布氏定律双科模型分成两个基本类型,等级频率模型和大小—频率模型,等级频率模型又可以分为累积模型与非累积模型……,作者对众多的模型进行归类后,对各模型的拟合优度进行检验,结果发现很多模型无法通过检验。由于使用了K-S检验和X[2]检验两种方法,最终仍无法对等级频率模型和大小—频率模型进行直接比较。各模型将并存下去。如果将三大定律都探究起来,模型将更加繁多。
1.3 文献计量学与情报计量学之争
1988年布鲁克斯提出以“情报计量学”代替“文献计量学”,理由是文献计量学仅拘泥于“书目的计量”,而且文献计量学已不适合于现代电子化载体文献的计量[3]。布鲁克斯的提议得到了普遍的响应: 他的学生埃格黑紧随师后,其专著便以《情报计量学导论》为题。“文献计量学和情报检索的理论问题第一届国际会议”被后来的科学计量、情报计量所补充和替代,甚至完全改为“国际科学计量学和情报计量学学会第五届国际会议”。但是,对这种名称更替也有学者不以为然,我国的王崇德和邱均平都认为《情报计量学导论》一书就副标题而论,作者还不能彻底地摆脱文献的计量,而纯粹地建立情报计量学的学术体系,甚至连结构框架也谈不上令人耳目一新[4]。 各届年会虽说名称有了改变,但征文启示的内容较之往届几乎没有任何变化,也就是说,会议的本质及其所讨论的问题并未改变[5]。 刘廷元是国内支持情报计量学的学者,他于1994年发表《情报计量学的几个基本问题》,系统介绍情报计量学的历史沿革,探讨了情报计量学、文献计量学、科学计量学的联系与区别,并批评王崇德“被三门计量学的重合、搭界迷惑住了”[6]。之后,王崇德与刘廷元展开了理论交锋。王崇德强调“在科学发展的进程中,如果不是学术上水到渠成的话,靠任何人一、二篇文章是难以定下调子来的,局面不会就此稳定下来。要想得到学术界的认同,那是需要事实的,更需要找准一个学术空间位置,廓清其学术边界。从概念出发的论断有时是不会奏效的,甚至是不得要领的。”[5]
文献计量学目前所存在的这种定义多、模型多、争论多的局面表明文献计量学究竟是什么,研究什么还存在着不同认识,还没有形成共同的学科信念。概念只有借助结构严谨的理论才能获得精确的含义[7 ]。文献计量学目前还缺乏强有力的理论作为最后的支持!
2 文献计量学是研究计量元素间相关的科学
文献[8]认为,“情报其实是一种全息元, 情报研究就是全息重构的过程,它通过研究分析各种情报全息元,将这些零散的情报全息元进行重新组合,研究它们之间的相关性关系,进而重新再现或推测出人类活动的状况。情报研究者所关心的是情报全息元之间庞大、复杂的信息联系,针对某一问题而进行的情报研究,其实是基于信息联系而进行的求解过程。”笔者认为,文献计量学正是求解各种计量元素之间相关性关系的一门科学。
文献计量学家们发现,“各种不同的计量元素存在着内在的联系,从统计意义上讲,它们并非独立存在,而是相互牵制发展的。”[9] 早期的研究已经证明,三大经典定律的内在机制都是研究“成功”与“失败”、“强者”与“弱者”之间的极性关系。三大定律是用数学语言,对论文与期刊、作者与论文、词的使用频次与词的等级这三种关系的描述。文献[10]得出的结论是,“某种数据项能引起相关数据项的集中与分散。”文献[11]则得到了下面的集中关系表:
高产作者可以集中自己的题名词、被其引证的作者、他们发文的期刊和他们文章中所标的叙词;
文献题名可以集中作者名、其他题名词、被引文献、期刊和叙词;
被引强度高的参考文献可以集中引证作者、引证文献的题名词、同引文献和叙词;
期刊可以集中撰文的作者名、载文的题名词、被引文献和叙词;
叙词集中作者名、题名词、被引文献期刊和其他叙词。
文献计量学各定律中的公式和曲线更是一种相关关系的集中体现,它们是通过数学手段,以数的形式反映了文献计量学各项指标之间的关系,反映了某项指标在不同时间、空间内的相互关系。
此外,引文研究中,共引与引文耦合是对引文与引文之间关系的研究;著者共引研究引文中作者与作者间的关系;共词研究关键词之间的关系;三引、多引等新概念更是多维度地考察文献之间的相关性。
3 文献计量学需要新视野
文献计量学获得发展的前提条件必须包含下面两个因素:一是努力探寻新的计量元素,二是从新的角度研究计量元素间的相互关系。文献计量学的历史已经证明,每当有新的计量元素纳入到本学科中来,或是每次发现了新的研究视角,都会引起随之而来的探讨、效法,进而掀起一阵研究热潮。如Braun 等人统计了多个国家的人均科学论文发表数及其被引用状况、人均国民生产总值、人均能耗量、每万人电话拥有量,探求每个国家后3 种社会经济指标同第一种科学计量学指标之间的相关性,成为开创性研究;Atkins将多主题文献区分出第一主题与第二主题,并将主题与时间联系起来,划分出随时间上升的、下降的、波动的、平稳的、 钟形的5种,在方法上具有开创意义。Mackintosh在其1972年的博士论文中,对文末致谢进行了研究,成为同类研究中的先驱。他们之所以做出了开创性的工作,是因为他们善于从时间、空间等角度发现、探索计量元素之间的相关关系,与夏佩尔提出的在信息联系求解过程中的3种模型[12]相吻合,也为我们思考问题提供了出发点。夏佩尔提出了3种推理模式:结构型推理模式要求从全息元之间的空间结构关系来求解问题;演化型推理模式通过建立全息元的演化联系而求解问题;综合型推理模式,是前两种模式的综合,要求从有限的时空域联系去推理更大范围内的时空关系。文献计量学者们应善于吸收这些理论成果,开拓自己的思路,不断丰富文献计量学的研究内容。
4 文献计量学应防止数学的误用
文献计量学是数学与图书情报工作相结合的产物。“据O.Nacke 对589篇论文的统计, 现有22个数学分支在45个文献情报工作领域得到了应用。”[13]正如马克思所说,“一种科学只有当它达到了能够运用数学时才算真正发展了。”但真正发展了的科学会不会由于数学的误用而阻碍了自身的发展呢?
文献计量学中的经典定律研究,增长、老化研究,数学模型研究都需要运用各种数学手段,其成果也是数学推理的直接产物。但这些研究长期以来都经不起检验。D.P.Wallace指出, 尽管许多人暗示文献老化测度方法可以用于馆藏图书老化的测定,但“至今尚无实际应用任何一种老化公式作为馆藏文献资料管理的报告,已有的利用统统是利用一些较随意的标准。”[14]
1960年R.E.巴尔顿和R.W.凯普勒将物理学概念“半衰期”引入文献计量学,作为测定文献老化的指标,并提出了文献老化方程:
Y=1-[(A/e[x])+(B/e[2x])]
半衰期的概念以及这一老化方程对老化研究产生了巨大的影响,但是后来不断有学者对此二人的研究表示怀疑。文献[15]对各种老化概念、公式进行了分析,指出,“R.E.巴尔顿和R.W.凯普勒本来想用一种技巧来解决历时观测的文献老化现象测定问题,却错误地将另一现象当作文献老化现象来测定,从而产生了所谓的‘同步’观测方法,使研究复杂化。”“长期将历时观测的有关概念和定性分析结果用于分析和解释同步观测的测定方法及测定结果,造成说不清,辩不明的混乱。”可见任何数学手段的运用必须慎重。
数学的应用究竟应以什么为尺度,是多多益善,还是有的放矢?让我们将目光转向其他领域,或许能够寻找到一些有益的启示。
经济学也引入了不少数学方法,经济计量学与文献计量学有着某种相似之处。文献[16]指出,“年复一年,经济学家在继续建立大量的数学模型,而且更为详细地探讨这些模型的性质。同时,经济计量学家把所有可能的代数函数式用于基本上是同样的一些资料。这些都无助于进一步深入理解一个现实经济系统的结构和运行。”“经济学家把注意力集中于理性选择这样的问题酿成了数学形式主义,这种形式主义就是经济学的特点。”“这里所反对的并不是数学的利用,甚或经济学数学化。这里所反对的是数学在经济学中的误用,尤其是它常常给经济学理论本身树立了一个伪科学的形象,使经济理论不能满足任何经验检验,而这种检验却正是科学与纯粹的迷信或赤裸裸的意识形态的分野。”经济学家中有人对数学应用提出了这样的建议,“在这方面,经济学和其他社会科学应当学习生物学的方法。由于控制论革命,生物学已放弃了简单和机械的模型,而采用具有大量反馈系统的复杂模型。”
数学在文献计量学中的应用也存在着这种程度不同的误用倾向。并不是只要应用了数学就可以圆满解决各种文献计量问题。理论建设者们在运用数学手段时必须慎重,对所提到的模型必须加以理论检验与实践检验,防止数学形式主义。
5 向新媒体的拓展
网络使人们的生活发生了改变,也给各行各业带来巨大的变化。文献计量学也很有必要对新媒体的出现作些思考。
1997年的“Journal of Documentation”上发表了Almind等人的文章《万维网上的情报计量分析:网络计量学方法门径》,该文首次提出了“网络计量学”(Webometrics)一词, 认为网络计量学包括了所有使用情报计量方法对网络通信有关问题的研究。该文作者认为“情报计量方法所使用的手段完全可以应用到万维网上,只不过是将万维网看作引文网络,传统的引文由Web页面所取代。”[17]早在1990年Paisley就提出了将情报计量方法应用到电子通信领域,“现在的书、刊、报纸中的大部分文本信息将来都会被包含在电子数据库中,……所收藏的大量电子信息将来会成为文献计量学研究的主流。”[18]
21世纪的文献计量学也许真的会成为“网络计量学”,不论它的名称是否会有变化,我们都必须看到这样一种趋势:下个世纪的文献计量学必将实现向新的计量媒体的拓展,从而开始一个崭新的发展阶段。