《中国科技期刊篇名数据库》统计功能开发与利用,本文主要内容关键词为:篇名论文,中国论文,功能论文,数据库论文,科技期刊论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 G356.1
《中国科技期刊篇名数据库》(以下简称《中篇库》)是由中国科技信息研究所重庆分所开发的一种光盘检索系统, 该数据库收录了从1989年至今的全国自然科学316个专业范围的4337种科技期刊和112种港台(中文版)科技期刊上刊登的论文篇名,覆盖了全国邮发的全部自然科学期刊。该数据库共有主题、分类、著者、刊名、复合五个检索字段,主要提供课题检索、科研项目查新、论文查收等功能。实际上,深入研究该数据库的一些特点,发现它还存在着一个潜在的重要的功能——统计功能,开发它的统计功能,不仅为学科、期刊的定量研究提供了一个新的研究思路,同时对于解决一些实际工作中存在的问题,也起到一些意想不到的效果。
1 开发《中篇库》统计功能的必要性与可行性
检索我国图书馆学情报学定量研究方面的论文,不难发现有两个重大的缺陷:一是统计数据滞后,二是统计样本过小。统计数据的滞后导致了成果的滞后性,统计样本选取太小不能说明问题,甚至可能导出错误的结论。因而许多关于“现状”的研究,在论文写作时,就已经不是“现状”了。到发表见文时更是远离“现状”。出现上述缺陷的原因是我国大多数图书馆学情报学定量研究论文选择了《全国报刊索引》、《中文核心期刊要目》等手工检索工具或各种年鉴作为样本,进行文献计量分析的,而上述工具都是印刷本,从文献的收集、处理加工、出版到装订成册,要花费许多时间,因此到印刷本出版时,再以印刷本为统计源,同时在统计的过程中要用手工进行大量数据处理,耗时耗力,统计数据滞后已无可避免的了。此外靠手工统计数据,其样本的选择不可能非常大。这些都严重地影响了情报研究的准确性和时效性。而《中篇库》的几大优点解决这些问题。其一,《中篇库》数据量大,覆盖全国邮发的全部自然科学期刊,为统计提供了一个足够大的样本。其二,《中篇库》每个季度数据补充一次,因此其数据非常及时。其三,《中篇库》是利用计算机检索,检索方式简单易行,检索结果准确快捷。基于以上三点,以《中篇库》作为统计源进行检索统计是可行的。
2 《中篇库》的统计功能的开发与利用
2.1 统计各年度论文数动态变化规律
《中篇库》设有年代限定功能,可以通过限定年代检索某一年的某学科、某专业、某课题的论文数,迄今为止,该库可统计1989-1996年每一年中的所有自然科学各学科各专业各课题的论文数,把各年度的论文数进行比较分析,其动态走势可以从量的侧面观察国内某方面的研究状况,论文数逐年增加表明该方面研究仍处上升通道,是近年的研究热点,论文数逐年递减,是否意味着研究进入黄昏阶段,尚需具体问题具体分析。此外,还可以对发文量多的年度进行重点检索,如文[1 ]在研究全球定位系统(简称GPS)的研究现状时发现1992 年的论文数特别多,于是对1992年的论文进行重点研究,发现原因是,1991年的海湾战争中,GPS以其高度准确性和可靠定位的卓越功能而一举闻名于世, 世界各国因此加紧了对GPS的研究,我国也同样如此,1992 年确定为中国空间年,召开了几次大规模的GPS应用研究会,1992 年由此成为高发文期。
2.2 统计论文的专业(类目)分布
研究某学科的论文专业分布,可以检索统计出该学科在各类目上的论文数,并进行比较,不难看出学科研究的重点。如研究情报学,使用分类检索字段,就可以分别检索出情报学10个类目的论文数,从中发现情报检索类目、情报学类目、世界各国情报事业类目是情报研究的重点,分别占总论文量的百分之二十几,也就是说这三方面研究占情报研究总量的百分之七十以上。如果把各年度的论文类目分布分别统计出来,就可以更深入地把握学科研究重点的动态变化规律。可见研究论文类目分布对研究学科重点很有价值。
研究论文专业分布,对分析应用型技术也很有作用。被视为20世纪最重大科技成就之一的GPS定位技术几乎应用到各个领域, 要研究其在我国的应用现状,只要检索每个学科下各个类目的论文量后,再检索出GPS论文量,两者进行逻辑“与”运算,即得出每个类目下的GPS论文量,最后统计列表,能一目了然看出GPS在各个领域的应用程度。
研究论文专业分布,可以研究学科交叉程度。如图书馆学和情报学属两个相互交叉的学科,从70年代起就一直有人在研究其同化程度,文[2]中也对此进行了研究, 但所有的研究基本上都是建立在定性分析上,或建立在极少量的样本考察上。笔者利用类目研究法,结果基本上与文[2]一致。 具体方法是:首先检出图书馆学的第一个类目——图书馆学类目的论文数。再用这个结果和情报学的10个类目分别进行逻辑“与”运算,由此得出图书馆学类目与情报学各个类目交叉的情况,再用图书馆学第二个类目图书馆管理与情报学10个类目进行“与”运算,得出图书馆管理与情报学各个类目交叉的情况,依次下去,做成统计表,纵向为图书馆10个类目,横向为情报学10个类目,从表上可以清楚看出两学科交叉的情况。对各年度都进行类似的研究,可以动态地观察到两个学科的交叉程度增强,也即文[2 ]中得出的两学科逐步同化的结论。
2.3 统计论文的期刊分布
学科的核心期刊研究得已经很多,但确定具体学科下专业或课题的核心期刊的研究很少见到,而在实际研究中,研究人员常常需要了解具体专业或课题的核心期刊。利用《中篇库》可以很方便地提供这项服务。首先检索出某专业或课题的论文数,然后利用刊名检索,检索出该专业下各个期刊的论文数,再分别和课题论文数进行逻辑“与”运算,从而得出每种期刊刊载该专业或课题的论文数。最后按论文数从大到小的顺序,绘出各期刊载文量的直方图,以此得到该专业或课题的核心期刊。实践证明,许多课题相关文献70%集中在直方图上的前20种期刊上,符合布氏文献分布规律。而且该办法非常有实用价值。如资料室在年度订刊时可以用此方法确定本单位研究课题的核心期刊,这样比一味参照核心期刊表订刊更有实用价值。
2.4 统计主题词分布频次
统计主题词分布频次,可以研究学科的核心期刊。首先对照该学科的主题词表,对该学科的每种期刊逐一统计出各个主题词在该期刊中出现的频次,最后把该学科各种期刊出现该学科主题词的频次累加、排序,使用本学科主题词频次较高的其核心期刊。
3 统计中应注意的问题
使用《中篇库》进行统计分析,对情报计量分析无疑找到了一条快捷方便之路,但利用《中篇库》统计还存在着一些值得注意的地方。其一,《中篇库》虽然样本量大,但并非每个入编期刊都期期入编,如《情报杂志》就缺少其中的1994年第6期,在统计时, 如果对统计结果会产生影响时,要用手工把缺少的数据补进去。其二,期刊常有改名、停刊、转刊等现象,而数据库中无法反映出这种变化。在统计过程中要考虑全面,如《黑龙江图书馆》后改名为《图书馆建设》,如果不分青红皂白统计出两种期刊、两组数据,岂不怡笑大方!其三,《中篇库》虽然时效性很强,1997年就可以检索到1996年的刊,但须知1996年收录的期刊并不齐全,即数据不完整,因此在统计时,要把这一因素考虑进去。其四,在利用《中篇库》进行情报研究时,要注意以上各种统计方法的综合利用,灵活应用。不能光统计,不分析,要善于运用各种定量分析方法从数据中抽出本质性的东西。其五,统计中要强调实事求是,准确可靠;同时,也要允许误差,当样本足够大时,有些细节是可以忽略不计的,但必须保证在一定的精度以内。此外也由衷地希望《中篇库》在今后更新数据库时能提高数据的准确性和全面性,多增加一些检索字段,如作者单位、引文。为情报研究创造更好的条件,使《中篇库》不仅具有一般的检索功能,还有较强的统计功能。