三种中文引文系统的分析与评价,本文主要内容关键词为:引文论文,三种论文,中文论文,评价论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
Eugene Garfield 创立《科学引文索引》(Science CitationIndexes), 本意想通过引文链将那些可能属于不同领域的文献有机地联系起来,建立一种旨在扩大检索途径的新方法。随着对引文研究的不断深入,引文系统越来越多地用来研究文献利用规律、科学评价、科学预测等,特别是在基础研究领域,引文计量已经成为成果评价中的一个必不可少的手段[1]。
我国引文索引的编制工作起步较晚,80年代初开始研究,到1990年以后开始编制引文索引。截止到1998年,有一种专门引文数据库,二种数据库含有引文系统,本文基于对三种引文系统的应用与评价,提出了发展我国引文系统的几点建议。
1 三种中文引文系统的概况
1)《中国科学引文数据库》(CSCI ):由国家自然科学基金委员会和中国科学院共同资助,中国科学院文献情报中心承建开发。该系统全面参照美国“Science Citation Index”(SCI)的编制体系。
2)《中国科技论文与引文分析数据库》(CSTPC):在中国科技信息研究所历年开展科技论文统计分析工作的基础上,由该所信息分析研究中心和万方数据中心共同开发。
3)《中国学术期刊(光盘版)》(CAJ):由清华大学光盘国家工程研究中心学术电子出版物编辑部与北京清华信息系统工程公司联合编辑制作。它是我国第一个连续出版的大规模集成化、多功能学术期刊全文文献检索系统,引文检索是其中的一个子功能。
表1 三种引文系统基本情况比较
CSCI
来源期刊现582种,1995年前收录315种
学科范围自然科学
年代1989—1997年
出版时间及形式 1995年推出印刷版,1996年推出光盘板
加密情况不加密
操作系统Dos版
更新情况年更新
来源刊中所有中国引文,包括中国人
收录引文情况在国外发表的论文和外国人在中国
发表的论文
数据库数量 1 (论文引文库合二为一)
CSTPC
来源期刊1250种,每年作个别调整
学科范围自然科学
年代论文库1989—1996年
引文库1994—1996年
出版时间及形式 1996年推出光盘版,已上互联网
加密情况加密(加密狗)
操作系统Dos版、Windows版
更新情况年更新
只收录属于来源期刊的引文,即
收录引文情况引文也必须限在1250种期刊之内
数据库数量 11 (年度分库)
CAJ
来源期刊现2720种,规划达到3500种
学科范围自然科学、社会科学
年代1997—现在
出版时间及形式 1996年试刊,1997年正式出版
加密情况加密(卡)
操作系统单机版(Win95)、网络版
更新情况月更新(文史哲双月更新)
收录引文情况所收论文的全部引文
数据库数量 除文史哲双月发行外,其余按月
发行1张光盘
表2 三种引文系统的系统功能比较
CSCI
检索点12个
显示或输出格式4种:浏览格式、题录格式、 综合格式、引文格式
输出形式 可套录、打印
检索功能 单一、复合检索
统计分析功能 有统计功能,无分析功能
CSTPC
检索点引文库有9个检索点
显示或输出格式1种,用户也可自行设计格式,
但用户必须熟悉其格式语言
输出形式 系统只在显示检索结果时可逐条打印记录
检索功能 单一、复合检索
统计分析功能 有统计功能,无分析功能
CAJ
检索点全文检索
显示或输出格式1种(引文检索报告)
输出形式 打印
检索功能 单一检索
统计分析功能 无
2 三种中文引文系统的分析与评价
三种中文引文系统的有关情况见表1和表2。
1)收录的期刊种类和学科范围。CSCI收录期刊为582种,它按照二八规律(即80%的重要文献分布在20%的核心期刊中)遴选了我国3000余种自然科学期刊中较高学术水平和编辑质量的核心期刊,所以利用本库可以查找核心期刊中发表的论文及引文,更重要的是其评价功能,利用其引文数据可评价个人、实验室、学术机构等的学术水平与学术地位,评价期刊质量等。
CSTPC选刊量达到1250种,但是该库的引文也只限于这1250 种期刊,这样势必失去部分重要的引文,这是应设法弥补的一个缺陷。另外,CSTPC较宽的选刊原则,一方面扩大了检索的范围, 另一方面也降低了其作为学术水平评价工具的作用。
上述两种数据库都只针对自然科学,因此,学科的局限显而易见。
CAJ收录的期刊包括社会科学和自然科学, 弥补了我国社会科学无引文索引的空白。而且,它在收录核心期刊的同时,也重点收录了特色期刊,这些特色期刊不属于核心期刊,但在特定的学科中学术水平较高,所以检索这些特定学科的引文情况可以借助于该库。由于一些原因,一部分重要的核心期刊至今仍未收入。据统计,农业农作物类22种核心期刊(根据《中文核心期刊要目总览》1996年8月第二版)就有9种未被收录,如《作物学报》、《植物学报》等一些重要的期刊,直接影响了CAJ收录期刊种类的完整性,其它学科也存在着类似的情况。 重要期刊的未收录直接影响检索结果的查全率,其学术地位评价的功能也被大大削弱。
2)收录的数据年代。CSCI能检索1989—1997年的引文数据, 时间段较长,采用引文数据分析学术影响时能较客观地反映事实。CSTPC 中包含1994—1996年引文库,由于其来源刊种类较多, 一般在检索时与CSCI相互补充。
一般说来,引文库比文献库前期处理工作大得多,所以引文库的出版周期也比文献库长一些。文献库(如重庆中刊库、万方文献库)都是季更新,而引文库却要年更新,CAJ 的引文功能正好弥补了这个时间上的间隔。因为它与现刊同期出版,对于当年或上年的引文检索可以依赖于这一系统。
3)检索方便程度。CSCI到目前为止存于一张光盘, 数据库也是一个大库,如需检索1989—1997年我校刘大钧教授的论文被收录和被引用情况,只需对该数据库一张光盘操作即可完成。而CSTPC分年度建库, 所有的库目前也存在于一张光盘,但是数据库数量达到11个,每次检索需分库进行,给检索人员带来不便。对于CAJ 的引文检索比上述两库麻烦一些,光盘的数量决定了换盘的次数,但是它是检索现刊引文的唯一途径。
4)系统检索功能。CSCI检索功能强大,检索字段多,操作方便, 输出格式多样,使用率最高。但CSTPC 有一个独有的检索字段——“被引作者所在单位”字段,对评价机构学术水平非常有用。CAJ 的引文功能也很方便,并专门设计了引文检索报告,但其引文检索缺少统计功能,需要时只能借助于人工统计。
3 建议与讨论
1)建立不同版本和平台, 满足不同用户的需要, 包括万维网、 Online、Internet FTP、CD-ROM、书本式等。我国的引文系统主要都是光盘版,CSCI在1995年曾经有书本式出版,1996 年停刊。 CSTPC 作为Chinainfo的一个子库,可以通过网络查询。SCI在书本式、光盘版的基础上,1997年又推出了the Web of Science,使许多上网用户很方便地进行检索,而且对检索到的资料可以连接到在线联机公共目录系统查找原始文献。
2)检索所有被引用的作者或前几名作者,而非仅仅是第一作者。 目前国内引文系统只能检索被引用的第一作者,SCI 的光盘版和书本式中也只能检索到第一作者,但是在the Web of Science中已经能检索所有被引用的作者。
3)出版中国科技期刊引文报告。美国科技信息所(ISI)将各期刊的引文及引文索引资料加以整理、分析生成的期刊引文报告(JCR )能给用户提供各期刊的详细评估资料。目前国内还没有一个动态评价期刊质量的工具书。中国科学院文献信息中心准备利用CSCI研制出版《中国科技期刊引文报告》。
4)引文数据库学科范围不断扩大,建立社科引文系统。 美国引文数据库包括科学引文索引(SCI)、社会科学引文索引(SSCI )和艺术与人文引文索引(AHCI),囊括了自然科学和社会科学的各个方面。而国内的引文索引主要针对自然科学,只有CAJ 中有对社会科学的引文索引,但这不是专门的引文库,引文功能既不方便又费时。国内在对自然科学引文索引积累经验的同时,应开始社科引文系统的研制。
5)增强数据处理能力,加快更新速度。SCI每月更新,其1997年推出的网上引文检索已达到每周更新,确保用户了解最新的研究动态。而国内的引文库,如CSCI为年更新,数据滞后时间相对较长。
6)进一步提高数据库的质量, 提供更加全面的引文查询和统计分析服务。我们用CSCI和CSTPC对收录论文情况进行检索时, 发现这两个库机构名的规范都不够彻底。例如,利用CSCI查“中国农科院各所的论文情况”时,必须查“中国农业科学院”和“中国农科院”两个关键词。所以要全面提高数据库的质量,首先必须加强数据加工过程中的质量控制,加强人名、地名、机构名和数据规范化建设。CSCI还应增加“被引作者单位”字段,CSTPC不仅需要追溯引文数据收录年限, 而且应该大力改进该系统的检索软件性能。另一方面,这两个引文系统都要进一步完善数据库的统计分析功能,提供更为广泛的统计分析数据。