《中国人文社会科学引文数据库(CHSSCD)》的建设、应用与发展,本文主要内容关键词为:引文论文,中国论文,社会科学论文,人文论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 《中国人文社会科学引文数据库》的建设
引文索引通过文献的引用和被引用关系将属于不同领域的文献有机地联系起来,不仅是一种扩大检索途径的新方法,而且可以反映出学术研究中的继承和借鉴。
引文索引思想最早在1955年由美国学者加菲尔德提出。在他的主持下,美国科学信息研究所(ISI)于1963年研制成功了《科学引文索引》(SCI)。《社会科学引文索引》(SSCI)和《艺术与人文科学引文索引》(A&HCI),也于1973年、1978年相继出版。引文索引的产生推动了文献计量学方法的多方位研究与应用。经过二三十年的发展,引文索引已经成为评价一个国家、一个地区、某个单位以至个人科研水平的极为重要的工具,受到全世界科研人员的广泛好评和欢迎。
1990年,中国科学院文献情报中心率先研制我国自己的科学引文数据库,经多年开发、研制,终于在1996年,首次在国内推出基于引文索引理论和方法的“中国科学引文数据库”光盘版(Chinese Science Citation Database,简称CSCD)。与此同时,在科技界致力于用现代信息技术进行科技文献计量和科学计量研究的另一个重要机构——中国科技情报研究所也成功建立了中国科技论文统计数据库,并在此基础上研制出引文数据库。
由于人文社会科学较之于自然科学、工程技术有着许多自身的特点,社会科学的复杂性,我国社会科学期刊及论文的严重不规范性,并由于技术、人力、财力等各方面的困难,我国社科界对论文统计数据库和引文数据库的研制和建设,起步比科技界晚了许多年。
为了推动人文社科领域中科学计量研究工作的开展,中国社会科学院文献信息中心于1996年开始进行社科期刊论文的量化分析研究和相关的理论方法研究。通过完成国家社会科学基金资助的国家“九五”重点项目《中国人文社会科学论文统计与分析研究》,建立了社科论文统计分析数据库。在建库过程中,由于国内社科期刊数量大、地区分布广,特别是社科期刊大部分论文规范化和标准化差,缺少许多统计要素,诸如论文的著者单位、职称、年龄、基金资助项目,课题组为此投入了大量的时间和精力,同全国有关期刊编辑部联系,增补论文统计要素并对每篇入选期刊论文进行规范加工和整理。国家新闻出版署期刊司为该课题推行标准化提供了大力支持,并为征刊信加了按语。在期刊论文规范和社科论文计量研究方面,社科论文统计分析数据库的建设为引文数据库的建设创造了条件和积累了经验。
1999年,中国社会科学院文献信息中心与中国学术期刊(光盘版)电于杂志社签订了《中国人文社科文献计量评价研究项目》的合作协议,由于优势互补的联合,数据库建设体现了加工量大,加工速度快、数据规范质量高、相对成本低的特点。
《中国人文社会科学引文数据库》(2000版),在系统设计及程序编制中,吸取了《中国科学引文数据库(CSCD)》建设的成功经验,充分考虑了社会科学文献的特点,系统功能比较完备,具有良好的可操作性。该数据库采用先进的数字化加工模式和多种数据规范控制手段,在较短的时间内,解决了社会科学文献不规范的许多疑难问题,使该数据库的数据质量达到了较高水平。
现已推出的《中国人文社会科学引文数据库》(2000版),是中国科学文献计量评价数据库ASPT系列光盘中的重要产品,是迄今为止我国规模最大的人文社会科学引文数据库,其中收录论文记录13万条,引文记录35万3千条,16万多条基金、作者、机构等相关条目,学科范围涉及哲学、政治、法律、经济、文学、历史等重要领域;收录1999年从全国3000多种人文社会科学期刊中选出的793种重要学术期刊,其中包括核心期刊467种。它基本上反映了我国人文社会科学论文的学术水平和学术期刊的发展状况,是我国社会科学文献检索和文献评价研究的重要信息基础,成为我国人文社会科学文献计量和引文分析研究的重要工具。
《中国人文社会科学引文数据库(CHSSCD)》主要从来源文献检索和被引文献检索两个方面向用户提供信息。来源文献的检索途径主要有:论文作者、篇名、作者机构、作者地区、期刊名称、关键词、文献分类号、学科类别、基金资助等项目。被引文献的检索途径主要有:被引文献、被引作者、被引机构、被引期刊等。它将以文献计量的方法,通过系统自动生成统计排序,客观地反映我国社科研究中作者、机构和地区发文情况、作者的被引情况、论文的被引情况、期刊的被引情况、出版社的被引情况以及期刊影响因子等等的统计分析报告,据此定量地分析与评价我国人文社科研究机构、高校、地区和个人的科研产出能力、学术成果及学术影响力。
2 《中国人文社会科学引文数据库》的应用
《中国人文社会科学引文数据库》汇集了丰富的学术信息,反映了我国人文社会科学研究的成果,对建立我国国家级中文数字资源平台具有重要意义。它不仅从文献之间相互引证的关系这一角度,提供了一种独特的检索途径,而且可以有多方面应用:
(1)用于研究和改进图书情报工作。图书情报部门通过分析期刊(或论文等其他文献)的被引率、被引频次、影响因子、自引率和半衰期,以此评价学术期刊(或论文等其他文献)的影响力、使用情况,从而可以确定核心期刊,确定文献情报源收集和保存的最佳策略,合理使用有限的资金和存储空间;另一方面,通过对引文的统计分析,可对情报用户的需求特征、文献利用特点和文献信息流通状态、文献信息选择与整序的理论方法进行研究,为读者确定重点文献,加强文献报道和读者导读工作。
(2)用于期刊业管理。80年代中国期刊业蓬勃发展,期刊数量庞大并逐年递增,而个体质量良莠不齐。按发文量、被引频次、影响因子对期刊进行公开选优排序,可增强社会对核心期刊、优秀期刊的认识,通过名牌效应引导社会资金、优秀稿件、作者等资源的流向,这有利于进一步优化社会资源配置,有利于期刊业治散治乱和结构调整。这一方法应用于研究机构管理和评价,也将产生优化科研资源配置的效果。
(3)用于科学学和科学史研究。通过发文量和引文的分析,可以了解某一学科的研究动态、发展情况,以及该学科的核心作者群。可以根据某一名词、某一理论的出现时间、出现频次、衰减情况等分析和揭示学科研究的基本走向、学科的交叉渗透,还可以依此延伸出多种的统计分析报告等。
(4)用于科研绩效评价、成果查新,从而提高科研管理的规范化和科学化,可为政府制定科学政策提供重要参考。①用于科研生产力和影响力评价。文献通常因内容新颖、材料权威而获发表或被引用,特别发表在引文库所选收的核心期刊上。因此,各单位、个人发表文献的被引次数可以反映其创新程度和创新能力,在评定职称、申报成果时,以此作为对其科研实力和水平、学术地位及影响的评价指标,有利于形成科学研究的创新机制。利用著者的被引次数指标评价和预测科研人才,已被证明是行之有效的方法。加菲尔德(E.Garfield)等人曾利用SCI1968年的数据成功地预测了1969年诺贝尔奖获得者的人选便是一个有说服力的例证。②用于课题和成果查新。通过文献的引证链追溯某项研究的起源和进展,了解课题的创新程度,可为课题立项提供参考,避免重复研究。③用于科研管理效益评价。将科研产出指标与经费投入对比,可发现科研资源使用效益的高低。
利用引文索引(数据库)的各项指标进行计量评价,用数学方法去探寻科研、文献活动规律,其最大的优点和价值在于它的公正性、客观性和科学性。应用计量评价方法,不是要取代同行评议,而是为定性评价提供科学、客观的评价依据。以计量指标构造科研绩效评价体系,有利于营造更加公正的科研竞争机制,避免以研究机构的行政级别评价研究机构学术地位的高低;由于引文库的建立,强化了论文的写作规范,特别是参考文献的标注,这有利于端正学风,监督学术腐败。
综上所述,《中国人文社会科学引文数据库》在文献计量研究、学科发展预测和科研规划管理、期刊评估、课题查新、成果申报、项目评估、人才选拔、科研院所和高等学校的绩效评价、图书情报工作管理等多方面具有广泛应用前景。
3 《中国人文与社会科学引文数据库》的发展取向
目前该库在系统功能、数据状况等方面与国际著名引文数据库以及市场需求还存在一定差距,需要在以下方面继续做出努力:
(1)研究与应用相结合,注重发挥效益。即加强文献计量学和引文数据库的应用研究,使该库尽快在我国人文社会科学文献检索和计量研究的实际应用中发挥效益。数据库建设不能仅停留在研制阶段和小范围的使用,要边建库边服务,注重宣传推广,及时发布统计信息。除定期编制出版《中国人文社会科学计量指标集》、《期刊引用报告》,还应加强对数据数量关系的深层分析,研究和发掘学术活动、文献关系和科学发展的特点、趋势和规律。利用数据库对全国或地区或学科的学术研究状况分析,发表一系列研究报告,以便为国家、地区、学科的学术发展和规划管理提供参考,对转变研究模式,推动知识创新发挥重要作用。只有通过应用,满足市场用户需要,数据库才可能获得经济效益和社会效益,走上可持续的良性发展轨道。
(2)完善引文数据库来源期刊和核心期刊评价体系。①来源期刊的选定是影响引文数据库质量的重要因素。如果来源期刊的选收范围过窄,会削弱统计数据的可靠性及文献检索功能。笔者认为,来源期刊的选收应综合考虑核心期刊评价指标、学科覆盖面、统计与文献检索需求几方面因素,选收范围在高引文率的核心期刊区基础上适当地扩展。来源期刊数量的取值界限可根据加菲尔德期刊文献集中定律,选定在总引文量的70-80%(降序排列)所对应的期刊群,以便在大范围基础上统计,保证数据更具准确性和可靠性,同时又可兼顾文献检索需要。②关于核心期刊评价指标,目前社科论文的引证率不如科技界高,其规范程度也不及科技论文,在评价和确定引文库的来源期刊或核心期刊时只靠引文量、影响因子指标还不够,需要以论文的摘引率和专家评估为其佐证。因此,有必要多次召开专家座谈会,包括向管理部门、研究人员和期刊编辑部征求对选刊的意见;同时,制定文摘统计源选取标准和文摘划等加权标准,建立文摘统计数据库,对核心期刊的选定进行动态管理,定期调整。
(3)数据加工的规范与管理优化。即健全和完善各项数据规范标准和规范文档,优化操作,提高加工的自动化程度,以便保证数据质量和提高工作效率。由于人文社科文献有些原始数据著录不规范,项目要素存在误差和残缺,数据内容不够详实等原因,可能造成引文库的某些检索结果正确率不高。因此,需经常与期刊编辑部和电子数据提供方加强沟通,从数据的源头控制不规范因素的发生;同时,对不规范问题进行分析、归纳,完善一系列数据规范标准。目前已在《中国学术期刊(光盘版)检索与评价数据规范》基础上,针对各个字段可能出现的不规范现象编制了更有针对性和可操作的著录标准;建立了用于自动校对或辅助校对的规范文档,包括:名称规范文档、分类与主题参照文档、各字段自动校对文档。这些规范需要参照国家颁布的标准、权威工具书和国家图书馆建立的具有准权威性和通用性的规范数据库,经常维护更新,特别是在用户的使用过程中发现问题,及时改进。
(4)本土化和国际化相结合。一方面,研究文献的中国本土特点和人文社科的学科特点,在系统开发、选刊、数据规范等充分考虑和体现本土化和人文社科特点,例如:考虑检索系统如何解决中文繁体字,台港澳地区的期刊文献是否应纳入引文数据库来源期刊的范围,古籍多卷本的数据如何规范和统计等等。另一方面,努力与国际先进的文献计量方法和引文数据库接轨,实现我国社科引文数据库的国际化。
美国科学情报研究所(ISI)的三大引文索引是当今世界公认的最权威的引文索引,ISI Web of Science 是这三大索引的网络版数据库,它具有数据库规模大,信息综合全面,集成度高,基于WEB检索,功能强大的特点,它的支持软件ISI Web of Knowledge采用“一站式”信息服务的设计思路。通过ISI Web of Knowledge,即可由同一平台迅速检索各种不同信息资源,不但能检索被引用的参考文献(Cited Reference)、文献被引用次数(Times Cited)、相关文献(Related Records)、共同引用(Co-Cited)、来源文献,而且可以利用作者地址查找某一特定研究领域的研究机构;可以与原始文献全文电子版、图书馆OPAC系统、基因/蛋白质信息、技术专利等多种高质量信息资源实现基于内容的无缝链接;可以通过ISI Document Solution直接在网上订购文献全文。ISI引文数据库的特点和设计思想值得我们学习和借鉴。
《中国人文与社会科学引文数据库》应根据网络用户发展的需要,尽快开发数据库网络版,在数据库系统功能上采用“一站式”信息服务的设计,既具有引文检索机制又有强大的跨库交叉检索能力,将来源于学术期刊、研究基金、网站的资源及其它各种高质量信息资源整合在同一系统内,提供多个领域的高质量的学术信息,兼具知识的检索、提取、管理、分析与评价等多种功能,从而大大扩展和加强信息检索的广度和深度,使各个学术领域的渊源、变化、动态、走势及应用情况尽在掌握之中。
此外,加大数据的年代跨度,缩短数据更新周期,提供友好的用户界面和检索灵活、满足个性化需要的系统设计,如灵活的检索时间跨度,检索时间跨度可锁定在一定的时段,可选择检索最近一星期或四星期的内容,还可以对某一年度以及全部订阅年份进行检索。
总之,我国的引文数据库库应朝着网络化、综合化、本土/国际化、智能化方向迈进,为中文数字资源建设,为推动科学研究与管理的发展以及文献计量学的研究与应用做出贡献。
标签:中文社会科学引文索引论文; 规范分析论文; 文献检索论文; 文献论文; 核心期刊论文; 人文社科论文; 中国社科院论文; 论文研究方法论文;