基于协作模式的引文数据库开发策略_用户研究论文

基于协作模式的引文数据库开发策略_用户研究论文

基于合作模式的引文数据库发展策略,本文主要内容关键词为:引文论文,策略论文,模式论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

引文分析方法是利用各种数学和统计学的方法以及比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用或被引用现象进行分析,以揭示其数量特征和内在规律的一种文献计量研究方法。美国的《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)和《艺术与人文科学引文索引》(A&HCI)就是利用引文分析思想编制的引文数据库产品。SCI、SSCI、A&HCI以其独特的引证途径和综合全面的科学数据,通过大量的引文进行统计后得出某期刊某论文在某学科内的影响因子、被引频次、即时指数等量化指标来对期刊、论文等进行排行,成为世界上著名的科研绩效评价工具。美国SCI等引文数据库产品的推出引起了世界各国的重视,并在很多国家和地区得到了广泛的应用。20世纪80年代以来,我国也适时开展了科学评价理论的研究和实践。1991年,中国科学院文献情报中心研制成功《中国科学引文索引》,后更名为《中国科学引文数据库》(CSCD);1999年南京大学中国社会科学评价研究中心开发了《中文社会科学引文索引》(CSSCI);1999年中国社会科学院文献中心开发了《中国人文社会科学引文数据库》(CSSCD)。此外,中国科技信息所推出《中国科技论文与引文数据库》(CSTPCD),重庆维普公司推出了《中国科技论文引文数据库》,清华同方公司推出了科学文献计量评价系列数据库。以上的引文数据库产品中又尤以CSCD和CSSCI较为出色,CSCD是自然科学引文库代表,目前是中国科学院院士推选人指定查询库,自然科学基金委国家杰出青年基金指定查询库,自然科学基金委资助项目后期绩效评估指定查询库等[1]。CSSCI是社会科学引文库的代表,其来源期刊的选刊原则透明,程序公正,教育部社政司直接指导,全国人文社科专家广泛参与,它不仅为社会科学工作者从事科学研究与科研管理提供了快捷、便利的查询工具,而且为我国社会科学研究评价提供了基本工具和基础数据。目前CSSCI在人文社会科学研究领域的项目评审、成果评价、基地评估等方面发挥重要作用,教育部已正式启用CSSCI作为重点研究基地评估、申报的依据之一,许多高校已启用CSSCI作为文科教师科研评价的依据[2]。

毋庸讳言,尽管我国的引文数据库产品建设发展较快,并出现了CSSCI、CSCD这样的优秀代表,但与国外的引文数据库产品SCI、SSCI和A&HCI相比,我们引文数据库产品建设起步迟,研发力量分散,数据库产品本身也存在一定的不足。我们应正视这些不足,并积极应对,使我们的引文数据库产品达到或符合国际标准,融入世界引文评价体系。

2 国内引文数据库产品的不足分析

2.1 引文数据来源存在局限,影响了引文库部分评价功能

期刊论文中的引文是引文数据库的根本。论文引文的规范与否直接影响着数据库的论文的质量和整体评价功能。但目前国内引文数据源存在如下的问题:

·引文缺省:由于我国期刊存在着编排规范不统一的现象,与国际期刊编排规范有一定的差距,部分编者只重视论文本身的创新性,不重视引文的规范,对作者投稿的引文不作要求,有时为了节省篇幅,会删除作者的文后引文,社会科学类的期刊在这方面表现得比较明显。CSSCI来源刊《战略与管理》即为此例。

·引用项目不全:引文著录项的疏漏是许多期刊论文的通病。计算机网络技术的发展,给作者阅读文献、查找资料等带来了方便,但也往往带来某些问题,部分作者对于引用网络转载的资料时,贪图省事,直接抄录,不加核实,引用项目多有不全和缺漏。以CSSCI为例,2002年引文库中著录网址的引文有1000多条,其中大部分引文只有网址,无引文篇名、责任者说明和存取时间。

·引用误差太多:由于论文作者不严谨,在论文引文中常出现引用错误,著译者姓名、题名、书名、出版年、期刊的卷号和期号,以及页码等与原文献不符的情况时有发生。有些论文作者在写作中为了提高自己论文的档次,有抄袭引文的现象,特别是抄袭外文资料引文。由于“转引”的存在,若一篇被引用文献由于引用错误或印刷错误,以后又被许多引用者重复引用,就形成了引文误差现象[3]。

2.2 部分引文数据库产品生产周期过长

由于论文的引文著录的不规范,存在着不同的著录样式,这给引文的自动标引带来困难。尽管许多刊物论文都有电子版本,但是在国内引文数据库建库工作中多是采用手工标引、重新录入,多次校对的方法,工作量较为繁重。这导致我国部分引文数据库产品生产周期长,许多引文数据库生产周期达一年,这在一定程度上影响了引文评价的效率[4]。目前,大多数引文数据库生产者已认识到这种局限,采取多种方式缩短加工周期。例如CSSCI对加工好的数据及时在网上公布,率先实现了2003年数据在半年内加工完成的目标。但其他引文数据库还没有实现或者还没有迹象表明它们已缩短了加工周期,许多引文数据库生产者由于体制或其他原因,确实是心有余而力不足。对照国外的引文数据库产品SCI、SSCI和A&HCI,从论文出版到被收录,其生产周期一般在一个月之内,长的不超过三个月。因此学习国外经验,改进标引工作,提高管理效率,缩短生产周期需要进一步得到重视。

2.3 基本上不支持“引文链接”

引文数据库产品的一个重要功能是信息检索。“引文链接”是由传统的信息检索服务向知识服务转变的一个十分关键的功能环节,它对信息资源的知识网络的形成有决定性的影响,而且是实现知识挖掘、发现、知识管理的基础。目前,国内的主要引文数据库产品大多不支持“引文链接”,而美国的SCI、SSCI和A&HCI等产品可以与全球18家出版社4000多种期刊建立全文链接,通过ISI Document Solution可以直接在网上订购全文,开展文献传递服务,在我国境内,Web of Science已经实现了为中国用户所使用的INSPEC、HORIZON、SIRSI、南京汇文等多种OPAC系统的链接。授权用户只需点击在Web of Science、Current Contents Connect等数据库中文献记录中的“Holdings”按钮,即可链接到该机构的OPAC系统中,找到该篇文献所在期刊的馆藏记录[5]。

2.4 引文产品市场小,影响低,检索功能有待完善

我国的引文研究还是异常活跃的,引文数据库产品也较多,但是引文研究力量分散,各引文数据库的产品很多局限在行业内部,例如CSCD主要用在科学院系统,CSSCI主要用在高校系统,CSSCD主要用在社科院内部。总的说来,引文数据库产品市场占有率普遍较小,影响也较低。究其原因,上述产品的出现与美国的SCI、SSCI和A&HCI等产品不同,SCI等是民间自营性产品,而国内的引文数据库的研发多数离不开各自行业主管单位的资金支持,产品出现之后由于有了行政影响下行业市场的基础,对外部市场考虑较少,更谈不上专门开展营销活动了。此外与国际上的大型检索工具相比,国内的引文数据库都缺少“引文关键词”或“引文主题词”检索字段,而“关键词”往往是用户检索专题文献的主要人口。不同检索字段间的逻辑运算功能(如逻辑“非”的运用)也有待加强,引文数据库产品检索效率有待进一步提高。

3 引文数据库发展中的三大合作策略

3.1 引文数据源的质量控制及全文服务:与编辑部的合作

3.1.1共同宣传和推广稿件的匿名专家评审,提高引文库的评价权威性。

引文数据库不仅仅有信息检索功能,它还具有评价功能。评价作用的大小与引文数据库所用的来源期刊大有关系,来源期刊不同,引文数据库的评价作用亦不同。在我国,入选引文数据库的大多数来源期刊没有实行国际权威杂志通行的匿名审稿制度,刊载论文质量的高低受编辑影响大,这在一定程度上影响了引文数据库的评价权威和市场推广。因此引文数据库生产者应积极向期刊编辑部开展宣传,提倡匿名专家评审,避免人情稿,达到稿件录用程序的公正。高质量的来源期刊必将为引文数据库的学术评价打下坚实的基础。

3.1.2共同开展引文注释规范控制,提高引文质量

高质量的引文注释需要论文作者有较高的写作素质,编辑部在稿件录用中的规范控制有助于作者提高这样的素质。规范化的引文注释体现出作者对他人劳动的尊重,为自己的研究定位;交代本项研究的学术史;为学术评价提供基础等。引文数据库生产者针对所用来源期刊要进行引导,引导编辑部在编辑稿件的过程中,提高对文后引文的重要性认识,绝不能可有可无或限制引用数量,对参考引用文献的核对,不但要核对内容,还要核对格式。如果由于外语水平、专业知识和检索能力所限,无法发现引文错误,可以聘请专家顾问来解决。针对论文投稿人的引文素质不高的问题,可以与编辑部共同开展读者培训,避免引文项目不全和引文误差,如伪引、漏引、错引等,提高引文质量。

3.1.3合作开展全文链接或全文传递服务。

期刊编辑的电子化使得编辑部拥有刊载论文的电子全文,来源期刊编辑部同时又是引文数据库建设者就全文服务与论文作者开展版权对话的较好中介。引文数据库与来源期刊开展全文链接和全文传递服务可以大大提升引文数据库的信息服务能力,用户在引文数据库查到的不仅仅是文献线索,而且可以在引文文献中直接点击浏览该文献的参考文献全文,逐层追溯,直至源头,这对真正掌握知识信息内容的全面发展状况,实现知识创新的目标具有巨大的推动作用。国内的CNKI已经开始了这方面的尝试。

3.2 引文数据库建设中的合作建库:与相关机构或专业数据服务商的合作

前文提到,在引文数据库建库的标引工作中,多是手工标引和校对。为尽可能保证数据质量,数据从原刊的标引到建成数据库,要经过多道流程。以CSSCI录入与校对流程为例,先后经过:(1)对原刊的每篇论文进行标引;(2)计算机录入,输出打印稿,标引人员校对,录入人员修改;(3)根据原刊及打印稿二次修改校对;(4)分批次对来源期刊的论文作者、篇名、机构、关键词、分类以及引文的作者、篇名、出版物名称等进行校对;(5)全年数据汇总逐项校对[6]。这个过程需要投入大量的人力和精力。国内的各个引文数据库的建设基本上是单打独斗模式,主要依靠自己的力量从事着类似CSSCI的数据制作过程。这个过程如果控制得好,其引文数据库的质量就高,就会得到用户的肯定。数据制作质量是引文库的根本,但只重视质量,不进一步缩短周期也影响引文库的评价效率。能否在保证质量的前提下,改进数据制作方式,变数据制作的单打独斗为合作建库,从而缩短引文库的生产周期呢?笔者认为,这种以合作建库提高数据质量和缩短加工周期的形式是可能的。

首先,国内的引文数据库尽管来源期刊各不相同,但其数据制作的方式存在很多共性,标引、录入、校对是必不可少的环节,它们之间存在合作的可能,如果考虑到彼此的竞争因素,那么互补型引文库产品的合作建库可能性更大一些。其次,数据制作也是文献情报及其协作机构的专业技能。文献情报及其协作机构拥有长期从事信息标引的基础和专业的标引编目人员,国内的主要引文数据库的研发始于专业文献情报机构构想,后逐渐独立。考虑到以前的背景,这种合作应进一步得到拓展,如果数据量很大,可以寻找一家规模更大的文献情报机构或全国性协作机构进行合作。再次,可以考虑与国内的专业期刊数据服务商的合作,例如万方数据公司、重庆天元公司、清华同方公司等在建设电子期刊库过程中积累了一定的经验,形成了一支专门的建库队伍。以上服务商有的具有情报服务的专业背景,标引人员专业,速度快,数据质量高。

基于以上类型选择合作建库伙伴,一方面可以避免建库工作中的重复劳动,减少资源浪费,另一方面,引文库的研发或评价中心可以将更多的精力和人力集中到引文分析研究和学术评价中来,增加引文检索的主题途径或关键词途径,进一步开展社会检索和评价服务。这种建库合作应该是一种强强联合,充分利用对方的长处缩短引文数据库的加工周期;提升引文数据库检索质量。

3.3 引文数据库销售中的合作营销:与专业数据服务商或互补型产品的合作

引文数据库的成功标志在于用户愿意去使用,市场占有率的高低是一个不容回避的问题。在国内由于多家引文数据库产品的存在,在不断提高引文数据库质量的前提下,对引文数据库的营销也是必要的。国内的主流引文数据库产品目前大都不是独立的商业机构运作,它们一般隶属于研究中心或文献情报中心,例如CSCD、CSSCI、CSSCD等,它们都是不属独立法人的信息服务机构或评价机构,重在研究与开发,没有专门的营销队伍,因此在市场销售中可以采取合作营销的方式。

合作营销又称联合营销。它是指企业与企业或企业与机构之间通过合作的方式,共同研究市场、开拓市场、进入市场、占有市场。它的优势在于:可以共享市场,扩大规模锁定顾客或用户;可以整合营销资源,如市场信息的获取能力,投入市场销售的财力、物力、人力,产品价格、品牌形象、分销网络、分销渠道、社会关系、营销经验、管理水平等。合作者各有一条销售渠道,整合之后,就可以变为多条销售渠道,收到1+1等于2或者1+1大于2的效果[7];此外可以叠加优势,降低成本,提高产品的竞争力。通过合作可以把不同产品在营销活动中的各种相对优势和长处进行叠加,实现取长补短、扬长避短、提高效率、降低成本的功能。例如,可以将各自在市场定位、产品定价、广告宣传、人员推销、渠道管理等环节的成功经验和做法进行交流、推广,甚至可以直接克隆、翻版,在营销活动的每一个环节上都采用内部的最优模式,最大幅度地提高营销效率、降低营销成本,从而使合作者依靠高效率和低成本赢得更多的市场份额[8]。

3.3.1互补型引文数据库产品的营销合作。

互补型产品合作指在相同的市场上推出精心组合的产品,可以进行功能组合和品牌组合。例如国内很多研究机构或大学院校多是综合性的,它们既需要自然科学引文产品,也需要人文社会科学引文产品,因此CSSCI与CSCD由于功能上的互补,可以合作营销,占领共同的市场,在服务项目的推广上也可以开展项目合作,最大限度地满足用户的需求,扩大产品的功能空间,方便用户的查询和使用,提高产品的附加值,这种组合可真正产生1+1大于2的效应。

3.3.2引文数据库与专业数据服务商的营销合作。

国内的专业数据服务商(如万方数据公司、重庆天元维普数据公司、清华同方公司等)拥有专业的销售队伍,其在销售渠道设计、渠道决策、广告促销、人员推销、与客户的公共关系方面都积累了相当的经验,引文数据库在销售中可以选择与这类专业数据服务商的合作,将自己的产品借助对方的销售渠道推向客户市场。引文数据库的研发不可能永远依赖有关部委专项资金的支持,营销的成功有助于产生经济效益,保证引文研究工作的进一步深入,从而形成象SCI、SSCI、A&HCI一样的良性循环。从专业数据服务商角度来看,它们也愿意与引文数据库开展营销合作,这样可以提升自己的服务档次,吸引更多的用户来关注它们的产品。

4 合作中应该注意的几个问题

4.1 坚持以用户满意为中心

“以用户满意为中心”,人们往往容易想到完备、周到的售后服务,但笔者认为让用户满意首先要从提供满意的产品开始,用可靠的质量满足用户,拓宽产品系列,丰富用户需求。由于引文数据库不仅具有信息检索的作用,而且具有一定的科研绩效评价功能。要想赢得用户的信赖,质量是产品的生命线,快速便捷,服务全面是产品的助推器。无论是规范控制、合作建库、合作营销,更好地为用户服务是一切合作的核心,如果撇开用户谈合作,只能是本末倒置,终将受到用户的唾弃。

4.2 慎重选择合作伙伴

利用合作方式发展引文数据库的目的之一,就是利用合作方的力量和合作方协力提高数据库产品的质量,扩大市场,以协同创造竞争优势。因此,合作的资源贡献能力是合作方在进行合作决策时要重点考虑的问题。理想的合作者应能对双方起到补缺的作用,如果双方能在产品质量、技术、市场营销资源或用户服务等诸方面互补时,合作成功的机会就会增大。这就要求合作前引文分析研究评价机构严格考察和甄别每一个潜在的合作伙伴,切忌匆忙选择合作对象。同时,应寻找那些与评价机构具有共同服务理念和协作精神的伙伴。此外,还要考虑合作者的财务状况和组织结构是否稳定,经营者管理水平和创新能力如何。

4.3 保持合作双方的独立性

合作不是兼并。合作是为了更好地发展。这种合作不是指合作各方在企业或机构整体层面的共同运作,而是仅限于实体内部职能的合作。通过合作双方之间的信息共享、技术互助,资源互补、达到协同发展。合作过程中,合作双方应保持各自实体上的独立性。即主体独立自主、行使自己支配自己的权利的能力,包括对产品的定位,研发投入,人员安排等。

标签:;  ;  

基于协作模式的引文数据库开发策略_用户研究论文
下载Doc文档

猜你喜欢