试论电子印本文库的功能,本文主要内容关键词为:印本论文,文库论文,试论论文,功能论文,电子论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着计算机及Internet的日益普及,科学交流的形式发生了巨大的变化。尤其是科学交流的非正式过程,以其固有的优点如具有最短的情报间隔时间、具有高度的选择性和针对性等[1],在网络环境下正显现出无比强劲的发展势头。电子印本文库即为网络环境下一种有效的非正式科学交流系统。
电子印本文库是一种促进研究成果及时发布的网络学术交流平台,它通过作者自存档方式收集各种形式的学术论文的电子版本,经由互联网提供全球用户开放存取,并利用《开放存取计划》实现系统互操作,向信息增值服务提供商提供所收录电子印本的元数据记录,使其能够基于元数据开发各类信息增值服务项目。[2]乔冬梅下的这个定义较为详细地指出了电子印本文库的功能、实现方式及增值服务模式,但将增值服务模式也作为定义的一部分,似乎有些不妥。我们认为:电子印本文库就是通过作者自存档(selfarchiving)方式收集并存储有各种形式的电子预印本(pre-print)和后印本(post-print),向全球用户提供开放存取服务的在线数据库。
网络环境下,电子预印本取代了传统环境下以纸张为载体的预印本。它继承了纸质预印本的非正式科学交流功能并极大地增强了这一功能。电子印本文库则集成了众多的电子预印本,为电子预印本交流提供了一个开放、可靠的平台。依靠电子印本文库,预印本交流的效果有了显著的提高。随着建设理念和技术日趋成熟及影响力的不断增长,电子印本文库除了拥有最基本的促进预印本交流的功能外,它的功能也延伸和扩展到了众多方面,包括改革传统学术交流模式的功能、提升学术影响力的功能、保存科研智力产出功能、实现全球范围内科研资源共享的功能等。
1 基本功能——促进预印本交流
传统环境下,科学交流可以分为正式和非正式两个过程,而非正式科学交流过程由于其固有的一些优点为广大科研工作者所青睐。利用预印本进行非正式交流是比较常见的做法,如科学家将论文手稿在正式刊物上发表之前,会将论文预印本以各种方式分发给其他同行以获取宝贵的意见;会议主办机构在会议召开之前,也会将会议论文预印本事先分发给与会代表;等等。
这种预印本交流针对性极强,参与交流的学者局限在一个小圈子里,即所谓的“无形的集体”之中,交流的范围是相当狭窄的。为了扩大交流的范围,就势必要增加这一“集体”的成员数量。一旦此数量达到临界极限,由于应当分发的文件数量增多,这种渠道就不再能用有限的费用去保证足够迅速地传递科学情报。于是,“无形的集体”就会解体,而为了传递在其内部交流的科学情报,就会出版新的杂志。[1]在这种情况下,预印本的非正式科学交流功能是极为有限的。也因此,J.M.齐曼指责道:“关于发展‘交换预印本’的建议,即打算把这一自发的过程变为行之有效的机构的建议,是绝对错误的。建议的设想是这样的:每一位作者把手稿的打字本寄给某中心,在那里把手稿复印出来散发给一切有关人士。”[3]
今天,重新审视一下J.M.齐曼所指责的所谓的建议,可以发现,这一建议实际上已经付诸实践并已有效地运行了十几年(如果把1991年Paul Ginsparg创建arXiv伊始看作是这个建议付诸实践的话)。这一建议的实践是这样的:科学家将论文的电子版本以各种方式(如E-mail、ftp、WWW等)提交至电子印本文库(如arXiv.org),在那里论文的电子版本可免费地供一切有关人士浏览、获取。
作为预印本交流平台的电子印本文库,至少在以下两个方面取得了较大的成功:
第一,预印本交流的范围。电子印本文库的建立使得预印本交流第一次可以如此便捷并且如此大规模地进行。它为全球的科研工作者提供了一个开放的学术交流平台,任何人任何组织机构都可以平等地参与这个过程。如果说早期的预印本交流只局限在狭小的“无形的集体”之中,那么电子印本文库则使得这一“无形的集体”变得巨大无比,全球的科研工作者都是这一集体的组成人员,预印本的非正式科学交流功能正变得越来越强大。事实也证明了这一点。自2000年初到2004年底,arXiv共收到来自113个国家与地区的论文提交[4],这一数字还在增大。
第二,预印本交流的透明化。传统环境下,预印本交流处于相对隐蔽的状态。电子印本文库的建立使得预印本交流从相对隐蔽逐渐转向相对透明,这主要表现在两个方面:首先,电子预印本本身是对外界透明开放的。电子预印本一旦上传到文库,就可以免费地供任何人浏览、获取、评价等,不会因为身份等条件的不同而有所限制。并且,电子印本文库对每个提交的预印本都赋予唯一的标识加以保存,用户通过此唯一的标识即可获取该预印本。这一举措也增强了预印本的透明度。其次,交流的过程是透明的。作者一旦提交预印本后,便不可避免地要接受其他用户对文章的评价,作者可以对这一评价做出回应并适当地对预印本做出修改,系统对修改后的预印本也会自动给予标识。所有这一系列的过程都是公开进行的,用户可以获知交流的每个细节。
值得强调的是,俄罗斯情报学家米哈依洛夫所认为的“既然在定义上是非正式,就不可能成为特有的或严整的”的观点,抛开米氏对科学交流正式与非正式过程加以区别的局限性,仍然是正确的。电子预印本没有经过严格的同行评审,所执行的仍是非正式科学交流的功能。虽然电子印本文库促进了预印本交流,使得预印本交流的效果有了一个很显著的提高,但无论如何,电子印本文库都没有改变电子预印本非正式科学交流的实质。盲目地夸大电子印本文库的此项功能将有可能导致整个科学交流系统的巨大损失。
2 扩展功能之一——提升学术影响力
与商业出版领域的作者不同,科研工作者发表论文并非出于经济目的,而是为了最大限度地提升自己在学术界的影响力。[5]电子印本文库较好地满足了此类需求。
科学家的学术影响力首先来自于对科学发现优先权的确认。科学发现优先权是指科学共同体对科学家所做出的独创性发现所给予的承认。[6]科学家力求在第一时间内将成果公之于世以获取科学发现的优先权,而传统的期刊并不能满足这一要求,这主要是因为期刊发表的时滞性所造成的。科学家要达到这一目的,必然要寻求其他的途径。电子印本文库即为网络时代的有效途径之一。电子印本文库的开放交流机制使得科学家的成果能够在第一时间内为业内学者所知晓,并且能够提供有力的证据来佐证科学发现的优先权。
学术影响力的提高其次来自于论文的更大范围传播及被引用。网络环境下,科学家除了以在传统期刊上发表论文的方式传播自己的研究成果外,也乐于将文章放到网上供他人开放获取,以尽可能地扩大自身的学术影响力。这一行为是基于以下假设的:开放存取文章比非开放存取文章影响度要高。对此进行的研究也证实了这一假设。Steve Lawrence通过对可免费获取的计算机科学会议文献的影响因子进行统计,证实其影响因子确实要高于非免费在线获取的文献。[7]Cristina Antelman对数学、电气电子工程、政治学及哲学四个学科的开放存取文章影响力的研究完善了Lawrence的结论。[8]Tim Brody等通过对ISI@CD-ROM*引文数据库(1991年—2001年)中7000份主要期刊及arXiv.org中的物理学文献进行分析,结果表明在物理学领域OA与非OA文章被引用比例高达2.5-5.8。[9]这一比例随学科和领域的不同有所不同,但总的说来,OA文章比非OA文章的影响力要高出许多。
将论文预印本提交至电子印本文库免费供同行浏览、下载,从而大范围地提升自己的学术影响力便是其中的方法之一。由于电子印本文库大多具备良好的系统构架,有专人对资源内容进行管理、维护,且一个以学科为单位的电子印本文库,往往能成为该学科领域交流的集中地。因此,科学家普遍都愿意采取此种方式以提高自己的学术影响力。
电子印本文库除了提供文章的免费浏览、检索和下载机制之外,也采取了多种措施来提高库内文章的能见度以最大限度地提高影响度。如采用元数据收割协议(Open Access Initiative for Protocol Metadata Harvesting,OAI-PMH)。[10]遵循OAI协议的电子印本文库能够以数据提供者的身份被OAI服务提供者收割其元数据或被通用搜索引擎所遍历,用户通过常见的检索途径即可获取预印本资源,这也大大增强了电子印本文库的此项功能。
对于机构而言,学术影响力是评估其综合实力的主要指标之一。与个人情况类似,机构也希望能最大限度地提升本机构的学术影响力。因此,建设机构层面的机构电子印本文库便成为目前诸多大学的通行做法。如加利福尼亚大学的eScholarship Repository[11],MIT的DSpace[12]等。机构电子印本文库与学科电子印本遵循同一理念。所不同的是,机构电子印本文库以机构为单位,一般而言只收录本机构成员的预印本,且涉及的学科较为广泛,资源较为分散,难以形成特色优势。因此,机构电子印本文库要扩大资源被利用率,势必要广泛地开展合作。
3 扩展功能之二——保存科研智力产出
如前所述,机构建设电子印本文库的主要目的之一是为了提升本机构的学术影响力。与此同时,保存本机构的智力产出也是其主要功能之一。
科研机构是智力产出的主要机构,有责任对这些智力成果进行保存。英国下议院科技委员会曾针对高等教育之机构典藏提出过相关报告,并建议所有的机构针对该单位的智力产出,皆应设置一保存机制管理维护。[13]机构电子印本文库即为此种保存机制。由于机构电子印本文库以机构为最小单位,在政策制定和运行模式的选择方面更为灵活。如机构电子印本文库可以以行政方式干预本机构成员对其智力成果的自存档行为,而且机构电子印本文库也拥有较好的经济保障等。拥有诸多优势的机构电子印本文库在保存机构智力产出这一功能上能表现得更为出色。同时,以机构为单位,开展全国范围内的机构电子印本文库合作对保存国家科研智力产出也有着重大的意义。例如e-print UK项目。该项目由英国联合信息系统委员会(JISC)资助,旨在通过OAI-MPH收割机构和学科电子印本文库的元数据以建立一个全国性的OAI服务提供者。[14]
对于学科电子印本文库而言,情况略有不同。此类型的文库除了收集最新的学术文章外,对“历史性资料”进行保存也是其最为有用的一面。对于研究者而言,“历史性资料”是日常研究工作赖以进行的基础。学科电子印本文库保存了过往的研究资料,较好地勾勒出研究变化发展的轨迹,为研究的深入提供了保证。
然而,学科电子印本文库也面临着对库内资源进行永久保存的问题。众所周知,目前一些学科电子印本文库已积累了相当丰富的资源,如截止到2005年年底,arXiv所收录的论文数达到了350453篇[15],这是一笔巨大的财富。一旦学科电子印本文库由于某些原因陷入停办的局面,那么这些资料的去向将是一个很大的问题。相对于机构电子印本文库而言,学科电子印本文库没有固定的资金来源。而资源的永久保存除了要解决技术上的问题外,还需要大量的资金来保证。这也是目前还没有那个文库明确地声明要对智力产出进行永久保存的原因。如何确保学科电子印本文库资源能够被永久保存而不至于遗失,还是一个悬而未决的问题。
4 扩展功能之三——改革传统学术交流模式
长期以来,以学术期刊和图书等为交流媒介的正式科学交流过程在传统学术交流模式中占据着主要地位。尤其是学术期刊,一直是科学家获取学术信息、进行学术交流的重要手段。然而,随着学术期刊出版市场垄断的加剧,商业出版商肆意抬高期刊价格,而图书馆又不断面临着削减经费的尴尬局面,使得传统学术交流模式的弊端逐渐显现,出现了所谓的“学术交流危机”。如何改革传统的学术交流模式,使之更好地为全球科研工作者服务,成为摆在全球科研工作者面前的一大难题。
电子印本文库是学术界为解决日益加剧的“学术交流危机”所提倡的一种自存档模式。电子印本文库隶属于开放存取。所谓开放存取(Open Access,OA),是指通过公共网络可以免费获取所需要的文献,允许任何用户读取、下载、拷贝、分发、打印、检索以及链接全文,支持爬行器收获并建立本地索引,支持用于法律允许的其他目的(不包括商业、法律、技术贸易壁垒方面的应用),对复制与分发的唯一限制是保证作者对其作品完整性的控制以及在使用作品时对其进行恰当的引用。[16]
电子印本文库之所以能改革传统学术交流模式,究其原因主要有以下二点:首先,电子印本文库创建伊始,便具有开放性的特点:不仅仅在于参与的开放性,更表现在资源的开放获取。电子印本文库内所有资源均可以通过因特网免费地被浏览、检索、获取。科学家能够自由地获取科学共同体所创造的知识,而不会因为商业利益等因素有所限制。凭借电子印本文库,科学家可以从传统学术交流模式的被动状态中解放出来,再次掌握科学交流的主动权。其次,就目前情况来说,电子印本文库所包含的资源往往学术性很强,质量大多较高。据笔者粗略统计,arXiv High Energy Physics-Theory部分2005年共收录预印本3240篇,其中2478篇已发表在各类期刊上,占到了总数的76.5%。这些高质量的学术资源是学术交流的基础,是电子印本文库具备改革传统学术交流模式功能的客观条件。
相对于开放存取的另一种模式——开放存取出版而言,电子印本文库由于没有采取同行评议(peerreview)制度,省去了大量的费用,在经济运行模式上更为成熟,更易为广大科研工作者所接受。当然,也须看到,由于没有采取严格的同行评议制度,电子印本文库在质量控制上也还存在许多问题,且类似于arXiv具有如此之高的影响力的电子印本文库数量极为有限,难以产生大规模的集合效应。但毕竟,电子印本文库的建设与实践已经为改革传统学术交流模式迈出了一大步。随着开放理念逐渐深入人心,电子印本文库改革传统学术交流模式的功能还将进一步增强。
5 扩展功能之四——实现全球范围内科研资源共享
当前,经济发达国家与经济欠发达国家之间的差距已不仅仅表现在传统意义上的人均收入差距扩大,更严重的是在新形势下已演变为“数字鸿沟”的形成和加深,而科研领域的“数字鸿沟”则尤为严重。目前,科研资源在全球的分配极不均匀,突出地表现在经济发达国家(地区)占据着绝大多数科研资源,经济欠发达国家(地区)尤其是经济最不发达国家(地区)长期处于资源匮乏的状态。
随着e-science的兴起,科学研究的国际化趋势已经越来越明显,科研资源的共享已经成为重中之重。缺乏科研资源,科学研究便无法顺利地开展下去,由此产生的差距对欠发达国家而言无疑是雪上加霜。科研资源的全球共享已经是刻不容缓。
电子印本文库为全球科研资源的共享提供了一个很好的机遇。它面向全球各个国家和地区的科研工作者,用户可以免费地共享、浏览、检索、下载最新的论文预印本资源。更为重要的是,由于发达国家的智力产出较为丰富,在电子印本文库无论是建设还是建成之后的资源提交上,都是非常积极的。相比较而言,欠发达国家则往往是电子印本文库的“受益大户”。欠发达国家应充分认识到这一资源的重要性,充分利用电子印本文库资源,如此则发达国家的科研资源可以更好地为欠发达国家所共享。如果排除技术方面的障碍,电子印本文库资源为全球科学工作者所共享是可能的。
以图书情报领域影响较大的电子印本文库E-LIS为例,统计数字显示,截止到2006年11月底,E-LIS共有来自182国家(大多为欠发达国家)的用户访问其资源。[17]观察我国图书情报专业近几年的论文,也可发现诸多E—LIS电子印本文库资源的踪迹。电子印本文库资源作为一个确确实实的东西,已成为众多欠发达国家科研人员获取科研资源的一个重要组成部分,而电子印本文库也一直在为这一功能的实现而努力。当然,电子印本文库的作用毕竟是有限的,要实现全球范围内科研资源的共享,还必须依赖于整个科学交流系统的改革和发展。
值得注意的是,发达国家与欠发达国家科研领域的“数字鸿沟”并不仅仅是在科研资源的占有上,也还有信息意识上的差距。仍以E-LIS为例,欧美等发达国家的访问量和下载量明显要大于欠发达国家和地区[17],这很值得反思。电子印本文库要在此功能上有所作为,还必须借助于机构乃至国家的力量不遗余力地对资源共享的理念进行宣传方能奏效。
收稿日期:2006-12-25