日本机构知识库的构建现状研究,本文主要内容关键词为:日本论文,知识库论文,现状论文,机构论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
机构知识库(Institutional Repository,IR)是指收集、保存大学等研究机关的研究成果,无偿发送学术信息的国际互联网的保存书库。IR的资源主要包括:学术论文、灰色文献(会议论文、技术文书、调查报告等)、学位论文和教材等。IR系统把上述资源电子化,利用OAI- PMH(Open Archives Initiative Protocol for Metadata Harvesting)协议,通过国际互联网广泛地发送到社会。它对促进学术交流、研究成果共享、确保数字资源长期可靠保存等方面起着重要的作用。
日本从2004年开始对IR构建的试验性实际装备项目等进行筹备工作,从2006年起正式构建IR系统[1]。虽然日本IR构建的地基、学术研究内容模式和技术平台等与我国不尽相同,但为我国构建和持续发展IR提供了宝贵经验。
1 日本国立情报研究所对大学IR构建的支援
在情报学研究领域,日本国立情报研究所(NII)是以“创建未来价值”为目的的日本唯一的国立学术情报综合研究机构。NII的主要职责是综合推进网络技术、软件开发、学术情报资源的保存以及共享等有关情报学领域中新理论、方法论的研究开发,并且在构建学术界整体研究和教育活动中不可缺少的尖端学术情报基础(CSI)的同时,注重与国内的大学和研究机构共同开发各种研究项目。对此NII于2008年投入相关研究项目的资金为36亿日元(约合人民币2亿元)[2],占NII一年总支出的32%,其中重要的项目之一就是IR系统的构建。NII为继承和扩充目前的学术情报资源相关工作的成果,配备下一代学术情报基础资源,以“学术机关知识库构建协助支援计划”(NII Institutional Repositories Program)为名,支援各个大学的IR构建和协作。IR系统构建的推进体系是由NII的“学术情报资源管理、协作总部图书馆协作工作部门”计划、立案有关IR的重点推进领域,确定支援对象的课题,确保预算,最后“学术情报资源管理、协作总部”审查决定后执行。现从3个方面介绍NII对IR构建的支援工作。
1.1 NII对IR构建的委托项目
NII从2005年开始为促进IR的构建,以日本国内的大学、短期大学(相当于我国的3年制专科学校)和高等职业学校(相当于我国的职业学校,但学制是5年或者5年6个月)为对象,实施了为共同构建学术情报基础的委托项目。目前,短期大学和高等职业学校暂时还没有构建IR系统的机构。NII的委托项目大体可分为两个领域。第一领域是以普及IR系统与扩充IR学术情报资源内容为目的的支援项目。该领域委托项目对象的学术情报资源是,指定在大学等研究机构所创造的有学术价值,并具有大学等学术机构特色的重点学术情报,即学术论文、研究成果报告书、学位论文、技术报告和教材等。主要执行程序是要申请的大学根据NII的委托项目公开招募纲要,提出提案书并申请该项目所需要的经费。经费主要包括设备费用、人事费用、管理费用(系统开发、调查、数据制作、消耗品等费用)等。该领域项目申请经费的上限一般为300万日元[3](约合人民币21万元)左右,但是,特别可以期待其成果的项目没有这个金额限制。项目选定的方法是NII的“学术情报资源管理、协作总部”进行审查提案书等各种申请资料及委托项目的经费,决定是否采纳。委托项目的期限为一个年度(每年4月起到下一年的3月),项目结束时提交成果报告书,根据报告书NII对各个项目进行评价。
为了确保各个IR系统之间的协作,NII要求各个大学必须根据NII制定的目录数据格式化方式来制作目录数据。NII利用收集目录数据标准的OAI- PMH协议,自动收集各个机构IR系统的目录数据。目录数据的格式化要素见表1 [4]。
NII在网上免费提供的构建IR系统所需要的开源软件主要有DSpace(MIT Libraries & Hewlett- Packard),GNU EPrints(Southampton University)(IR软件的日语版,北海道江别市铃木敬二)等。
图1 日本的机构知识库管理机制
对于各个大学承担构建IR系统以及具体操作业务的主要部门是图书馆。为了促进更多研究人员的参与,尽量减轻研究人员的负担,各个大学简略其步骤,要参与的研究人员只要把申请书和所要登载的学术内容发送到图书馆就可以。制作检索用的目录数据、确认著作权、资料的电子化、登载到系统等实际操作都由图书馆进行。日本的IR系统运行机制如图1所示。
NII委托项目第二领域的对象是,建立多数IR之间的协作能够创造出新的附加价值的项目,以及对IR的运营提供便利并有较高影响力的调查、研究、开发项目等。具体包括以下几个方面的内容:①强化信息发送能力的技术。开发有附加价值的检索门户网站的项目,有助于提高IR的便利性和可视性的系统开发、电子出版、目录数据的调查以及研究等。②多数IR系统的协作。各个领域IR之间的协作或者与各个IR之间的协作等。③关于确保IR持续性发展以及提高其价值的研究。经济模型、运营模型、学校内与其他系统的协作以及长期保存等。④有关网络科学与IR系统协作可能性的调查、研究等[3]。
第二领域每个项目可以由一所大学独立申请,也可以由几所大学共同申请。其他具体的执行程序跟第一领域的执行步骤类似。只不过第二领域项目的每年度申请金额的上限是500万日元[2](约合人民币35万元)左右,但是,跟第一个领域一样特别可以期待其成果的项目没有金额限制。目前共有14个研究项目,例如,以北海道大学的研究人员为主的,具体题目为“IR整体的活跃性”的研究项目是由设置IR的大学、研究机构组织电子存储库联盟(Digital Repository Federation),利用电子邮件、Web网站、集会等方式共享信息、交换意见,促进日本国内的IR系统发展的同时,把IR系统看成一个整体着手解决构建机构所共同面临的各种课题。这种研究项目,通过各个大学之间的互相交流,在促进IR的构建的同时,有助于IR的持续性发展。
1.2 NII支援IR学术情报资源的扩充
NII为丰富IR系统里所登载的学术情报资源,向各个IR系统提供已被电子化的学术情报。
1.2.1 提供研究期刊的学术情报 NII在情报研究所的学术网站上,已被电子化公开的学术情报资源,作为支援大学等学术机构的一环提供给各个大学的IR系统。其对象是在各个大学等研究机构已完成著作权处理,并且已经登载到电子化学术情报系统的研究期刊。
具体的步骤是:大学图书馆在NII的CiNii(NII论文情报导航)网站上,把所希望的研究期刊的“NCID”(NII综合目录的期刊ID)和“卷号”查询以后,委托NII相关责任部门收集情报。NII通过物理储存媒体提供给大学所需要的学术情报信息。
1.2.2 IR系统中综合利用日本国内各学会杂志对CiNii免费公开的学会杂志中,NII向各个学会确认能否在著者所在的IR系统上复制收录其学术情报资源。到2009年3月6日,NII共对178个学会、504种杂志查询,结果得到答复的是122个学会、285种杂志,其中允许免费公开的是206种杂志,占72.3%,不允许免费公开的是19种杂志,占6.7%,其他有附加条件的是60种杂志,占21%[5]。虽然允许免费公开的杂志数不到总杂志的一半,但是对IR学术情报资源的扩充方面有很大的帮助。
1.2.3 呼吁SPRAC Japan(国际学术情报流通基础整备项目)合作伙伴的协助来推动IR的发展[6]NII在日本国内发行英文版学术杂志的学会中,根据招募选定共同推进SPRAC Japan运动的合作伙伴,并呼吁这些学术杂志发行机构协助IR系统,把相关杂志的学术信息在IR系统中公开。到2009年3月为止被选定的杂志为45种,也就是这45种杂志的学术情报可以从IR系统存取。
1.3 建立IR协作系统
1)公开目录数据格式化方式。JuNii2[4]。目录数据的具体要素参照表1。
2)建立横向检索系统。NII构建IR系统以来,相继推出了各个知识库的横向检索系统。2005年开始公开了JuNii+(2009年3月31日为止服务结束),2008年10月推出了JuNii+的后续服务系统JAIRO(Japanese Institutional Repositories Online)[7]。学术网站JAIRO是能够横向检索存储在IR系统里的所有学术情报资源的门户网站。通过JAIRO网站除了检索学术情报资源之外还可以查询各种统计数据。比如,随时可以查询被登载的论文等学术情报数量,还有按月、按年的总存取量等数据,有利于各机构、著者、读者了解整个IR系统的各种信息。
3)NII论文信息导航(CiNii)与IR系统的连接。2008年10月份正式启动了从论文数据库CiNii进入到IR系统直接搜索所收录的论文、学术期刊等学术情报资源,实现了原有的论文数据库与IR系统之间的连接。与CiNii相连的IR系统程序所需要的条件是:遵循OAI- PMH协议,目录数据格式化支持JuNii2,不能更新函数以及变更URI(Uniform Resource Identifier)等[8]。
2 日本大学IR配备的状况和IR学术情报资源的现状
日本正式构建IR系统已经有3年多的时间,构建IR系统的机构数和登载在IR系统的学术情报资源都逐渐增加。根据JAIR0的统计数字显示,到2009年2月为止总的机构数是88个,配备比率是全体大学的11.6%。具体数字如表2所示[9]。
登载在IR系统的文件根据JAIRO网站的信息,到2009年3月24日为止,日本IR系统总的登载数量达到596178件,详细内容如表3所示[2]。
从表3中可以看出,期刊论文占文件总数的38.9%,学术杂志论文占27.8%。这里所列举的数字只不过是目录信息的数字,未必包含论文正文,但可以肯定的是这些数字足以说明日本全国性IR构建的倾向性。
对于登载在IR文件的存取方面,以名古屋大学IR系统为例,每件的平均存取数量最多的是教材,其次是学位论文[10]。期刊论文数量最多,总的存取数量理所当然是第一,但是每件的平均存取数量远小于学位论文和教材。虽然这是一所大学(机构)IR系统的统计数字,不能简单地下结论,但是通过这样的统计分析可以表明IR将来发展的一种趋势。在IR构建的过程中不断调查用户需求,充实IR的学术情报资源是IR健康、持续发展的关键因素,因为构建IR系统的目的就是为更多的人存取更多的学术情报资源。
3 构建IR的意义
3.1 为更多的人提供阅览机会
过去学术情报的流通范围是有限的。比如在日本,博士学位论文一般是授予学位的大学图书馆保存一份,国立国会图书馆保存一份。还有由于著作权的限制,想要全页复印需要著者的许可。把学位论文登载到IR系统在国际互联网上免费公开大大扩大了它的流通范围。另外,大学等机构发行的期刊很少公开出售,只在大学图书馆保存。虽然在互联网上可以查到一些电子化的学术期刊,但是所需要的费用非常昂贵。像这样能够把流通范围有限的学术情报和研究成果进行免费利用就是学术情报IR的构思,虽然受到各种各样的限制,但是隐含着能够打破原有的学术情报流通障碍的可能性。
3.2 谋求学术交流的活跃性
大学的IR系统能把论文的被存取次数通知给著者,还可以从读者直接反馈到著者。北海道大学等大学定期把文献的下载数量通知给文献提供者,这样著者可以了解自己提供的文献在什么时候、什么程度被利用的情报,还可以将读者对论文的评价、感想等反馈到著者,通过这种途径可以大大促进著者与读者之间的学术交流,活跃学术氛围。
3.3 可以提高论文的可视性
登载在IR的论文通过国际互联网被公开,根据关键词可以通过Google等网站搜索相关信息,提高了论文的可视性。JAIRO的统计数字显示,从Google,Yahoo网站存取的文件数量达到总存取数量的20%左右[11],IR系统把学术成果提供给更多的人阅读有助于促进学术交流。
3.4 可以保存研究成果
登载在IR系统的每个文件都有一个固定的URL,即使服务器变了URL也不会变,这样大学登载在IR系统的研究成果会永久地保存下去。
4 未来的研究
日本的IR构建虽然已取得了预期的成果,但是毕竟还处于起步阶段,存在很多亟待解决的课题。现从两个方面概括今后要解决的主要课题。
首先,决定IR长期、稳定发展的一个重要因素是得到可持续的经费支持。从日本的现状分析,构建IR的费用主要来自于NII委托项目中所提供的经费,今后IR的维护费用等问题是比较难的课题。虽然将来要构建目录数据制作以及学术情报资源的登载、著作权处理的确认等办公自动化系统,但近几年这些工作都由图书馆来承担[12],自然而然增加了图书馆的压力。怎样解决IR构建中图书馆的压力是今后的课题。
其次,从日本IR构建的现状来看,硬件系统基本上已配备,要实现IR持续发展的另一个重要因素是怎样充实登载在IR系统学术情报资源的问题。普遍反映,在大学里从事研究工作的很多研究者也就是IR学术情报资源的主要提供者,对自己研究成果的公开并不是很积极[11]。应该通过教员会议或者个别访问,说明、宣传、通知存取数量等的方式来得到研究者的理解和协助,这也就是将来有待解决的课题。
5 结束语
日本的IR之所以能够发展到今天的状况,是和国家(具体来说是NII)资金面的援助、各个大学(机构)的重视和协助是分不开的。现在IR构建的基础基本齐全,关键是IR学术情报资源的构建问题。要想实现持续发展,关键的因素是持续的资金支持和提供IR文献的教员、研究者的理解和协助。
综观日本的IR能够迈出成功的一步,主要有NII和各个大学组成的社群的参与,同时NII还能将普及IR的项目与解决IR构建中所能遇到的各种课题的研究项目有机地结合起来,建立了不断充实IR系统的构建模式。日本的这种IR构建模式对我国的IR构建起到一定的借鉴作用。
收稿日期:2009-05-14