机构知识库与科研档案的共建共享方案探析,本文主要内容关键词为:探析论文,知识库论文,科研论文,机构论文,档案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图法分类号]G251 [文献标识码]A [文章编号]1003-7845(2014)02-0051-03 在全球互联网共享的环境下,高等院校和科研院所的学术交流活动空前广泛,由此而产生的学术信息资源迅猛增长。这些以数字化形式保存下来的大量学术信息资源如何实现长期妥善地保存、规范统一地管理、科学有效地整合、便捷高效地检索,已经成为高等院校和科研院所亟待解决的问题。机构知识库与科研档案作为学术信息资源的集合体,必然成为研究的重点。鉴于机构知识库与科研档案建设的现状及其二者之间的共性,实现机构知识库与科研档案之间的共建共享是一种必然趋势,不但能够及时全面地汇集科学研究中产生的丰富信息资源,而且可以满足广大科研人员对相关科研信息的需求,为其提供更为便利的学术交流平台,从而提高机构的整体科研水平。 1 机构知识库与科研档案的概念及其现状 1.1 机构知识库的概念及其现状 机构知识库(Institutional Repositories,以下简称IR)是20世纪90年代末基于开放获取(Open Access,简称为OA)理念而出现的一个新生事物。2002年SPARC(Scholarly Publishing for Academic Resources Coalition)首次对IR进行了定义,即“收集和保存一个或多个大学知识产出的数字资源集合”[1]。IR中的可用资源是由机构成员自己将个人或机构科研人员的科研成果提交,在一定范围内传播、使用,并对其进行长期、集中保存。随着国外IR实践的快速发展,目前IR研究工作可以有效地解决科研信息资源的获取与科研信息资源需求之间的失衡,有效地拓展了科研人员搜检信息的途径,满足了广大科研人员的信息资源需求,从而实现了全球范围内的学术资源共享。 由于IR日益成为教育与科研机构保存和传播知识成果的有力工具,因此,国际上众多教育与科研机构都建立了自己的IR。自2002年开始,国外IR蓬勃发展。由美国麻省理工学院与惠普公司合作开发的DSpace系统已经成为高校IR发展的基本模式。据OpenDOAR统计[2],截止到2012年4月,OpenDOAR中共收录了全球2190个IR,中国(包括港澳台)共有104个IR,其中香港6个,澳门1个,台湾70个,大陆27个。总体而言,中国内地开放获取的IR数量较少,尚处于起步阶段,一方面是由于IR概念引入国内时间较短,另一方面是源于实践方面的差异性。仅就国内目前用于本机构知识成果长期保存的学位论文库和教师文库而言,与高校、科研院所拥有的丰富的科研信息资源相比,也只不过是凤毛麟角。例如,科研项目信息、科研奖励、专利、研究手稿、技术研究报告、科研档案、工作报告、多媒体数据及实验结果等原生性的科研信息资源并非学位论文库和教师文库所能涵盖。因此,随着时间的流逝或软、硬件的不断更新,不可避免地会造成大量的原生性数字科研信息资源的流失。总之,目前对于国内刚刚起步的IR来说,一方面汇集的资源较为单一,另一方面其元数据和数据开放性与国际标准难以统一。 1.2 科研档案的概念及其现状 科研档案是指在科学技术研究过程中形成的,具有保存价值的文字、图表、数据、声像等各种形式载体的文件材料[3],其全称为“科学技术研究档案”,又称为“科研课题档案”。现代意义上的科研档案涉及的领域既包括自然科学研究,也包括社会科学研究。科研档案涵盖的范围极为广泛,包括了科研项目调研申请、实验研究、成果鉴定、推广应用等全过程中形成的原始文件和相关材料。 科研档案在我国已经历了60多年的发展,至今已经形成较为规范的内容结构体系与管理模式。然而目前在科研档案的收集、利用过程中仍然存在着许多问题。科研档案的形成主体一般是科研人员自身,由于许多科研项目的结项鉴定是以本单位的科研管理部门为中介来完成的,因此,科研人员须把必要的科研成果与必需的过程材料交由科研管理部门。科研管理部门将每年形成的科研档案移交档案馆时,由于日常工作的需要,往往只是移交一部分。长此以往,许多科研项目的档案分布在三地,即科研人员手中、科研管理部门和档案馆,造成了科研档案的不完整性,再加上科研档案的涉密性和服务对象的严格限定,这些因素都严重影响了对科研信息资源的整合与利用,使得科研信息资源本身及其潜在的价值难以充分发挥。 2 机构知识库与科研档案之共性比较 2.1 资源类型互有重合 IR收录的资源非常广泛,根据OpenDOAR的统计,目前IR所涵盖的资源类型(见下图)按所占比例的大小,依次为:期刊论文、学位论文、未公开发表的报告与论文、专著与图书章节、会议论文、多媒体与视听资料、参考文献、特种文献、学习资源、数据集、专利、软件。当然除此之外,还包括图像、地图、乐谱、设计图、预印本、技术报告、工作文档等。这些资源以成果性的“产品”为主,还包括部分过程文件,如工作文档。 全球开放获取典籍目录库主要资源类型分布图(截止到2011-12-12)[4] 1987年3月20日,国家科学技术委员会、国家档案局发布的《科学技术研究档案管理暂行规定》第七条指出,科研文件材料的归档范围根据课题进展的不同阶段主要包括6个部分:研究准备阶段的调研报告、可行性研究报告,科学基金、科研课题经费申请报告及批件,任务书、协议书、科研合同、委托任务书、会议记录及重要来往文函等;研究试验阶段的试验任务书,实验、试验、测试的重要原始记录、整理记录及报告,观测、探测、观察记录,野外调查、考察记录和整理记录及综合分析报告,设计文件、图样,课题阶段总结等;总结鉴定验收阶段的课题工作总结(含最终完成、阶段完成或中断),论文、专著,科研课题经费决算,科研课题成果验收、鉴定、评审文件等;成果奖励申报阶段的科技成果申报表及附件、科技成果奖励申报与审批文件、获奖凭证、专利文件等,推广应用阶段的推广应用方案、技术转让合同、协议书、成果推广应用中形成的技术文件及工作总结等;与各阶段有关的文件,如专业会议文件、标本、样品目录、照片、影片、幻灯片、录音带、录像带、机读文件等[5]。 由此可见,IR与科研档案包含的资源都是围绕着科研课题,二者不论在内容上还是在载体形式上都互有重合。 2.2 信息资源的来源与服务对象相似 科研人员是IR中生产“知识”的主体,同时又是科研档案的形成主体。IR与科研档案的资源,就如同同一商品生产者生产的同一类产品被放置于不同的场合,而被分别赋予了新的名称。 由于IR和科研档案的功能都是保存与备查科研活动过程、实现学术资源的交流与共享、增强机构的学术影响力与成果展示度等,因此,二者的服务对象都是以本机构及其内部成员为主。 2.3 系统的开放性和互操作性相似 由于IR和科研档案在本质上都是对信息的集成,所以二者在系统的开放性和互操作性、资源的累积性和永久性、信息的动态性与综合性、系统的兼容性等方面存在着相似性。 2.4 技术标准规范相似 IR与科研档案管理系统一般都是利用开放源代码软件作为管理平台,且均遵守0SI的统一标准,支持OAI协议和OpenURL协议,可提供对外开放的OAI-PMH接口。二者采用的软件都具有基于Web的用户界面,并且可以为特定的机构定制,其系统软件内核与外界的接口具有一定的通用性和可移植性。 基于上述共性分析,我们可以得知,IR作为现代信息技术条件下的一种新型数据共享形式,在本质上是对科研档案中的部分成果材料进行的网络化集成,科研档案的开发利用也因此而进入了一个新阶段。IR与科研档案作为信息资源的两种组织形式,在学术资源开放获取的时代要求下,必然要求实现共享,而信息集成化的利用需求又为共享提供了内在动力。随着IR与档案资源的交叉日益广泛,只有实现两者之间的共建共享,才能有效避免资源的重复建设。 3 机构知识库与科研档案的共建共享方案 3.1 政策与制度保障 高校院校、科研院所从事科研的显著优势在于对科研信息资源的大量积累、易于获取以及对其成果转化的广泛传播与应用。而这一优势能否充分发挥的关键在于机构内部各部门能否团结协作。科研管理部门是科研工作主要信息资源的汇聚地,档案馆是科研档案的贮存地,图书馆是学术文献资源的收藏地,这些部门都承担着学术信息资源共享、学术成果交流的职责。因此,机构领导必须建立信息资源相关部门的统一协调机制,根据本机构的实际情况逐步建立并完善IR的收录政策,对科研信息资源的提交程序、审核标准要做出明确的规定,从而使信息资源的收录具有可控性。 同时,要制定科研信息资源的版权保护政策,对于不同类别的信息资源设置不同的权限控制,以便最大限度地实现信息共享。 此外,要将IR与科研档案的共建共享方案纳入该机构的信息化建设体系,只有在机构信息化的顶层设计中做到了信息资源的全面协调,才能使IR与科研档案的共建共享落到实处。目前国外已将文件、档案管理纳入社会法制体系建设、民主化与信息化社会建设战略框架之中,科研文件和档案的管理成为科研活动规范化、科学化、信息化建设的内容及其有机组成。科研文件的规范化管理是学术规范与学术道德规范的要求,被纳入基于证据的科研项目治理与科研机构治理,科研档案的利用被纳入科研资源长久保存与网络化共享的数字化工程建设内容[6]。国外的这一做法对于国内IR与科研档案共建共享的相关制度的制定具有重要的借鉴意义。 3.2 宣传引导 美国网络信息联盟发布的调查报告指出,促使高校员工向IR提交信息资源非常困难,是制约IR发展的关键因素。就国内而言,无论是IR还是科研档案,目前面临的突出问题都是资源匮乏,其症结就是科研人员的开放获取意识与科研档案意识薄弱。因此必须从政策宣传与管理措施方面对科研人员加以引导,通过规范的存储许可协议,消除他们在提交个人科研信息与成果方面的顾虑。从国际来看,目前在很多国家都有一个很明显的发展趋势,即要对研究成果进行统计和评价,通过使用后评价机制来对项目进行评估。这一点值得我们借鉴。 3.3 资源分析 机构的信息资源相关部门要对机构内的科研信息资源进行系统分析和深入研究,从而对IR和科研档案的共建共享资源的类型与范围进行定位。IR的建设人员应通盘考虑IR的性质和建设目的,严格筛选科研信息资源的类型,从而有效地确保IR建设的质量[7]。同时,结合机构的重点学科建立特色资源,一、二级国家重点学科、国家级研究中心、国家重点实验室、知名教授、院士等的科研课题及成果、发明专利、著作论文等,都应作为科研信息资源收集的重点,自然也是IR收录的重要内容。 3.4 功能设计 IR与科研档案实现共建共享后,其功能应该包括按不同方式组织、浏览、检索信息资源,以多种形式对数字化信息资源进行存储,对数据信息进行统计分析,信息资源的动态更新等。除此以外,还应实现以下功能: 科研人员将其研究成果提交至IR中,科研管理部门和档案馆为IR的建立提供技术和相关信息资源,科研管理人员和图书馆员负责元数据创建、存储标准的制定,并与行政主管部门进行沟通协调,从而使科研管理部门和档案馆融入学术交流体系之中,承担起学术信息资源的交流、共享与传播的责任,以此来拓展两个部门的传统功能。 IR将以往分散的科研信息资源汇集起来,并实现长期保存,在满足科研人员信息需求的同时。也反映出该机构的整体科研实力。同时,通过开放存取,以提高机构学术成果的社会影响力。 3.5 技术支持 目前大多数高等院校、科研院所都采用专用软件建设IR,相对成熟的构建工具主要有DSpace、Bepress、Eprints等,其中DSpace系统在科研机构中应用最为广泛。DSpace系统以内容管理发布为设计目标,是一个开放源代码的软件平台,可以收集、存储、索引、保存和重新发布任何数字格式、层次结构的研究数据,具有很强的灵活性和可定制性,提供了资源提交者、终端用户和系统管理员三个界面。我国大陆现有的27个IR均使用DSpace系统。鉴于DSpace系统的开放源代码特征,只要建立了与本机构的档案管理信息系统的统一接口,便可以实现IR对科研档案相关“信息资源”的提取与重用,同时,科研档案中缺乏的某些信息资源也可以通过IR得以补充,从而实现IR与科研档案之间的动态数据交换。 [收稿日期]2013-05-24 (赖宁 编发)机构知识库与科研档案共建共享方案探讨_机构知识库论文
机构知识库与科研档案共建共享方案探讨_机构知识库论文
下载Doc文档