学术交流新理念——学术信息域(AID),本文主要内容关键词为:学术交流论文,新理念论文,学术论文,信息论文,AID论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
Academic Information Domain,简称AID,笔者在此将之译为“学术信息域”,是2006年Knowledge Exchange(KE)提出的一个新概念,描述学术工作者们在web2.0环境下进行学术研究工作(或合作研究)的学术交流新方式。目前在经典的图书馆、情报学界还没被广泛传播开来。[1]
Knowledge Exchange,知识交流委员会,简称KE,是四个欧洲机构在2005年签署合作协议后形成的共同体,这四个机构分别是:德国研究基金会(German Research Foundation,DFG);英国联合信息委员会(Joint Information Systems Committee,JISC);丹麦电子研究图书馆(Denmark's Electronic Research Library,DEFF);荷兰SURF基金会。
KE的工作主旨是:为学术ICT(Information Community Technology,信息交流技术)基础设施的发展和利用提供支持,具体指的是为高等教育和研究工作服务的ICT基础设施。[2]
1 背景
20世纪90年代末,在“学术期刊危机”和“学术交流危机”的浪潮下,开放获取(Open Access)开始在国际学术界、出版界以及图书情报界兴起。2001年12月“布达佩斯开放获取先导计划(Budapest Open Access Initiative,BOAI)”的起草和发布以及2003年10月德国、法国、意大利等国联合签署的《柏林宣言》则正式宣告着开放获取时代的真正来临。[3]
如今开放获取的理念已经逐渐深入人心,随着其发展的深入,其实现途径也愈发地多样化,OA期刊、个人主页、Blog、机构知识库等等。近年来,机构知识库(Institutional Repository,简称IR)已逐渐成为开放获取运动的主角,全世界的图书馆大多已经建立或正积极筹建所属机构的知识库。大量机构知识库的出现,极大地推动了开放获取运动的发展,也大大提高了各机构的揭示度,极大地推动了学术研究及交流。目前,学术界甚至已经开始着手于国家层次的机构库联盟的建设,例如现在已经成功运行的荷兰国家级机构知识库联盟DAREnet,其模型现在已经被运用到全欧洲。
尽管机构知识库联盟的出现在自由的学术交流上迈出了重要的一步,而且效果显著,但是对于想要实现充分有效的学术交流来说,还远远不够。因为在如今的网络交流环境下,学术研究者们需要的不仅仅是对学术出版物的开放获取入口,同时还需要对某些数据集和研究描述的入口,以及一个拥有合作研究可行性的交流平台。[4]此种情形下,在KE2006年的研讨会上,AID这个全新的概念应运而生。
总的来说,AID主要围绕三大类学术资源:[5]学术出版物(期刊文章、会议报告和专著);相关数据集(主要是各类研究结果,比如实验数据);研究描述信息(研究人员、研究机构以及研究项目等的相关介绍)。
在接下来的文字中,笔者将详细介绍AID的概念模型、相关概念及其实例实现。
2 AID概念模型
纵观学术性机构中信息的来源和管理,我们可以发现两类有明显区别的信息元素:一类是专门服务于学术性工作过程(如研究和教育)的信息元素(包含实体和属性);另一类则是服务于其他更普遍领域工作的信息元素,例如,作者(或学术性机构员工)的姓名及其任命信息,它们都属于人事管理的范畴。
专门服务于学术性工作过程的信息元素,再加上管理它们的工作流程以及可利用的服务,正好构成了本文所讨论的学术信息域(AID)。它和其他领域有明显区别,比如人事信息域或经济信息域。具体概念模型如图1所示。[6]
从图1可以直观地看到,学术信息域由两部分组成:当前研究信息系统(Current Research Information System,简称CRIS)以及开放获取知识库(Open Access Repository,简称OAR)。这里提到的开放获取知识库更多地侧重于知识库联盟的层次,而非单个的机构知识库。
2.1 CRIS介绍
下面是来自wiki的关于CRIS的定义:
“‘CRIS其实就是一个存储数据的数据库或其他类似的信息系统,其中存储的数据多与当前相关研究机构或研究人员的研究课题相关,而研究课题又通常以接受资金赞助的项目方式进行。’
其中,对于信息系统来说,一个特别的CRIS标准是CERIF(Current European Research Information Format)标准,它是由欧盟提出制定,其发展和维护则是由eruo CRIS(欧洲当前研究信息系统联盟)负责。”[7]
此外,大部分以关系型数据库形式存在的CRIS信息系统中还包含了大量的元数据集,范围涉及各个方面的研究信息。它们被广泛运用在高等院校、研究机构以及政府机构中,主要包括:[8]各类研究报告;研究评估结果;研究进程管理。
近年来,CRIS已经逐渐进化成基于网络的信息系统,同时开始更多地将目光投注到研究人员及其研究的增值价值上。例如,把研究人员的国际揭示度作为优先考虑项。尽管CRIS中包含了大量且复杂的元数据集,CRIS依然应对自如。这得益于其结构性能良好的数据模型:CERIF-model(Current European Research Information Format),这个由欧盟推荐,euroCRIS发展和维护的标准。
目前的CRIS(包括其中的元数据集),其主要特点是:涉及范围广泛(具体涵盖了研究活动、研究机构、研究人员、研究中及最终研究成果等);尽可能地细致化(元数据被分解到“原子”级别);标准化(例如,尽可能地采用枚举列表、词典、叙词表等);系统逻辑机构合理清晰。[9]
图1 The Academic Information Domain(AID)学术信息域概念模型
2.2 OAR介绍
机构知识库(Institutional Repository,简称IR)目前还没有统一的定义。最为普遍的一个定义是SPARC资深顾问Raym Crow提出的:“收集并保存单个或多个大学、科研机构智慧成果的数字化资源集合。”[10]大部分机构知识库是基于单个机构层次的,也有小部分基于多机构和团体层次。除了机构知识库外,基于学科的知识库也很普遍,尤其是物理学和经济学领域。
开放获取通过网络为许多原始学术资料(如各类数据集)和二手学术资料(如各类学术出版物)提供了免费且不受限制的存取入口。开放获取档案集或知识库不提供同行评议,仅仅对外免费开放其存取内容。其内容可能包含未发表的预印本、已发表的后印本或者二者皆有。[11]目前机构知识库愈来愈受到国际学术界的追捧,越来越多的图书馆开始着手构建自己机构的知识库,用于管理和保存本机构的智慧遗产。
随着单个机构知识库数量的迅猛增加,跨知识库之间的交流成为一个新的需求,由此机构知识库联盟产生。开放获取机构知识库联盟的建立在物理上采用分布式结构,不推荐采用重点维护几个中心系统的方式(目前存在的知识库中,比如ArXiV,关于物理和计算科学的学科知识库,采用的即是此种方式),而是鼓励机构和组织创建各自的本地知识库。理由是各个机构组织间在相关政策法规、工作流程、知识库收录范围、元数据需求、存储内容的倚重以及机构的显示度等方面都或多或少存在差异。显然,这样各自为政的优点是:参与度大大提高、维护减少、内容更丰富充实。同时缺点也很明显:分布式机构知识库之间的互操作成为有效提高学术交流必须解决的大问题。
为了解决互操作问题,开放获取知识库联盟选择采用元数据收割协议(OAI Protocol for Metadata Harvesting,简称OAI-PMH)来完成机构库知识库之间的元数据收割与分发。OAI-PMH是目前国际上得以广泛认可的解决元数据共享和互操作的协议,已经有不少的机构和组织采用。[12][13]
现在,开放获取知识库搜录的资源范围也大大扩宽,包含越来越多非传统的出版物。例如,学习对象模型、多媒体资源、各类数据集等。甚至在很多实例中,知识库中存储的并不是原始的资源本身,而只是对应的资源链接,真正的原始资源依旧存放在某个特定的信息系统中。这样既达到了学术交流的目的,也大大节约了存储空间。
2.3 AID概念实体模型
图2展示的是学术信息域(AID)中存取进程、OAR和CRIS之间的数据流。存取进程可以实现对其他系统中数据的再利用(参见图2中指向Deposit Service的箭头),同时为CRIS和OAR提供出版物的元数据。具体如下,
OAR中包含的数据:资源全文内容;资源出处;复合对象;相关元数据;技术性元数据(扩展类型、大小、GDFR);保存元数据;关键词分类系统。
CRIS中包含的数据:研究机构信息;研究项目信息;研究项目的学术性地位;研究人员及其角色;人事信息。
OAR→存取进程包含的数据:资源永久性标识符;版权信息;数据集设置/分组信息;版本信息;资源呈现格式。
存取进程→OAR包含的数据:出版物元数据;资源全文。
图2 存取进程、OAR和CRIS之间的数据流[14]
CRIS→存取进程包含的数据:基于用户的资源唯一标识符(Digital Author Identifiers,DAI)。
存取进程→CRIS包含的数据:出版物元数据;资源永久性标识符。
到此,我们已经很完整地了解到了AID概念模型及其相关的详细信息,由此也为之后AID的具体技术实现提供了基础。
3 小结
学术的发展和进步从来都不是单一化和封闭的,交流和碰撞才是促使其不断前行的动力。网络化的急速发展,也给学术交流带来了一场空前的革命,信息量、时间、空间,这些曾经困扰了无数学术工作者们的问题,都已经成为历史。如今,我们更关注的是如何更充分、有效地利用海量的信息资源;如何更有效地实现学术交流和沟通;如何更便利地开展学术合作研究。本文所介绍的“学术信息域”概念正是在这样的需求中产生的,它的出现也为学术交流开启了一种全新的模式。
收稿日期:2008-08-29