公众共享数字图书馆——国际文献资源共享空间,本文主要内容关键词为:资源共享论文,文献论文,数字图书馆论文,公众论文,国际论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
DOI:10.3772/j.issn.1673-2286.2011.11.012
1 概述
公众共享数字图书馆(Digital Library of the Commons,以下简称为DLC)是一个国际公共资源文献共享空间,它提供免费和开放存取的全文文献、文章和论文,向用户提供有关共享资源、公共集中资源和公共财产方面的国际文献。它是印第安纳大学数字图书馆项目(IU DLP)和印第安纳大学政治理论和政策分析研究室(WPTPA)的一个合作工程,并得到了安德雷·W·梅隆基金会和国际共享研究协会的慷慨资助。DLC的网址为http://dlc.dlib.indiana.edu/dlc,网站首页如图1所示。
图1 DLC首页
1.1 公共资源概述
公共资源是指地球上存在的,不可能划定所有权或尚未划定所有权,因而任何人都可以利用的自然资源,它具有很强的非排他性。其研究对象主要包括共享资源、公共集中资源、公共财产。共享资源是指在分享资源时每个利益相关者都有平等权利的总称,它包括有关公共知识、公共领域、开放科学、免费信息交换等主题的信息共享;公共集中(池塘)资源是指同时具有非排他性和竞争性的物品,是一种人们共同使用整个资源系统但分别享有资源单位的公共资源。目前大部分的公共集中资源大都是在渔业、森林、牧场系统、野生动物、水资源、灌溉系统、农业、土地拥有和使用、社会组织、理论(社会困境、博弈理论、实验经济学等)及全球性问题(气候变化、空气污染、跨界纠纷等)方面。新的和非传统的共享资源在增长,这主要集中在城市公共资源(公寓楼、停车空间、游乐场等)、网络、电磁频谱、基因数据、预算等方面;公共财产则是指国家和集体共有的财产。
1.2 DLC的发展及其组织机构概述
构建DLC的想法最初是源于1999年国际公共资源研究协会(IASC)公共资源虚拟图书馆“成为公共资源研究的国际文献空间”这一构想。同年秋天,印第安纳大学政治理论和政策分析研究室和印第安纳大学数字图书馆项目开始设计和运行这一公众共享数字图书馆。其原型在建立之初,使用了166个电子文件和40个扫描文件进行试运行,在2000年成功通过在印第安纳大学举办的公共资源国际研究协会与会者的测试和审查,并于2001年7月向开放获取注册中心注册,同年8月DLC包括其自主出版门户开始正式运行。DLC自2003年起开始从安德雷·W·梅隆基金会获得资金支持,并在2007年再次获得该基金会的资助,这些资金主要用于雇佣专业的电脑程序员、开展数字化工程和购买更新技术。与此同时,它还获得了国际公共资源研究协会和印第安纳大学研究生院国际公众财产研究学会的资助。
政治理论和政策分析研究室,是埃莉诺和文森特·奥斯特罗姆研究和教学工作的产出成果,前身是自1973年就开始的利用比较制度和发展研究来理解多种环境下组织模式的学术研究小组,是印第安纳大学来自人类学、经济、地理、信息科学、政治科学、物理学、公共与环境学院等多学科科研人员联合而成的一个自主研究中心。该研究室的任务是增进组织机构变革、员工激励及有政策相关性应用行为的跨学科研究。它的资源组织结构呈伞状分布,囊括了广泛的研究兴趣,其中各个亚单位又是相互补充和联系的。研究室的研究人员认为他们的研究对发展中国家新任领导人在确定减少腐败和增强民主机构力量的方式方法上有所帮助。他们可以帮助组织机构决策如何更好地使用它们的资源,也有助于发展资金用在更好地提高人们生活水平方面。
印第安纳大学数字图书馆项目,是印第安纳大学图书馆、高校信息技术服务及来自图书馆信息技术学院和信息科学学院牵头的高校学师资团体共同合作的结果。它主要致力于为印第安纳大学或其他地方学校的师生创造、保存、传递和保护一系列高质量的网络资源。它为印第安纳大学图书馆员、教职员工和工作人员以及与印第安纳大学数字图书馆项目合作的外部组织和机构提供了多种多样的服务,如为授予写作、财政计划、版权研究、技术规划等提供项目规划帮助;为图片、音频和视频提供数字化服务;为文本的数字化和编码提供电子文档服务;为建立和映射元数据提供原数据服务等。在构建DLC方面,IUDLP主要负责其资源数字化、界面设计、功能研究、元数据创建和制图及版权研究、资金和资助协作规划等。
国际共享研究协会成立于1989年,其前身名为国际共享资产研究协会,是一个非盈利组织,致力于认识和改进由发达和发展中国家社区建立的公共资源管理机构。该组织的研究目标是鼓励多学科、多领域、多种资源类型之间的知识交换、促进学术和实践经验的相互交流和转化、促进合理的机构设计。
2 数字资源及其组织
DLC的资源主要包括了一个公共资源文本数据库和图片数据库,此外还包括有一个公共资源综合书目、主题词库和公共资源研究相关推荐站点链接。
2.1 公共资源文本数据库(Text Database)
公共资源文本数据库是DLC包含的最为主要的资源,它包含的公共资源主题类型主要分为十五个部类,即农业、渔业、林业、一般和多元资源、全球公共资源、放牧、历史、信息和知识、土地使用权的使用、新公共资源、社会组织、理论、市政公共资源、水资源、灌溉和野生动物(每个部类包含的资源数如表1)。这些资源以6种文档类型呈现:书、图书章节、会议论文、期刊论文、学术或研究论文以及工作文件。这些资源主要分布在11个地区:非洲、南极洲、北美洲、中美洲和加勒比海地区、东亚、欧洲、原苏联、中东和南亚、北美、亚太和澳大利亚及南美这些地区。该数据库包含有政治理论和政策分析研究室研究图书馆的广泛打印资料,使得DLC成为世界上包含了有关公共资源方面最为丰富的数字图书馆。这些资源的组织一般会以最初的清单形式列出,通过资源的标题可以连接到它简单的书目记录中,从简单的书目记录中,我们还可以获得它包含的描述性元数据和技术信息的复杂书目记录和全文。
2.2 图片数据库(Image Database)
DLC图片数据库主要包括森林、渔业、城市街道、广场及畜牧业系统等公共资源方面的照片、地图和卫星图像。它由过去三十年里来自政治理论和政策分析研究室的研究人员拍摄的约1285张照片和幻灯片组成。这些照片主要是来自实地考察、会议访问及公共池塘(集中)资源,如尼泊尔灌溉系统、非洲森林、国际共享资源协会会议及国际森林资源和机构项目的研究地点。2008年该数据库所包含的文献总量已达3580条,2009年年底达到5298条。它是DLC的一个与文本数据库相独立的服务功能,也是唯一一个供公共资源方面学者研究的免费图片数据库。数据组织者对每张照片都按标题、拍摄日期、拍摄者、区域、行业、关键词、打印地点这些字段进行描述,用户既可以按照这些字段浏览图片,也可以直接通过检索词来查找图片。
2.3 公共资源综合目录(Comprehensive Bibliography of the Commons)和关键词词库(Keyword Thesaurus)
公共资源综合目录,即将公共资源文献分解成更有针对性的书目主题,它包括了数量巨大的有关公共资源方面文献的书目记录,以向用户提供按字段、题目、作者或著者检索数据库内文献,并提供了高级检索。它在2008年7月更新后包括了57885条引文和16740条摘要,而在2010年10月更新后,引文和摘要分别增长到60401条和25263条。检索出的条目也都包含有完整的书目记录,即引文、作者、时间、标题、来源图书馆、国家、关键词、部门、区域等字段。
关键词词库,即主题词库,是公共资源数据库中描述和组织文献时使用的首选关键词列表,它按书目、案例研究、城市(州、县)、比较分析、国家、大陆、经济、评估、历史、文献综述、计量、方法论、模型、性能、政策、研究、学习和教学、理论、话题等标准进行细分,并按26个英文字母将关键词一一排列。关键词词库有利于规范用户的检索词,提高检索效率。
2.4 公共资源研究相关推荐链接(Commons Related Links)
公共资源研究的相关推荐链接,主要包括关于公众共享数字图书馆的信息(DLC简单技术介绍和目前及过去的工作人员介绍)、公共资源的详解、主题词库、公共资源综合目录、主题目录、有关政治理论和政策分析研究室和印第安纳大学数字图书馆项目的相关信息及国际公共资源杂志和一些网上公共资源免费期刊和简讯。其中,国际公共资源杂志是专门研究公共资源的国际期刊,一年出版两期,主要内容包括公共资源的使用创新、微观公共资源、研究论文、书评等模块;网上免费公共资源期刊和简讯主要有《非洲研究季刊》、《环境监测进展和建模》、《非洲研究季刊》、《阿拉斯加渔业研究简报》、《旱地简讯》、《亚洲发展回顾》等。
3 服务方式
DLC为实现其资源共享空间的价值,为广大用户提供了形式多样的服务。
3.1 目标用户
DLC是一个创新的面向多用户的数字图书馆,因其需要相关学者的参与来扩充和发展,所以它具有明确的国际关注群体。其服务面向跨学科的世界性群体和组织,如政策制定者、科学家、经济学家、教育者及相关的从业人员。可以说任何对公共资源研究感兴趣的单位和个人(主要是学术机构和群体),都可以成为DLC的服务对象。
3.2 主要服务方式
DLC提供的服务包括了初级和高级检索、目录浏览、学者提交门户、邮件提醒定制服务、引文服务等。此外还提供了一个主题目录和一个可供检索的公共资源综合目录,辅助用户检索数据库中的资源。
(1)资源检索
简单检索:DLC的文本数据库提供有以标题、关键词和摘要为可检字段的简单检索。用户可以使用任意的单个标题、关键词或摘要进行检索,也可以使用表示它们之间关系的And、Not或Or来连接两个或多个字段进行检索,或者是使用检索框下拉菜单中提供的提示选项进行检索。对检索结果的显示,不但可以限定每页显示的条目数,还可以通过对提交时间、标题、相关性、出版时间的限定进行升序或降序排列。
高级检索:DLC还提供有高级检索功能,通过限定一个或多个字段,如全文、作者、出版年份、标题、关键词、区域和部门、会议及上传时间,使用一个字段或者是使用And、Not或Or来连接两个或多个字段进行检索,检索结果也可以同简单检索一样,对其进行相应的组织和排序。
文本数据库提供的是全文检索,检索结果都可按相关性排序。图片数据库的检索与文本数据库的不同在于它拥有更为广泛的元数据字段可供检索,这些元数据包括关键字、国家、地区、部门、摄影师、标题、摘要和拍摄日期,在检索中还可以通过国家、地区、部门、摄影师、关键词来进一步缩小检索范围。
(2)目录浏览
DLC还提供通过文献类型、日期、作者、标题、部门、区域、会议和主题进行目录浏览检索。在通过这些类别检索时,可以通过首字母进一步选择和限定所要查找的内容,在浏览类别的二级页面里,还分别有检索框,可进行进一步精确检索。如进行时间类别的目录浏览时,在时间类别的二级页面里,用户可以选择下拉菜单提供的选项来选择月份和年份以确定一个时间段或者是直接给出所要查询资料的年份,搜索的结果可以按上传时间或出版时间及标题进行升序或降序排列,并同时可以选择一次显示给出结果的数量。目录浏览方便了用户在无法确定检索词时实现其检索需求。
(3)关键词库和公共资源综合目录
为了规范用户的检索词,提高用户的查全率和查准率,DLC还提供了关键词词库,这些关键词按国家、大陆、经济、评估、历史、性能、政策、研究、学习和教学、理论等标准进行标准细分,供用户按首字母顺序查询,由于这些关键词是DLC进行数据组织时提取的关键词列表,所以可以很好地规范用户对检索词的选择,减少用户检索的盲目性,提高了检索效率。
公共资源综合目录,因其包括了数量巨大的有关公共资源方面文献的书目记录,可以为用户查找资源提供很好的参考和对照,使得用户可以容易地作出下一步的检索策略,即确定是否是想要查找的资源、是否需要进一步查找全文等。另外,它包含的公共资源范围大于DLC文本数据库的资源范围,所以从一定意义上说,它还是DLC资源一个很好的补充。
(4)输出引用服务(Export Citations)
DLC在其首页还推出了输出引用服务,即允许用户在检出所需资源时,创建该资源的引用列表,这是通过点击目录记录列表的引用按钮来实现的。输出后,一个可下载的文本提供了列表项目的所有目录信息,包括文献类型、作者、期刊、卷数、页数、出版时间、链接地址、部类、区域、主题、摘要等供用户参考使用。
3.3 DLC的特色服务——作者提交门户(Author-submission Portal)
作者提交门户是DLC服务的一大特色,即在使用邮箱注册后,用户可以直接登录到DLC的提交界面,按照其规定和操作流程(描述、上传、复审、许可、完成)可以提交任何形式存在的相关文献。在描述环节,DLC按其数据组织的要求列出了上传文献状态(发表与否)、标题、作者、发表期刊、发表日期、卷数、主题、国家、区域、行业、语言、文献性质(案例、理论)等详细的描述要求,这有利于规范上传文献,节省入库和投入使用的时间。其中主题和区域的描述都有DLC提供的规范词库,方便用户选择使用,减少了作者上传的困难,同时也增加了数据库的规范性,方便用户检索。这种交互式的服务方式,强调了用户的参与性,调动了用户的积极性和主观能动性,也充分体现了DLC资源公众共享空间这一理念,从而使得DLC资源可以不断地得到丰富、扩充和可持续发展。
此外,DLC还提供在一些类别下显示最新提交的资源列表服务和邮件提醒定制服务。邮件提醒定制服务即用户可以通过邮件注册,随时接收其感兴趣主题有新更新的提示,这可以使经常访问DLC的用户与DLC更新保持同步,不错过任何感兴趣资源的新动态。
4 技术特征
4.1 数据的采集、储藏和传递
DLC自2000年起应用IBM内容管理器管理来自WPTPA的原始资源,后来在2001年升级到EPrints,这大大提升了作者提交门户的性能。因为EPrints使得学者可以在世界各地提交和上传他们的著作。由于DLC所包含的资源多是来自实地研究,因而这就更突显了EPrints系统的价值。但是EPrints需要特殊的技术支持,需要人工导出和上传目录,并且它无法与DLC新的基础设施兼容,所以在2009年以后它由DSpace代替。
目前的DLC是在DSpace上运行的,这是一个应用于建设数字图书馆的免费、可完全定制的软件。它可以收集、存储、索引、保存和重新发布任何数字格式、层次结构的永久标识符研究数据,是一个专门的数字资产(Digital Assets)管理系统。它支持多种媒介,如文本、视频、图像和数据集,该软件可以下载,并流行于学术界。它遵循开放存取档案对于元数据收割2.0版的协议,提供了学术研究文献资料库互操作的框架。它对可持续发展有积极的远见,有广泛的支持群体,并配置了有关界面的外观以及索引和数据字段的设计,使得它成为DLC的最佳选择。
图片数据库在开始运行时,它底层的数据库和数据输入系统是基于库什曼项目的,它的检索和发现接口是一个研究生的设计。里面的图片是基于PHP格式,交付图像存储在本地目录,而主文件存储在HPSS(High Performance Storage System,一个高性能的存储系统)里。新的数据库是基于DLP(Digital Light Processing)系统和工具的,这是一项使用在投影仪和背投电视中的显像技术,它使用Fedora的数字数据库来管理元数据和图片。新的图片数据库使用照片编目工具来录入数据,具有MODS(Metadata Object Description Schema,元数据对象描述框架)的标准兼容性、灵活性和可配置性。
4.2 界面设计
DLC的界面设计为用户提供了简洁易用的导航界面:它把检索功能、浏览菜单、账号登录和相关链接这些功能设在首页的左侧(其中检索栏在最上面),在首页的顶部设置图片数据库链接和导出引文功能链接,在界面的中央部分显示介绍该站点的主要内容。这种简洁而又突出重点的页面组织和安排使用户获取信息更加便利,并且使得该数字图书馆的主要服务都可以在首页获得,这就简化了浏览和检索资源的过程,这一界面的连贯布局也保持了用户的认知平衡性。
DLC界面设计的友好性使用户在首页就可很快地获得所需信息,这也是DLC高性能的一个表现。特别是当用户使用“时间”或“标题”进行浏览时,最新更新的相关资源列表可以很快展示出来,而这只需要从首页进行一次点击即可。使用文献类型、作者、主题、区域或部门及会议进行浏览,也只需从首页的一次链接就可以获得信息,这在某种程度上减少了有些导航所需的反复点击链接的过程,从而减少用户导航迷途,这也符合在与用户的互动中尽快使用户获得主要资源的要求,促进数字图书馆结构的扁平化发展。
4.3 软硬件支持
DLC站点可以使用Microsoft Internet Explorer、谷歌的Chrome和Mozilla Firefox浏览器浏览,这些浏览器保障了站点的稳定性。经过检验,它基本没有断开连接的现象,只是有时会因为网络原因出现链接服务器超时的现象。
DLC以PDF格式传递文档,它需要Adobe Acrobat阅读器来浏览阅读,可以在Adobe网站上下载。
5 评价和建议
DLC是一个很有价值的数字图书馆项目。该项目很重要的一点是它集中了世界范围内有关公共资源研究方面过去和最新的研究资料和图片,并使得世界范围内的用户可以免费获取这些资源。其开放获取和自主提交这一特色服务,使得它收录的公共资源更加丰富多彩;其易用的开放获取软件和界面友好性设计不仅增加了用户的使用频率和长期性,还大大节省了该项目的成本,使它不会受制于资金限制;其功能强大的简单检索、高级检索和目录浏览并附之于综合目录和规范词表,大大提高了用户的检索效率;此外,DLC还十分注重网站管理,与时俱进地调整和变更系统支持软件,使得该资源共享空间的各项功能得到更好的发挥。
当然,DLC也存在一些亟待改进和提高的方面。它依赖资源提交者使用有关主题词和部类等条目来分类和组织资源,但所有的提交者不一定具有同等水平的关于主题词和叙词表条款的知识,或对上传资源的定位和分类不准确,所以上传的条目可能存在许多不恰当或不准确的描述。这就需要建立一套资源评估或审查标准体系,它一方面可以规范资源的组织形式,另一方面也保证了上传资源的质量,从而增强了DLC资源组织的准确性和权威性。除了简单介绍公共资源和数据库内容外,该站点没有任何其他的帮助和辅导项,这使得新用户在使用数据库资源时需要花费很多时间来熟悉和了解网站布局和功能。由于该项目是面向全球用户的,所以提供多语言资源会给其服务增色不少。另外,笔者认为DLC如果提供更多的互动服务(如提供参考咨询服务)会使这一资源公众共享空间更有价值,这样该数字图书馆将有可能变成一个公共资源方面专家学者相互交流的空间和平台。
标签:数字图书馆论文; 公共资源论文; 文本分类论文; 用户研究论文; 文本分析论文; 公共数据库论文; 文献回顾论文; 公共空间论文; 数据检索论文;