基于用户需求的信息资源整合研究与实践,本文主要内容关键词为:资源整合论文,需求论文,用户论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着信息技术、计算机技术、网络通讯技术的不断创新,因特网已形成为目前世界上最大的信息生产、加工、存储与交换的环境和渠道。因特网正在改变着整个世界,大量以数据库、超文本、多媒体等电子、数字形式存在的信息资源正逐步占据网络时代的主导地位。同时,图书馆的馆藏结构也由于电子文献的引进,而发生了根本的变化。面对信息激增的现代社会,仅凭传统馆藏资源、有限的图书经费或传统的馆际互借方式来开展服务,显然是满足不了高校师生的文献信息需求的。因此,以满足用户需求为导向的网上资源整合,为图书馆开辟了一个全新的信息服务活动空间。
1 网络信息资源的整合
网络信息资源整合即将多种来源的信息资源进行搜集、评价、排序、过滤、分类、标引、建库等加工,使用户能够通过统一的检索平台查找和浏览相关信息资源的一种服务方式。目前,重点高校的图书馆一般都有良好的网络环境,并拥有一批既懂图书馆学又懂计算机技术的人才队伍,完全能胜任对网络信息资源进行深度挖掘、整理、排序的任务,可以把网上的免费资源转换成本馆的数据库资源,使之成为图书馆文献资源的重要组成部分。
图书馆网络信息资源整合一般来说包括以下内容:馆藏文献与引进电子文献的整合;网络学科专题资源的整合;电子数据库资源的整合。在进行资源整合时,对于第一和第三项内容由于主要途径是靠图书馆或国家通过购买数据库获得,因此这些资源的整合开发涉及的主要问题是将馆藏文献与引进数据库的整合。网络学科专题资源的整合这一内容则需要根据本校的学科专业特色和需求选择性地收集网络学术信息资源,以学科或专题的形式开发出适合于本校的、较为深层次的资源整合产品。
2 网络信息资源整合中应注意的问题
2.1 信息的存储形式的选择
目前在网络信息资源整合中信息的存储方式多样,根据媒体类型可分为文本、图像、声音、动画、视频及综合等类型。在数据库中主要以二维关系型数据库形式存储,近年来随着XML技术的发展及相应的行业标准规范的出现,也有不少数据直接用XML形式存储。由于XML具有扩展性强、交互良好、结构化等特点,今后这种数据形式将占据主流地位。
2.2 数据标准的选择
元数据,是指数据的数据,指“用于描述某种类型资源(如对象,Object)的属性,并对这种资源进行定位和管理,同时有助于数据检索的数据”。目前国际国内图书馆界有好几种常用的元数据标准,但采用国际通用并广泛用于资源检索的都柏林核心元数据标准(DC)的较多,各馆可根据本馆实际编写适合于本馆的数据标准。数据库统一采用适合元数据标准的字段名,是为了实现界面统一与跨库检索,并为今后元数据转成XML文档提取数据提供参照标准。
2.3 知识产权问题
在现代网络环境下,保护知识产权问题是一个不容回避亦越来越突出的问题。目前,在网络知识版权方面,中国的法规建设尚赶不上互联网的发展速度。图书馆在网络信息资源整合中,要重视和适应加入WTO后版权保护的法律环境,妥善处理资源数字化过程中与“WIPO”电子版权规则的冲突,如优先整合超过著作权保护期的文献、作者允许他人免费使用的文献、法律法规、政府出版物等;利用免责规定,对版权作品进行资源整合建成数据库后,在图书馆网站上授权用户浏览,但应限制下载、打印等复制行为,最大限度地保护著作权人的知识产权;对于整合网站资源应采用超链接方式作为虚拟馆藏,并能在接到指称侵权通知后,立即撤消链接或封锁对该网站资源的访问途径。在版权法允许的范围内正确规避“WIPO”的电子版权规则和合理利用网络信息资源。
3 华南理工大学图书馆信息资源整合的实践与技术实现
3.1 图书馆信息资源整合实践
近几年,我馆主要对以下三方面内容进行了信息资源的整合实践:
一是对馆藏与电子期刊的资源整合。此项整合工作的具体内容是将馆藏自动化系统与订购的电子期刊对应起来,将电子资源纳入馆藏体系,扩展馆藏范围及获取途径。大致可分为三个步骤,馆藏期刊的回溯建库、引进全文电子刊的导航库建设和馆藏印刷类期刊与全文电子刊的整合。
二是重点学科、电子资源及期刊导航资源的整合。这一部分开展的整合工作包括利用因特网资源和馆藏资源建设重点学科导航库;因特网信息资源与图书馆电子资源导航的整合;本馆期刊资源与网上相关资源的整合等。
2000年以来,我馆已建成了多个国家级重点学科导航库,这项工作主要是将网上相关信息资源进行采集、重组,按照学科、主题、字顺等项进行综合站点、专业站点、电子文献、学术机构等多种导航,并提供各数据库和站点间的超文本链接。用户进入导航系统,检索某一学科信息时,系统便会展现所有与该学科相关的站点资源,使用户一目了然;“电子资源导航系统”集成公共联合目录、学术信息门户站点、各国免费的专利、标准信息站点、科技报告等学术信息,分别按学科、文献类型及数据库类型等多种方式将因特网和本馆引进的各类信息资源整合在一起,为用户在查找学术资源时提供多种入口和便利,同时在线提供“资源介绍”使用户通过该系统即能全面、准确地了解一种电子资源的类型、特点、使用权限等。用户还可通过在线帮助课件自学数据库的使用方法,提高了图书馆用户培训的效率。“期刊资源导航系统”设计了五大板块:“本馆期刊资源”、“期刊联合目录”、“期刊评价体系”、“试用及免费电子资源”和“电子全文刊数据库”等。整合信息资源涉及到订印刷版、光盘版、网上全文刊、数据库及动态更新型网站等多种类型,为用户“查找、评价、投稿期刊资源”提供一体化服务。由于导航库贴近用户需求,自2002年11月开通以来访问率高达27.9万人次。
三是对特色专题信息资源进行整合。网络资源必须经过严格筛选、有序组织才能成为图书馆虚拟馆藏的有机组成部分。从2002年起,根据用户调查意见,本馆开展了不少特色网络资源的加工整合工作,并形成了一些应用效果良好、访问量较高的专题性信息资源。比较受用户欢迎的有:“建筑艺术与技术资料库”、“会议之窗”、“期刊评价体系”、“科技创新信息参考数据库”、“免费电子报刊导航”、“专利、标准导航”等系统。
3.2 技术实现路线
由于信息资源来源和类型等的不同,对上述内容进行整合所采取的技术路线也不尽相同。
3.2.1 馆藏与电子期刊的资源整合技术实现路线
对于这一部分资源的整合,主要是将馆藏自动化OPAC系统与订购的电子资源联系在一起,为用户查找电子资源提供相关指引,因此整个工作分为三步(见图1):
图1 馆藏与电子期刊的资源整合实现路线
首先,对馆藏期刊进行回溯建库。与大多数图书馆一样,我馆的数字化建设也是从馆藏资源的建库开始,将本馆收藏的印刷版期刊分中文、西文、日文三个步骤进行回溯建库工作,从而为馆藏资源的数字化整合走出了第一步。
其次,建设引进全文电子刊的导航库。当电子资源尤其是电子期刊资源大量引进之后,整合分处于不同数据库或检索平台的电子期刊资源,建立便于用户“一站式”检索的“西文电子全文刊导航系统”是整合的第二步。该系统将本馆订购的7600余种全文电子刊全部整合到一个数据库中,其中包括IEL、Springer-Link、Elsevier、ASME、Wiley等十多个电子期刊数据库,以IP控制访问权限,提供了多种检索途径和检索入口。只要是校园网的用户,无需认证,即可方便、快捷地检索图书馆所有已购买的电子数据库,一步链接到位。
最后,将馆藏与全文电子刊整合。技术实现主要是利用馆藏印刷版MARC记录的856字段,利用超文本传输协议HTTP将有关的电子来源结合起来,使校园网用户在图书馆的OPAC系统中可以直接链接到有电子版的期刊。这种整合方式可以将不同出版商提供的电子刊和馆藏纸版刊有机地结合在一起,既可以提高数字资源的利用率,又可以使印刷类馆藏价值得到充分利用,避免了重复购置相同年限的电子资源造成的投资浪费。
3.2.2 重点学科、电子资源及特色专题数据库资源整合技术路线
目前,对这类资源的整合主要采用的实现路线有两种:一是购买已成熟的产品,如TPI、TRS系统,通过系统自动抓取或批量倒入已收集整理的数据,定制发布界面实现自动发布功能,这些系统一般具有通用性强、易于操作、发布简单等特点,在图书馆应用较广;第二种则是利用网络编程语言与数据库结合,自行建设发布平台,这种方式具有成本低廉、便于移植、设计风格个性化的特点,因此对一些技术实力较强的图书馆可以采用这种方式。对于上述两种方式,大多数图书馆在实际开发中都有结合使用。在这里,本文主要介绍的是如何通过网络编程语言与网络数据库结合自主开发专题数据库的技术路线。
第一步,数据库结构设计:
首先需要选择自己比较适用的数据库系统,目前比较流行的关系型数据库包括SQL SERVER、ORACLE、SYBASE等大型数据库系统,一般中小型图书馆根据数据量及访问量多少可以选择基于Microsoft平台的SQL SERVER或者LINUX平台下的Mysql、Postsql等数据库系统。
以我馆“期刊资源导航系统”为例,我们选择的是基于LINUX平台下的MYSQL中小型免费数据库系统,该系统具有成本低廉、使用方便、查询快速、备份简单等特点。
数据库结构设计最重要的是字段设计,在这里要注意与元数据标准结合,力求使自己的建库内容与标准相符。在建设本馆电子资源导航系统时,选取了DC元数据中的15个元数据作为建库依据,分别是:题名、责任者、主题/关键词、资源描述、其他责任者、出版商/代理商、日期、资源标识、资源类型、资源形式、语种、来源、相关资源、时空范围及版权项,并根据实际扩展或增加了某些数据项,如扩展了题名项(包括主题名和中英文并列题名)、日期项(含系统记录创建日期、资源可获得日期、资源版权日期等),增加学科分类、揭示层次、推荐星级、获取途径、使用指南说明、课件下载地址等项,使系统更具科学性,又同时兼顾面向用户的需求,充分引导用户如何查找和利用图书馆的信息资源(见图2)。
图2 电子资源导航系统元数据设计
第二步,导航功能模块设计及实现:
根据期刊导航系统要实现的功能,其模块应包括该导航系统应具备基本的检索功能,系统设计按刊名、关键词、学科(或主题)、ISSN号检索等字段。为便于工作人员用WEB界面管理,还可增设其他检索项,支持布尔逻辑检索、截词检索、字段检索,如结果太多,还可以设置“在当前结果中查找”的“二次检索”功能(见图3)。
图3 导航功能模块设计
对于西文电子全文期刊、SCIE、EI收录期刊等西文类刊名目录除按关键词、学科(或主题)、ISSN号检索外,还应设置按26个字母字顺排列浏览,及对日文、俄文等特殊语种直接查看的功能。学科分类体系则应根据图书馆期刊资源的大致分布和用户、学科分布情况而制定,如工科院校的文科类期刊可按大类粗分,而本校的重点学科则可分得较细,以建立起适于本校的资源分类特点的体系。
第三步,系统集成(程序设计):
简而言之就是利用网络编程语言进行程序设计连接数据库,使数据通过程序自动调用、操作。主要包括程序语言的选择、程序编写、页面调试与正式发布运行。因程序员个人喜好与熟悉程度的不同,对程序语言的选择也不尽相同,一般较常用的有PHP、ASP、JSP等编程语言。程序编制最好用模块化方法,主体程序需良好地实现检索及浏览功能。检索结果的显示每页返回特定数目,设有翻页按钮及命中记录数据,显示字段可根据数据库的不同而选择需显示内容。
至此,一个自主开发、风格鲜明的资源整合系统已基本建立并可进行试运行发布。鉴于当前信息的动态变化性,对于一个整合系统来说,尤其是对网络信息资源的整合,定期更新维护系统数据和及时备份管理系统资源也就显得非常重要。从多年的实践来看,要建设一个数据库并不难,但是很多的数据库在建成之后没有人维护,结果最后遗憾地成为死库,当初的美好创意就这样被遗忘。数据库的寿命长短关键在于后续的维护工作,只有不断补充、更新,数据库的生命力才能长久。
收稿日期:2005-06-26