基于用产需求挖掘的高校图书馆数字资源规划,本文主要内容关键词为:图书馆论文,需求论文,高校论文,数字论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
20世纪80年代初,发达国家为建立“计算机化企业”而提出了“总体数据规划”的理论与方法。我国于80年代中期开始引进。在实践中发现,通过数据标准化工作使总体数据规划更为扎实,使总体数据规划成果更能在集成化的信息系统建设中发挥指导作用,这就是我们所说的信息资源规划。国内较早提出企业信息资源规划理论的是大连海事大学的高复先教授。企业信息资源规划着眼于数据层面,通过全面规划为企业信息资源的管理制定基本标准并落实到建模,从而达到全面规划的目的,以指导后续的各种应用系统的运行。这一理论后来被扩展到其他领域中。图书馆领域的信息资源规划研究是在最近几年,如2005年度由武汉大学信息资源研究中心马费成教授主持的,教育部哲学社会科学研究重大课题攻关项目“数字信息资源的规划、管理与利用研究”等,但研究主要集中于宏观层面上。本文试图从个体图书馆的角度,来研究信息资源规划理论对图书馆数字资源建设的指导作用。
高校图书馆的主要任务,是通过提供信息资源、信息素质教育和相关服务,来促进大学的科研和教学。网络环境下信息用户从面向图书馆的信息需求,向面向社会化的信息需求模式转变,传统的以固定信息机构为主导的信息服务体系正被以用户为中心的动态信息服务体系所取代。多元化的信息资源体系是图书馆服务的基础,文献传递、馆际互借、联机访问、远程登录等资源共享方式能方便实现,图书馆不必追求独立完整的馆藏体系,而应在地区或全国性的资源建设体系中分担建设具有本地区、本馆特色的馆藏数据库,供资源建设体系中的成员用户共享。高校图书馆进行信息资源规划的意义就在于更好地整合现有各种载体的信息资源以及提出对未来的规划,以满足用户的多种需求,提供更好的服务。
1 图书馆信息资源规划的概念
图书馆信息资源规划(Information Resources Plan,简称IRP)的概念是在广义信息资源规划概念的基础之上,结合图书馆的工作性质而提出来的。图书馆的信息资源规划是对整个馆藏资源的生命周期,从评估、选拔、采集、处理、传输、利用、续期及取消的全面规划。具体说即是梳理和规划图书馆的业务流程,理顺用户信息需求,制定合理的馆藏发展政策。充分运用现代信息技术,执行相关信息标准规范,整合现有的信息系统及各种应用,从而积极稳步地推进图书馆信息化建设。整个环节的核心要素是人、信息和技术。
信息资源规划可以有效地解决信息资源有限的生命周期与长期需求之间的矛盾。对多数图书馆而言,实施信息资源规划并不需要对全部流程进行重建,它是为了确保传统图书馆与数字图书馆的充分耦合,逐步构造面对多种载体与多种媒体的元数据和对象数据,建立数字资源采集、标识、管理、存储、发布和长期保存的业务流程和业务规范,并将其与传统图书馆的采访、编目、借阅、咨询和典藏业务流程进行整合。
高校图书馆的信息资源规划可以划分为三个层次:数据层规划、应用层规划和业务流程层规划。它是以数据层规划为核心和基础,通过应用层规划和业务流程层规划,完全整合高校图书馆的信息资源,确保高效率地管理这些信息资源。在数据层,高校图书馆信息资源规划的目的是通过制定部门的数据元素标准、信息分类标准、用户视图标准,建立图书馆功能模型和数据模型,提高图书馆的数据共享能力,减少数据冗余和重复建设;在应用层,高校图书馆信息资源规划的目的是利用现代信息技术提高工作效率和服务质量,是在一个统一的数据平台上部署各个相对独立的应用系统以及确定彼此之间的作用和关系,并使各个应用系统集成运行成为可能。基础平台是IRP的核心内容,它为各个应用系统的集成提供系列的基础服务,使得各个应用系统得以实现数据共享、系统间应用访问,并向用户提供统一的访问接口;在业务流程层,信息资源规划的目的是实现高校图书馆运作流程的无缝集成和整合。为此,要结合各馆的实际和信息技术的要求,在理论上构造和优化业务流程。
2 基于用户需求挖掘的数字资源规划流程
图书馆数字资源的规划项目,可以由用户如学者或学生,或由工作人员(馆长或馆员)发起。高校图书馆要有规划团队,馆藏的项目往往涉及来自不同学科或机构的个人,成员应考虑到资格、能力以及学术水平等。规划项目实施期间往往需要特殊岗位的工作人员,包括规划制定者、元数据制作者以及数字化技术人员。完成馆藏或馆藏随着时间的推移稳步增长,最好应该归并到正在进行的组织内部工作流程中。
规划项目包括为将来的馆藏所做的计划,用户能持续获得馆藏,并提供一定水准的馆藏维护。它包含了该项目的所有方面,从加工流程到最终馆藏网站的外观和感觉。在项目的早期,规划者就应该明确受众对馆藏的目标,并做一个需求评估,以确定这些用户的功能要求。然后做一份书面的项目计划,涵盖项目的所有重要方面:短期和长远的目标、项目的限制(如时间,资源,政治因素影响)、数字化、版权问题、元数据和检索、维护、推广和评估。
2.1 评估计划
每一项活动的成效,必须测量其有效性和对学生学习的影响,高校图书馆将建立评估方法、程序和服务。一个数字资源的评估计划证明了对一个馆藏项目负责任。评估主要在于过程和结果,如人员配备和管理、工作流程和程序。短期重点是对结果的评价。一个项目的目的和目标应该是帮助项目组将理想成果具体化。一个馆藏项目的产品、服务和影响,都可能成为评估的目标。在评估一个馆藏建设项目的产品时,评估者可能会看馆藏的数量、质量和使用效果。此外,馆藏网站的可用性、用户对于馆藏和服务的经验、馆藏对用户行为的影响也是一个项目成功的很好的指标。这一流程应该有比较规范化的资源评估方法和评估标准体系。当然也应该允许图书馆自定义评估模型,并且通过强大的统计计算能力为评估的准确性和客观性提供保证。
2.2 用户需求挖掘
确定目标用户,细化用户需求,建立有效的用户反馈机制,增强与用户的互动与交流。研究用户与图书馆馆藏的互动,特别是在网络数字环境中,提供有价值的信息,作为开发创新数据的显示和反映用户行为的接口,并提供有价值的馆藏给用户。图书馆具备许多宝贵的用户需求的数据源,如用户简介、注册信息、读者调查数据、交易日志、数字资源点击率、流通数据、馆际互借要求、虚拟参考咨询、高校科研工作者在发表论文中引用文献的数据以及更多。数据挖掘技术使得图书馆可通过机器处理现有的信息源。网络统计工具,如Web Trends Log Analyzer、SPSS、SAS等可以用来对数字图书馆的用户数据进行深层次的数据挖掘,不仅可以了解数字图书馆网站的访问量,而且可以统计不同的数字化资源被访问的频率、逗留时间、是否被下载等等,还可以对用户进行跟踪分析,并可根据需要给出详细的统计图表。
新模式的切割数据,自然会导致对于馆藏的一些新看法。馆员需要强大的数据分析,以帮助他们发现如何来分割其馆藏以形成有用的建议,以有利于发现(例如按材料类型、格式或检索方式),或支持特定的图书馆功能(例如馆藏开发、数字化或保存)。书目记录和其他来源包含了丰富的信息,可以支持建立和维持这种看法。举例来说,图书馆保藏决定要根据资源特点的数据,如数量等。同样,数字化的决定可通过提出关于加强知识产权保护的倡议、辨认文献将被数字化的出版商等这些数据。这些信息往往可以从文献书目记录中提炼出来。图书馆已分享跨越机构界限的馆藏,但跨越各地图书馆收藏的数据挖掘,可以敞开大门,为合作馆藏管理提供新的机会。研究控股模式集群体制在财团、地区,甚至是国家范围内,以减少交叉重复收藏和把有限的资金释放出来,以填补空白藏品。
2.3 系统建模
图书馆系统建模的过程。可采用自顶向下逐层分解,使整个复杂的系统简单化,抽象的系统具体化,直至分解到可执行的模块(即可编程模块)。其核心机制就是对数据的分析和处理。要建立稳定的数据结构,并定义系统所采用的技术和组织、所需的关键数据路径以及信息系统设计过程。采用面向对象的组件技术开发方法,将各种业务逻辑单元封装在一起,使图书馆能够根据业务需要进行有效组合。为了适用于不同用户的需要,系统必须设计灵活多样的参数配置,具备高度的可扩展性和可移植性。图1是基于用户需求挖掘的数字资源规划模型,这种模型主要从概念上和逻辑上对一个组织的数据及数据流进行合理的规划,它能被用户和数据处理专业人员共同理解,并从全局的角度,有效合理地分布和组织数据,为下一步数据库的物理设计奠定基础。
图1 基于用户需求挖掘的数字资源规划模型
数据层是挖掘的原始数据来源。图书馆的电子信息系统中存储着大量的书目、统计和其他类型的数据。提取和分析这些数据可以为馆员提供有用的信息,为馆藏、服务和系统作出明智的决定。而这些流程日志文件一般包括任务名称、执行主体、开始时间、结束时间、前提条件、约束条件等详细描述,可以采用OLAP(On-Line Analytical Processing,联机分析处理)等技术进行深层次、多角度的分析,OLAP是仿照多维的和以都柏林核心元数据为基础的技术。过滤掉不完整或可能引起异常现象的数据,通过多层次、多维度、多变量操作,生成具有不同粗细粒度的用户需求的知识,增强信息价值;模型中设置应用层的目的一方面是方便与用户进行交互,用户可以通过一定的软件环境指导挖掘过程以及查看挖掘结果;它的另一个重要功能是为后续工作提供接口,数据层所挖掘到的数据只有结合具体的业务,才能真正发挥作用;模型的关键是构建用户需求挖掘系统与图书馆管理信息集成系统之间的桥梁,借助XML或Ontology技术进行语义抽取、标注与描述,将异构日志文件转换成具有统一语法和语义格式的通用数据模型。2.4 组织实施和维护
数字资源配置要着眼于以有限的投入最大程度地满足用户的需求,不断提高信息资源的可获得能力也是图书馆信息资源规划工作的一部分。数字资源的使用和运行环境包括硬环境(本馆的网络环境和服务器、存储等硬件支撑设备)和软环境(数字资源维护和服务人员的情况),以及用户数字信息资源检索能力的不断提高。
好的馆藏项目,是根据明确的馆藏发展政策或已经商定并记录在案的方案进行规划。馆藏发展的各方面因素是与图书馆的发展目标紧密联系在一起的。数字化馆藏应与整个馆藏成为一个整体,数字化藏品不应该完全脱离原纸介材料。有人常常假设数字化将极大地增加原材料的使用或原材料的价值,这也不确定。
数字化馆藏应该包括用来描述和管理它们的元数据,元数据和数字化馆藏是作为一个整体提供给用户的。馆藏项目必须对信息资源的收藏状态、查询需求和检索属性进行描述,这也就离不开元数据的信息描述、信息组织功能。通过利用元数据对用户信息资源进行描述建立数据模型,分析评价数据模型,指导图书馆信息采集、用户服务等。元数据的建立是一个渐进的过程,不同类型的元数据可以由不同的人在一个信息对象生命周期的不同阶段加入。举例来说,在数字资源创建阶段,关于数字对象的作者、贡献者、来源和可能的用户的元数据可由最初的创建者提供。在组织阶段,关于数字对象的主题、出版的历史、访问权限的元数据,可由做目录或索引的人记录。在检索和使用阶段,关于数字对象评价信息的元数据,如评论和说明,可以由用户补充。应鼓励数字对象的创建者,在共享或分发之前嵌入尽可能多的元数据。
元数据能为不同资源系统之间的转换与整合提供一种工具,数字图书馆是用多种元数据标准来描述不同类型的数据对象。如网络信息资源通常用DC来描述,而XML和RDF的结合,可以实现数据基于语义的描述,便于信息资源的检索和相关知识的发现。元数据在应用中有其局限性,它无法发掘信息资源内所含的内容。而知识本体Ontology能够在一定程度上解决异构资源的语义异构和资源对象间复杂的关联关系。目前资源组织大都是依据单纯的元数据方案,难以体现资源间复杂而多重的内在联系。如果针对不同学科的资源内容建立起相应的领域知识本体,并在此基础上,通过不同知识本体的语义映射实现异构资源和系统之间的语义联系,即可将各个元数据方案构建成立体的知识网络。除了对象和元数据以外,数字化馆藏将包括至少一个检索它的接口,这个界面通常包含一个检索对象的途径、一个通过对象的种类浏览的方式、检索的方法、提供和使用对象。
3 结束语
随着国家对高校建设投入力度的不断加大,高校各方面水平都进入稳步提升之中,最能够体现学校整体水平的数字图书馆建设也逐渐成为各界关注的焦点。高校图书馆作为学校的信息中心,更加重视数字图书馆的建设,它是一项长期而艰巨的任务,必须统一规划、分步实施。信息资源规划最重要的意义在于运用最新的信息技术,支持动态的业务需求,为数字资源建设提供指导工具和模型。我们将整合一切有意义的、全面的图书馆内部因素和外部因素,纳入到信息资源的规划中,并且加强教育,以支持图书馆的各项服务和项目。
收稿日期:2008-06-17