网络信息资源的开发、组织与管理_组织管理论文

网络信息资源的开发、组织与管理_组织管理论文

网络信息资源的开发和组织管理,本文主要内容关键词为:信息资源论文,组织论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

数字图书馆,就是一种运行在高速宽带网络上的,分布式超大规模的,可跨库检索的海量 数字化信息资源库群。它就是要解决以网络分布为特征的数字资源的开发、组织问题,即解 决网络信息资源的开发与组织管理问题。

一、网络信息资源的特征。

要研究网络信息资源,首先必须了解它不同于传统的文献信息资源的特征。

信息资源根据其载体形式和传递方式,可分为文献信息资源和网络信息资源两大类型。文 献信息资源指传统介质(纸张)和现代介质(如磁盘、光盘、缩微胶片等)记录和存贮的知识信 息 ,它具有较强的系统性、连续性等特点。网络信息资源指通过计算机网络可以利用的各种信 息资源的总和,它包括数据库、时事评论、文学艺术、历史等丰富的文献资料和一些公用软 件,它在特性和构成上与传统的信息资源有显著的差异。

1、内容方面。网络信息资源具有数量上的海量化特征。同时它的种类繁多,除了文本信息 外,还包括了大量非文本信息,如图象、音频、视频、软件、数据库等多种形式存在,呈现 出 多类型、多媒体、非规范、跨地区、跨语种等特点。另外,它还具有分布开放,但内容之间 关联程度强的特点,网络信息被存放在网络计算机上,分布分散、开放、无序化,但是由于 网络特有的超文本链接方式、强大的检索功能,内容之间有很强的关联程度。

2、形式方面。超文本技术的一大特征是信息非线性编排,将信息组织成某种网状结构;其 次,网络信息资源中的多媒体不仅集中了语言、非语言两类符号,还超越了传统的信息组织 方式,从一种媒介流动到另一种媒介,能以不同的方式表现同一件事情。

3、效用方面。首先它具有共享性,互联网信息除了具备一般意义上的信息资源共享外,它 的一个网页可供所有的互联网用户随时登陆访问,不存在传统媒体信息由于副本数量的限制 所产生的信息不能获取的现象。其次它具有时效性,网络信息增长速度快,更新频率高是其 它媒体信息所不能企及的。再次,网络信息资源是一种成本低、产出高的可再生资源。

二、网络信息资源的开发

1、网络信息资源开发的内容。

(1)重点建设数据库,促进网络信息资源的开发。在NII行动计划实施的同时,美国政府就 确立了今后“重点建设数据库,促进网络信息资源开发和利用”的战略发展重点。美国目前 在册的数据库已有3万多个,且库的规模大、容量大、功能齐全,更新速度快。

我国目前数据库建设还存在许多不足之处,比如,数据库信息量不多,相当一部分数据库 是小而全的系统,重复性数据记录多;数据库结构不完善,有的仅能提供数据浏览,检索极 不方便;数据库建设标准不统一,规范性差,造成利用率低、资源共享差。

因此,大力加强数据库的建设是发展数字图书馆的当务之急。首先,要让我国开发的数据 库资源从网络走向世界,必须使用统一的数据记录格式,并向ISO标准靠拢;同时严格实行 信息数据处理规范、守则,使标引的深度、广度合适,文件设置的超链接点分布适度,保证 用户的检索质量。其次,在数据库建设过程中,不仅要重视书目题录型,更要重点建设全文 数据库,全文数据库包括题名、著者、摘要、关键词、正文、参考文献和著作日期等,与书 目数据库相比,它具有不可比拟的优势,它减化了建库步骤,避免了二次加工中人为的差错 ,用户可通过检索直接得到全文。

(2)网上信息资源的开发。在当今网络环境下,图书馆的一项重要工作就是利用网上信息资 源充实馆藏,拓展虚拟馆藏。INTERNET作为一个信息资源的王国,能为用户提供几乎无所不 包的信息。然而由于网络及其信息的产生、传播、管理的无序性,使得用户难以从这种信息 海洋之中获得特定信息。图书馆的职责就是利用其服务手段按用户要求从该信息海洋中提取 特定信息,这正是体现了图书馆发展的无墙化、全球化趋势。在利用网上资源进行数据库建 设方面,图书馆的主要服务手段可以有两个方面:

①根据用户群的需求,从各类信息源中下载有关专业领域的信息,包括二次信息、一次信 息,汇集成一个网上数据库;

②充分开发利用国内网及INTERNET网上信息检索系统,包括中文的搜狐、若比邻、东方网 景等及网上著名的六大信息检索系统:

·Alta Vista(http://altavista.digital.com)

·Excite(http://www.excite.com)

·Yahoo(http://www.yahoo.com)

·Inforseek(http://www.inforseek.com)

·Lycos(http://www.lycos.com)

·Open Text(http://www.opentext.com)

上述系统含有大量数据库,有的达65000个数据库,具有丰富的信息资源。图书馆要对其进 行充分介绍,包括使用方法。必要时可把各种指南译成中文。

2、网络信息资源开发所要重视的技术。

(1)Internet自动漫游技术。人们搜集Internet信息资源的手段是利用一种网络软件在网上 漫游,自动搜集网上的WWW和Gopher、FTP站点上的各种相关信息,并把这些信息存于本站点 上 ,然后组织这些信息并提供服务,这种办法的优点是信息的专指性强,信息库建设速度快。

(2)Internet自动跟踪技术。Internet是一种基于通信的系统,WWW是一个基于客户/服务器 的系统,后者要求尽可能减少用户的浏览时间。基于这两点,有三个重要的技术需要开发研 究 ,第一,输出信息时,信息按照重要性排序,最重要的信息最先输出。第二,检索软件不再 是传统的布尔检索理论,而可能是概率检索理论。第三,增强导航性技术,通过信息的组织 ,方便用户获得信息。

(3)全文信息查寻技术。由于用户信息需求的全方位性,一次文献信息上网对用户更有吸引 力,再加工自动标引技术和文字翻译技术作为支持,使全文信息查询具有更广阔的前景。全 文检索系统与词表相连自动从全文中抽限主题词形成索引文档,进而自动标引出文献分类号 、范畴代码和概念检索词。

(4)刊库一体化技术。数据库的建设要与出版物融为一体,做到一次输入信息,既能建库也 能出刊。我们应进一步开发刊库一体化新技术,如自动抽取款目词,形成索引款目、自动分 类、自动制作文摘和机器翻译等技术。

三、网络信息资源的组织管理方式。

在对网络信息资源进行有效开发的同时,也要加强对它的组织管理,因为因特网上的信息 资源大多处于混乱无序的状态,网络信息资源具有高度的动态性,信息发布具有很大的随意 性,缺乏必要的过滤、质量控制和管理机制,为用户选择利用网络信息资源带来了很大的不 便,使网络信息的查询、检索十分困难,大大影响了信息利用的效率。如何更快更好地在In ternet上查找所需信息是人们面临的一大难题,因此只有对网络信息资源进行有效的组织管 理,才能实现信息资源效用的最大化。

目前对网络信息资源进行组织使用得较多的方式主要有四种:文件方式、主题树方式、数 据库方式和超媒体方式。

1、文件组织方式。一个文件包括数据、程序和字符,是计算机保存处理结果的基本单位。 以文件方式组织网络信息资源简单方便,可以降低信息组织的难度和成本;它还能存贮各种 图形、图像、图表、音频、视频等非结构化信息。但是,当随着网络信息资源利用的不断普 及和信息量的不断增多,以文件方式组织的信息会使网络负载越来越大,当信息结构复杂时 ,就难以实现有效的控制和管理,从而降低信息组织的效率。

2、数据库组织方式。数据库是在计算机存储设备上合理存放的相互关联的数据集合。数据 库组织方式就是将所获得的信息资源按照固定的记录格式存储组织,用户通过关键词及其组 配查询就可找到所需要的信息线索,再通过信息线索联接到相应的网络信息资源。它能高速 处理大量结构化和非结构化数据。数据库技术既可以存取数据库中某一个或某一组数据字段 ,也可以存取一个或一组记录,还可以根据用户需求灵活地改变查询结果集的大小,从而降 低 网络数据传输的负载。今后的关系数据库、面向对象数据库和传统数据库相比,还能提供数 据信息之间的知识关联。

3、主题树组织方式。它实际是提供一种界面机制,用户通过这个界面只与网络信息资源的 主题目录进行交流,并通过主题目录间接地连接并使用多个实际数据资源。它提供了一个基 于树浏览方式的简单易用的网络信息检索和利用界面,用户按照规定的分类体系逐步查询, 查 准率高,树型目录结构具有良好的可扩充性和严密的系统性。但是,该方式要求体系结构不 能过于复杂,每一类目下的索引条目不宜过多,它不适合建立大型的综合性的网络资源系统 。

4、超媒体组织方式。超媒体技术是超文本技术与多媒体技术相结合的产物,它将文字、表 格、声音、图形、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链 接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。超媒体采用非线性 的由节点和链组成的网状结构组织块状信息,类似于人类的联想记忆结构,同时它把数字、 文本、声音、图形、视频等有机地整合,方便地描述和建立各媒体信息之间的语义关系,能 满足人们自然交流信息的过程。

四、网络信息资源组织管理的方法。

网络信息资源的组织管理是一项复杂而艰巨的工作,而解决复杂问题的最简单而有效的办 法便是传统方法的延伸和补充。图书馆编目技术和分类法应用于网络信息资源组织是目前比 较行之有效的方法。

4、1编目管理。可以这样比喻,整个因特网就像一个巨大的图书馆,各个网站就是种类不 同的图书,而每一个网页就是图书中的一页,这样就比较好理解怎样用传统的编目技术来解 决网络信息资源的管理问题。

美国国会图书馆(LC)、美国图书馆学会(ALA)、OCLC都提出用传统的机读目录格式来组织整 理网络信息资源的思路,比较典型的例子是OCLC的因特网编目计划InterCat,到1999年12月 ,InterCat的数据库共有记录92000条,可提供题名、著者、关键词和高级检索、浏览等检 索途径,通过点击“ElectronicAccess”即可链接到相应站点。

网络信息资源编目方面取得重大进展是USMARC一体化编目格式的正式实行,为了适应网络 资源编目的需要而特设了856字段,即电子地址及检索方式字段,856字段著录网络信息资源 的获取方式及其获取的必要信息,通过它可实现书目记录与网络信息资源的链接。用USMARC 进行网络资源编目,编目数据质量高,但编目速度慢、成本高,于是许多新的编目数据Meta data应运而生。

Metadata是网络环境下产生的新名词,它的功能与书目卡片的功能大体相似,通过Metadat a,能够了解到某个网站的资源类型、Web页标题、责任者、主题或关键词以及内容摘要等信 息。Metadata的产生根植于因特网,目前已有许多种Metadata存在,如Dublin Core、PICS 、 Web Collections、CDF、MCF和RDF。其中最受关注且应用比较广泛的要数Dublin Core,简 称DC,是1995年国际组织Dublin Core Metadata Initiative拟定的用于标识电子信息资源 的一种简要目录模式。1998年9月,Internet工程专题组将其作为一个正式标准予以发布, 它由15个数据单元组成,其中内容7个元素,知识产权4个,例示4个元素。由于它的15个标 准元素通俗易懂,它既便于非专业的网页制作者描述他们资源,又可以用于专业的正规资源 描述领域(如图书馆),可以通过()内加注释来准确描述信息的资源。它得到了世界主要发达 国家的各个领域的专家、团体的认可,许多团体都在研究DC和MARC格式的转化问题,从而使 印刷世界的文献与网络世界的信息融成一个系统。

4、1分类管理。分类法如今已被广泛应用于网络信息资源的组织,一些著名的搜索引擎一 般向用户提供两种信息查询途径;关键词检索和分类浏览,关键词检索对WWW的内容进行高 效率的关键词检索,是一种很有用的工具,但准确率较低;分类浏览则是根据分类方法组织 起来的“热点网站”,供人们浏览。而图书馆使用图书分类法对网络信息资源进行组织才是 积极有效的措施,图书馆所使用的主要分类法几乎都已用于网络信息资源的分类组织,如杜 威 十进分类法、国际十进分类法、国会图书馆分类法,以及中图法。

分类法的使用有助于改善网络信息资源检索的效率,它为用户提供了一个网络资源的自顶 向下的等级式目录结构,用户只需点取鼠标,就可以在不同的类目中浏览:通过分类的逐级 细化,用户可以方便地定位到所需的文献的类目,同此类目所有相关的资源都集中在一起, 提 高了检索效率;同时分类体系为用户提供了一个上下文的环境,使用户在一个已知和清晰的 语义环境中检索,同时还可以在各种相关的主题间切换,提高了检索的查全率和查准率。 在实践中,国外许多图书馆已在这方面取得了一些进展,如德国Oldenberg大学图书馆实施 的“GERHARD”计划,旨在用国际十进分类法建立全德国网上资源的检索和浏览工具:加拿 大国家图书馆则使用杜威十进分类法建立综合性的网络目录“Canadian information bysub ject”。

总之,无论是网络信息资源的开发,还是网络信息资源的管理,都只是刚刚起步:无论是 理论研究,还是实践经验,都只是一个开始。这是一个艰苦而复杂的工程,它需要我们IT业 和图书馆界的仁人志士共同去努力,使网络信息资源得到有效的利用,因为开发、管理的最 终 目的是为了利用。

标签:;  ;  ;  

网络信息资源的开发、组织与管理_组织管理论文
下载Doc文档

猜你喜欢