网络信息资源的组织方法与管理策略_组织策略论文

网络信息资源的组织方法与管理策略_组织策略论文

网上信息资源的组织方法与管理策略,本文主要内容关键词为:信息资源论文,策略论文,组织论文,方法论文,网上论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 因特网上信息资源组织的意义

因特网尤其是WWW的出现和发展,使信息交流进入到一个崭新的历史时期,它打破了时空的障碍,使生活在不同国度的人们可共享网络虚拟社会,进而极大地促进全球的经济发展。然而,因特网是一个极度开放的网络,信息种类繁多,变化频繁,且浩如烟海,既有许多价值较高的信息,也有不少重复无用的甚至是有害的信息,故此导致网络信息资源的无序化。无序的信息资源,再庞大也无法被人们所认识和有效利用。

任何知识和信息都是经过整理、组织、分类之后,才能进行有效检索,因特网信息也不例外。由于任何人都可以直接在因特网上按照自己的意愿发布、出版和传递信息,所以,因特网上不可避免地存在着大量不准确、不客观的信息,因此更加有必要对因特网上的信息进行组织、分类和编目,只有这样才能有效地检索和利用信息,保证信息的畅通,净化信息环境,提高用户的应用能力和网上信息的利用率。

2 网上信息资源的组织方法

信息资源组织是使信息有序化的唯一方法。它通过对信息外在特征和内容特征的表征和序化,达到信息资源有序的目的。因特网信息资源组织是一项非常复杂的工作,目前还有许多问题需要解决,如信息不稳定,积累与保存困难,新陈代谢快,难以规范化和结构化,内容特征抽取复杂及标准化难等等。

1)网上信息搜索。文献检索的实现,不管是手检还是机检都有赖于文献的存储过程中对文献的揭示与组织,使其成为一条条文献线索,并将这些线索系统地排列,使分散无序的文献信息变成有组织、有系统的信息。网上信息资源除了原有的二次文献外,已出现越来越多的全文数据库、事实数据库、数值、图像和其他多媒体信息资源。急剧增加的网上信息资源给信息搜索带来很大困难,为了提高信息搜索的有效性,信息管理人员一般要遵循全面性、针对性、新颖性、可靠性、科学性、计划性等原则,并要善于在实际操作中不断总结和应用各种检索技能。

各种搜索引擎都有自己的信息搜集方式、检索算法和结果排序方法,在查询范围、检索功能等方面各具特色。再加上网络信息资源纷繁复杂,零乱分散,使得信息的组织没有统一的规范,造成各搜索引擎的索引方式各不相同。有的对网页全文进行索引,有的只对网页的部分内容进行索引。有的支持MelaTag,接受网页制作者自定义的关键词和摘要;有的则不支持MelaTag,仅仅利用网页的前几行字作为摘要。

WWW搜索引擎的功能一般有两类:一类是目录式搜索,信息管理人员可通过主题目录的指引逐层浏览,直到找到与自己的需求相关的信息。目前,这种搜索方法已开展建立用户模型的技术,允许用户自己在节点之间加上链接链,或根据用户的查询路径进行动态推理,并建立起新的链接链。Yahoo站点提供了艺术、商业与经济、计算机和因特网教育、娱乐、政府、健康、新闻、逍遥、参考工具书、地区信息、科学、社会科学、社会和文化14大类主题,这些主题以超文本指南的方式将主题词联结起来,形成了巨大的信息链。另一类是索引式搜索,它提供对关键词、主题词和自然语言的查询,用户在搜索框中输入检索词或表达式,搜索引擎会返回一组指向相关站点的超链接。Altavista就是这类方法的典型代表。为了尽可能全面地搜集到相关信息,经常要对检索策略进行适当调整,即:为提高查全率扩大检索范围,为提高检准率要缩小检索范围等。

2)下载网上信息并进行整理和评价。网上搜集到的信息通过相应的软件可直接下载到已经设计好的数据库。数据库具有系统分析和结构分析两大功能,实现数据库中大量关联数据的序化排列。然后,再进行整理和评价。整理的过程就是对信息的组织过程,是为了提示所下载的内容。评价的过程则是对整理出来的原始信息进行评价,是为了筛选出有用信息,包括对明显重复的信息去重,对明显陈旧的信息剔旧,对不良信息进行淘汰以及根据信息内容找到重点、剖析矛盾等。

3)网上信息分析。对网上信息资源特点和网上用户信息需求特点进行分析,是对网上信息资源进行组织的基本出发点。通过一般整理和评价的信息还远远不能达到使用的要求,信息管理人员必须在此基础上对信息进行分析,从中提取出有价值的信息。联机分析处理(OLAP)与数据挖掘(DM)是基于数据仓库技术而发展起来的信息分析工具。OLAP是建立在多维视图的基础上,将直接源自数据库中的不同信息源的大量相关信息联结起来,给分析人员一个清晰的视图。对用户的请求快速作出响应。还可以用多种分析工具、算法对数据进行多维分析,具有灵活的可视化工具和良好的扩展性。用户具有动态选择的权力。DM建立在各种信息源的基础上,重在发现隐藏在大量原始数据深层中对人们有用的信息。被抽取的信息资源,具备可信、新颖、有效、易于理解的特点。它可以根据信息的内在机理,揭示信息之间的联系;还可以把新的记录分配到预先定义好的类中,按照类内相似性最大、类间相似性最小的原则对数据集合进行分组。再通过统计分析、神经网络、决策树、遗传算法、模糊逻辑、基于记忆的推理、混合方法等多种技术对信息进行处理。经过分析的信息结果一般还不能直接应用,必须将这些结果以数据库或研究报告的形式制作出来,并按照科学程序提供给用户。

4)网上信息过滤。信息过滤是信息资源净化和防范的必要手段,其实质是对信息进行筛选。用户可根据自己的需求选择服务项目与内容,通过过滤机制快速找到所需的信息资源。同时,可对网络的信息流量、流向及流速进行有效的控制和合理调度,使网络传送更加畅通。

因特网上信息过滤主要是通过编辑软件或在网络信息利用程序中附加过滤功能,用户可以根据需求设置过滤条件,如不希望获取的网址、某类主题的内容、某种类型或范围的信息等。程序在运行中一旦触发条件,则可将有关信息删除或拒之门外,而其他信息仍可输入。

信息过滤与信息检索不同,信息过滤是对动态信息进行筛选,着重排除不希望得到的信息,带有即时性。只有通过过滤的信息才能进行信息检索和信息推送,使用户获得所需信息。

可通过多种形式对网上信息过滤。如用户自己根据需求设置一定的条件,限制不希望得到的信息的出现;服务提供商、网络管理员均可对信息进行过滤。

可采用多种手段进行信息过滤。如基于内容的过滤、基于网址的过滤,或者是将内容和网址结合起来对某些信息加以控制。还可以采用多种设备进行过滤。如用专门的过滤软件加载到网络应用程序中,用户使用时,过滤软件则进行实时监控。或应用网络应用程序、防火墙、代理服务器等。

对网上信息资源进行知识组织,是指对网上的各种概念、数据、事实、文献等,通过分析、标引、著录、联机、链接、排序、存储等手段,形成一个有序的便于用户理解和查询的信息系统。

3 网上信息管理策略

单纯使用词语和分类的方法组织知识信息,满足不了网上信息查询的需求,只有使用“分类—主题”的方式对知识信息进行组织,才能为不同层次和需求的用户分别提供分类的、主题的、分类—主题的信息查询功能。即把知识的自然语言表述与查询、受控自然语言表述与查询融为一体;把知识的分类组织与词语组织融为一体,满足网上信息资源组织与查询的需求。

1)建立一个结构简明的知识信息分类体系。通过对信息的系统分类,实现对信息知识领域的宏观控制。再建立一个智能化的控制词表,实施对作者语言与用户语言的控制和转换。

2)充分利用计算机操作环境与技术建构多维的分类体系,揭示多维知识空间的联系。例如,一个子类可以隶属于多个母类、一个母类可以用多种标准进行划分,少数大类下另编涵盖各大类内容的体系;互见和分析方法也有不同程度的使用;利用超文本技术把类与类、类与记录联结起来,可以自由跳转;有友好的用户界面和帮助。

3)遵循网络信息分类体系的原则。必须遵守面向网络信息资源、面向网络技术环境、面向网络用户的原则,突出使用性和易用性,充分借鉴网上已编制的分类体系的经验和传统分类法理论、技术和成果。除考虑知识领域的完整性外,还要考虑网上某种信息的重要性和用户的兴趣。

4)采取等级结构展示知识的系统联系,构成枝干分明的主题树或脉络清晰的知识地图。为了多视觉地揭示知识的内在联系,类目划分不局限于单一标准的逻辑划分,可同时使用若干标准进行划分,建立若干个从属母类的平行子系统,类目的划分也不完全拘泥于逻辑的层次划分,可以根据信息量和访问频率突出某些重要信息的级位,以增强搜索引擎的易用性。知识的多重从属关系采取交替列类的方法揭示。知识之间的相关关系可大量使用类目参见的方法揭示,用户便可通过不同的窗口浏览被参见的类目,以做出取舍的判断。对某些无知识领域属性的类目,可仿照已建立的知识体系开展。这样通过一个多维的知识网络,重组网上信息将变得井然有序,使用户可以多途径、多视角地检索,进而也解决了集中与分散的矛盾。

5)网上信息组织中的使用语言。在信息的知识组织和查询中,涉及作者语言、标引语言和用户语言。标引语言是对知识进行描述的语言,不管是受控语言还是关键词语言,更多的是作者语言结构的反映。标引语言有助于信息描述的准确性和规范化。用户语言是表达信息需求使用的语言符号和表述形式。因此搜索引擎对信息进行标引时,一定要反映一般用户的语言结构。主要方法是建立用户语言表征集合与作者语言、标引语言表征集合之间的联系,作为用户语言与作者语言、标引语言转换的基础,这里不仅仅是自然语言与受控语言的转换,因为作者语言和用户语言都是自然语言的范畴。检索语言的后控词表技术则为这种转换提供了理论和方法。

6)在网络环境中必须使用多维、超维检索。超文本技术将文本信息存储在无数结点上,一个结点是一个相对独立的信息块,结点之间用链连接组成信息网。随着技术的发展,声音、图像、影视等多媒体信息也都可以像文本信息一样存储在结点中,用链连结,使超文本转为超媒体,即形成超维检索体系。在超维检索方式中用户可根据个人的意愿以及检索中所受的启示、产生的联想,通过屏幕所提示的链接,迅速自由地从一个信息结点跳到另一个信息结点,使用户可以多种方式查询感兴趣的信息。

7)灵活运用网上检索工具和检索技术。因特网上检索工具很多,适用范围各不相同。有适用于Telnet的HYTELNET;适用于检索FTP信息的Archie;用于Gopher的Veronica,Jug2head Gopher Jewels。用于WWW检索的工具目前发展最快,已有数百个WWW搜索引擎在因特网上投入运行,是因特网信息检索方式的主流。在因特网上利用这些检索工具,可以方便地检索到所需的各种信息。

如何在WWW中检索信息。可按信息资源的专题进行检索,也就是按分类体系检索;也可以通过查询关键词检索信息,即关键词检索方式;或者是按WWW服务器提供的机构和它在世界上的物理位置进行按地区的链接和查询,它联结的常常是按国家、地区继而按机构排序的超文本。WWW上的检索网点提供了至少一种检索途径,有的检索网点提供了两种检索方式。

总之,面对因特网上的庞大信息资源,信息的组织、整序、管理显得非常重要。目前,一些专家呼吁要用“图书馆员的思维”管理网络上的信息源,这说明网络信息的组织和管理需要以知识组织的理论来指导,才能达到高度的有序化。同时,网络环境下的信息组织与管理,也给各图书馆、情报研究部门、信息服务机构、信息提供商的网络管理人员、信息服务人员提出了更高的要求。信息人员只有不断学习新技术、新方法,掌握前沿科学与新技术的发展动向,才能时刻站在信息组织与管理的制高点。

收稿日期:2000-12-28

标签:;  ;  ;  

网络信息资源的组织方法与管理策略_组织策略论文
下载Doc文档

猜你喜欢