虚拟信息系统探析,本文主要内容关键词为:探析论文,信息系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 虚拟信息系统产生的背景
虚拟信息系统(Virtual Information System,VIS)是网络环境下信息系统发展的新模式。 它强大的功能以及所具有的开放性、兼容性和动态联盟组合性,使其成为信息系统发展的一 次 质的飞跃。它的出现与发展有着很大的现实意义及远大的发展前景。
作为一种新型的信息系统模式,虚拟信息系统的出现是历史的必然。随着高速信息网络的 发展,人们可以像使用自来水和煤气一样方便地使用全球信息资源。但是,高速信息网络建 设并没有带来一个真正有序的信息空间,在网络迅速扩张的同时,也带来了许多新的问题, 具体表现在:
1)网络信息庞大无序。随着因特网的延伸与应用,越来越多的个人或学术团体将自己的研 究成果和各种信息放在网上,它们和大量的网络数据库、电子期刊等加在一起,形成了庞大 的多学科、多文种而又异常分散的一次网络文献。随着各国网站信息资源建设速度的加快, 这种网络文献的增长速度呈爆炸趋势,使信息量激增所导致的网络信息无序化陷入更严重状 态。
2)网络信息污染严重。由于连入因特网的各种网络和信息资源没有统一的质量控制标准, 一些粗制滥造的网站随意连入,加之淫秽信息泛滥和病毒感染,使得网上信息污染日趋严重 。如何解决由于网络无序扩张带来的网络信息量激增、信息混乱、信息污染和网络信息利用 之间的矛盾是当前网络领域研究的热点。
3)搜索引擎功能的不足。搜索引擎的出现(如国外的Yahoo、Hotbot、AltaVista,国内的网 易、搜狐等)在一定程度上缓解了网上信息分散和用户特定信息需求之间的矛盾。利用搜索 引擎,用户只需要在给定的检索框内输入关键词及其组配,或者按照分层类目结构依次逐一 选择,就可以得到适合需求的大量网站连接,通过点击超级链接,便能够访问这些网站。然 而,用过搜索引擎的人都会发现,当你查询学术站点信息时,得到的结果往往是成千上万条 记录,其中囊括了大量商业、娱乐等非学术性站点信息,这虽然保证了查全率,却大大降低 了查准率,增加了有效信息选择的难度。
要克服网络信息的庞杂无序和污染以及检索的困难,需要一种新型的信息系统来进行信息 的过滤、序化和组织,给虚拟信息系统的发展奠定了社会需求基础。
此外,信息系统自身生存与发展的需要也促使其向虚拟化转变。因特网技术的发展,给经 济 领域带来了许多重大的变革,出现了电子商务、虚拟企业、并行工程、敏捷制造、动态联盟 等新的企业经营模式。这些新的企业经营模式的共同点,就是需要一个强大的具有动态性、 开放性和兼容性的信息系统,即一个按国际通用标准来规范各种信息的生成、存储、交换、 传输和高度共享的公用信息平台作为支撑,从而对信息系统理论和实践提出了新问题,信 息系统理论和实践需要完善和发展,这就构成了虚拟信息系统发展的内在需求。
同时,信息技术和网络技术的不断进步,构造了一个全新的信息空间,带来信息技术及信 息表现手法的多方面发展,为信息系统的虚拟化准备了物质基础。
由此可知,来自信息系统内部的信息虚拟化力量,同信息系统外在的社会需求以及信息技 术进步的物质力量一起推动着全球信息的虚拟化进程,并成为虚拟信息系统产生和发展的真 正动力。
2 虚拟信息系统简介
2.1 虚拟信息系统的概念 “虚拟”本是计算机科学中的一个常用术语,是用计算机虚构和模拟现实世界中的客观事 物和环境,并通过计算机处理,逼真再现现实世界中的相关事物过程。
虚拟信息系统是在网络环境下模仿信息系统实体所营造的一种具有信息系统性质、氛围的 信息空间。它是对于物理信息系统的虚拟,没有具体固定的系统形态,也没有物理形态存储 和 固化的信息,而是通过网络广泛和动态地连接分布式的各类信息资源,由若干有着共同目标 的信息系统结成的网络联盟。同时它又是一种信息管理实体,有着统一的信息标准,通过将 自 身拥有的资源与外部世界的信息资源无缝整合,实现信息的有效组织和利用。综上所述,虚 拟信息系统是由位于因特网上的电子化、数字化的虚拟信息群体形成的全球信息库,通过对 信息的虚拟组织,实现信息的虚拟集散,即物理上分散、逻辑上集中、网络上集成、组织模 式上动态的信息组织模式。
2.2 虚拟信息系统的特性
虚拟信息系统具有以下特性: 1)虚拟信息系统是聚齐信息的中心。虚拟信息系统聚齐信息主要方法是“收集”。与传统 的信息系统相比,虚拟信息系统“收集”的对象更广泛,各种电子信息、数字信息特别是网 络信息都是它“收集”的目标。如何过滤庞杂的网上信息,是虚拟信息系统要解决的关键问 题。
2)虚拟信息系统是一个有序的信息网络。虚拟信息系统和因特网都被看作是信息源,但二 者存在根本的不同,这就是信息的有序性。因特网是一个巨大的、缺乏管理的信息仓库,不 论何种信息都可以放到这个仓库中,冗杂的信息淹没了对用户有用的信息,因而检索信息成 了一个大难题。而虚拟信息系统是一个有序的信息实体,它通过对“收集”信息的整理、加 工、提炼和综合,使之浓缩、精细、有序和系统化,并按用户熟悉的方法组织起来,可以方 便用户检索。
3)虚拟信息系统的虚拟性和广泛性。虚拟信息系统直接与因特网对接,形成强大的虚拟信 息空间。因特网上的信息资源时时在更新变化,虚拟信息系统应根据用户的需求,动态地组 织和存储信息资源。因此,虚拟信息系统不是提供物理空间来存放信息资源的仓库,不是信 息的存储基地,而是具有及时性、新颖性和针对性信息的超级链接和动态联盟。
在虚拟信息系统中,信息资源的数字化和虚拟化特征为信息检索提供了先天的条件。可检 索的信息资源更为丰富,信息媒体从单一媒体发展到多媒体,检索类型从传统信息检索类型 扩展到信息摘要检索和全文地址检索,检索范围从本系统、本地资源扩大到全球资源,充分 满足了用户的多种检索要求。
4)虚拟信息系统服务的主动性与敏捷性。主动性是指根据用户(企业)的需求和用户(企业) 所处的市场环境状态,以主动方式反馈给用户某一领域的信息。敏捷性,从用户(企业)角度 ,是指用户(企业)驾驭变化、把握机遇和发动创新的能力,即可重构(Reconfigurable)、可 重用(Reusable)、可扩充(Scalable)的RRS特性;从管理角度,是指通信连通性、跨组织参 与性、生产灵活性、管理相关性和雇员使能性。
5)虚拟信息系统的交互性与机动性。交互性是指将系统的各种资源(包括人和计算机资源) 都包装成虚拟信息系统的小单元,各单元都有标准的外部接口,采用统一的通信语言进行信 息 交换。系统把用户所有资源融为一个总体来完成复杂任务,如开展电子商务(Economic Comm erce,EC)、计算机智能制造系统(Computer Intelligent Manufacturing System,CIMS) 、企业资源计划(Enterprise Resource Plan,ERP)等。机动性则表现为,由于虚拟信息系 统的基础是计算机,因此用户不受时空限制。
综上所述,虚拟信息系统在形式上隐去了信息系统的实体形象,其功能不但没有丝毫的减 弱,反而随着信息资源形式的多样化和网络技术的发展,进一步拓展了其服务的深度和广度 。
2.3 虚拟信息系统的信息资源特点
虚拟信息系统的上述特性决定了其信息资源具有下列特点:
1)信息资源虚拟化。虚拟信息系统中的信息资源并不只是自身的资源,而更多的表现为对 外部资源的虚拟。这种虚拟运作大大拓宽了信息系统管理的视野,使系统运筹资源的思路与 能 力从信息系统内部延伸到外部,极大地拓展了信息系统可优化配置的资源范畴,从而有可能 使各种优势资源以一定的形式有机聚集,集成出更强大的综合优势。
2)信息资源多样化、数字化。虚拟信息系统的信息资源要将文字、图形、图像等转化成数 字,利用计算机把多种信息通过多媒体技术有机结合在一起进行统一存储和管理。其多样化 表现为包括数字化期刊、数字化文献库、数字图书馆、文摘索引数据库、书目数据库、Web 网站等。
3)信息资源提供者与信息服务提供者分离。资源提供者包括出版商、文献索引制作商、检 索 服务商、研究机构、图书馆等。信息服务提供者包括企业信息系统、图书馆、各级科技情报 所组成的联合系统。在虚拟信息系统环境下,这些信息资源提供者和信息服务提供者已从传 统的一体化中分离开来。
4)信息资源动态随机性。信息资源动态随机性是指信息资源随时都在更新变化之中,而且 这种变化是人们难以控制的。
5)信息传递网络化。在因特网的支持下,虚拟信息系统中的信息传递是以网络化方式进行 的。
3 虚拟信息系统运作分析
如前所述,虚拟信息系统的强大功能是在庞杂的因特网信息群中过滤出某一学科、某一领 域的相关信息,并以某种形式进行组织管理,以供用户浏览查询。可见,虚拟信息系统的主 要 运作可分为两个过程:信息搜索和信息组织管理。
3.1 信息搜索
虚拟信息系统信息搜集方法主要有3种:①人工搜集法;②智能自动化搜集法;③半自动化 搜集法。
3.1.1 人工搜集法 人工搜集法的信息搜集工作由系统管理员完成。人工搜集通常有两 种 渠道:正式渠道和非正式渠道。前者包括查阅大量的书目、杂志报刊、浏览因特网。后者包 括与他人口头交流、书信来往等等。通过正式与非正式渠道,系统管理员将获得以下信息: 所选学科领域有关研究机构的统一资源定位符(Uniform Resource Locator,URL)、电子书 籍的URL、学术期刊的URL、网络学术活动的URL和系统自身搜集的信息等。在此基础上,管 理员即可构建或者扩充虚拟信息系统的网页文件或者打开网页的XML源文件,加入相关超级 链接。这种搜集方式的优点是链接站点经过人工筛选,排误率较高。不利之处是,人工搜集 效率较低,管理员需要耗费大量的人力去搜集相关的网络文献,使虚拟信息系统功能在很大 程度上依赖于管理员所投入的精力;另外,由于人的精力有限,因而很难全面搜集到相关信 息,从而影响虚拟信息系统提供的资料的全面性;此外,管理员还要周期性地检测原有的链 接是否有效。
3.1.2 智能自动化搜集法 由于人工信息搜集需消耗大量的人力和时间,而且很难保证 相 关领域信息搜集的完整性,因而考虑使用智能自动化搜集方式。需要强调的是自动化并非对 相关信息的一种简单罗列,而是利用智能化的搜索引擎,对所查询、搜索的信息与查询主题 进行相关性比较,并对搜索罗列出来信息的超级链接按照与主题相关性强弱顺序排列,从 而达到快速准确地查询相关信息。这种搜集方法的优点在于:经过筛选所得到的站点链接相 关度高,与人工搜集相比,节省大量时间,而且是面向整个因特网进行搜索,因而有较好的 全面性。相对现有搜索引擎,这种智能自动化搜集方式避免了罗列信息的零散性与搜集信息 的庞杂性,提高了信息的相关度。但是,这对智能自动化搜索系统的设计提出了较高的要求 。
3.1.3 半自动化搜集法 半自动化搜集方式是对上两种方法的合理补充,其原理是从用 户 手中获取信息。一般过程是:在浏览器端,用户通过点击诸如“Add Your Sourse”之类的 提示之后,在出现的对话框中填入自己的电子信箱地址、连接ID、连接网站的URL、连接网 站的关键词描述等。以上信息经过公共网关接口(CGI)传递给远程服务器。在服务器端,虚 拟信息系统管理员通过对相关链接的有效性和无重复性检测之后,即将相关链接添入网页HT ML文件之中。如果是无用或者重复信息则予以删除。这种方法使虚拟信息系统成为一个 开放的网络信息系统,用户既是信息的使用者又是补充相应信息的维护者,从而丰富了信息 系统的信息来源。但从安全角度出发,管理员需要亲自检测因特网链接,删除用户提供的许 多无关信息。
以上3种方式并非相互排斥。事实上,虚拟信息系统的最优信息搜集方式应当是3者结合, 即以智能自动化为主,以人工和半自动为辅的全方位多样化搜集的方式,其工作流程如图1 所示。
3.2 信息组织与管理
虚拟信息系统对信息组织与管理主要按两种方式进行:①关键树方式;②数据库方式。
3.2.1 关键树方式 关键树方式是将虚拟信息系统所含某一学科的所有信息资源按照某 种 事先确定的概念体系结构或者按照某一关键词,分门别类地逐层加以组织管理。用户通过浏 览的方式按树型结构逐层加以选择,层层遍历,直到找到所需要的信息线索。通过信息线索 直接找到相应的网络信息资源。
这种组织管理方式的优点在于:简单易用,减轻了网络信息资源系统对于用户的复杂性, 提供了一种基于树型浏览方式的网络信息浏览界面,信息检索按照一定的体系结构逐次查看 。对用户来讲,目的性强,查准率高。其缺点在于:体系的结构不能过于复杂,每一类目下 的信息索引条目也不宜过多,这就大大降低了其所能容纳的网络信息资源的数量。因而,该 组织管理方式对于小型的虚拟信息系统是可行的,但若是大型的虚拟信息系统或者是大量复 杂的某一领域的网络信息资源,这时就需要依靠数据库组织方式。
3.2.2 数据库组织管理方式 这种组织管理方式就是将虚拟信息系统包含的某一学科的 所 有已获得的信息资源以固定的记录格式存储。用户通过关键词及其组配查询,就可以找到所 需要的信息线索,继而通过信息线索直接查询到相应的网络信息资源。在因特网上,这种组 织管理方式的工作原理如图2所示。
这种组织管理方式利用数据模型对信息进行规范化处理,利用关系代数理论进行数据查询 优化,从而大大提高了数据操作的灵活性,因而成为网络信息资源组织广泛采用的方式。它 对用户也提出了较高的要求,要求用户具有一定的检索技巧,包括关键词及其组配方法的选 择等;同时,在数据服务端,对于如何进行数据库的自动扩弃,如何提供良好的人机交互也 提出了较高的要求。
4 虚拟信息系统发展趋势
虚拟信息系统是一个发展中的概念,随着信息技术的发展和信息需求的广泛化,虚拟信息 系统将向精确化、个性化和转播化方向发展。
4.1 信息服务精确化
面对因特网上的信息日益泛滥的倾向,提高信息检索的精确度是提供可靠信息服务的保证 。这要求虚拟信息系统具有:
1)专业化的搜索引擎。作为系统平台的搜索引擎,一般是通过超链接方式进行宽度优化遍 历式的搜索,为了避免搜索出许多与要求内容毫无关系的空链接,必须预先设定具有专业化 的关键词词表,以便在搜索过程中对超链接进行必要的过滤精简,使搜索过程更具有目的性 和精确性。实现搜索引擎专业化的前提是实现搜索引擎智能化。
2)自然化的查询界面。不再拘泥于机械固定的格式填写查询指令,而是向填弃模板加自然 语言的形式过渡,即能够从自然语言方式的查询命令中,提取出可以基于语义进行匹配的信 息。
4.2 信息服务个性化
信息用户的需求是多层次、多方面、多学科的。因此,对每一个用户的特殊信息需求进行 针对性服务,即对每个用户不同的需求进行高效率的集成化信息过滤和信息分流是十分必要 的。此外,信息服务的个性化还表现在信息服务的主动性和智能性,在网络环境下通过电子 邮件、网络广告、网页预留等多种途径积极向用户进行信息推介。实现个性化信息服务的关 键是获取用户个人信息需求。目前一般采用自适应的方法,动态地从用户使用信息资源的记 录中获取用户的真正信息需求。今后不仅在网络信息服务,而且整个计算机系统都要走向个 性化主动服务道路。
4.3 信息服务转播化
信息服务转播化是通过采集服务器和转播服务器来实现对因特网上信息的有选择的访问。 采集服务器是通过全息集成镜像的方式,把被选中的目标站点的所有可以访问的信息,以一 种充分保持原有结构的方式采集到局域网中来,通过没有路由器的专用通道,在局域网中设 立的“转播服务器”上组织并提供检索服务,这样对局域网的用户产生类似“虚拟信息系统 ”的效果。那些由于经济原因不能大规模使用因特网资源的用户就可以选择性地转播某些站 点的转播业务。此外,如果用户一方面需要因特网上的某些信息资源,另一方面对因特网的 安全有顾虑或者对因特网费用需要精打细算,也可采用信息转播方式。显然,信息转播方式 具有安全、省钱、方便的优点。
5 结束语
综上所述,虚拟信息系统的发展和应用从根本上改变了人类信息服务的思维方式。人们在 深入研究和探讨虚拟信息系统理论的同时,利用现代计算机技术、网络技术和通信技术,研 制开发并推出了许多虚拟信息的实用系统,如虚拟图书馆、虚拟银行、虚拟医院、虚拟展览 会和虚拟工厂等等。使网络信息资源的开发与利用更加有效,使知识与信息达到了更高的社 会化共享程度。然而,需要指出的是,虚拟信息系统的建设是一项复杂的社会系统工程。它 的发展与完善有赖于现代信息技术本身的发展以及在信息管理领域中的应用水平;同时,人 们对因特网环境下虚拟信息组织方式的理解与认识,以及知识产权保护状况等人为因素也会 对本系统的建设和发展产生直接或间接的影响。此外,信息数字化和网络化程度,特别是馆 藏文献的数字化和网络化程度也将影响虚拟信息系统开发的深度和广度。因此,亟待人们对 虚拟信息系统作进一步深入而系统的研究。