基于网格技术的数字信息服务模式探讨_大数据论文

基于网格技术的数字信息服务模式探讨,本文主要内容关键词为:信息服务论文,网格论文,模式论文,数字论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

现代信息技术的发展日益迅猛,随之而来的资源可利用率、信息服务质量等成了新的制约因素;信息时代的人们面临着一方面是无处不在的海量信息资源,而另一方面却无法获得有效资源的尴尬局面。于是,一项新的技术——网格(Grid)技术就应运而生了。

网格构想的提出和当前全世界正在举行的有关网格技术的研究越来越清楚地告诉我们,一种信息社会的新的基础设施正在出现。这种变化将不仅仅是一种技术上的变革,而且将根本改变我们的研究方式、信息服务方式与生活方式。本文将重点阐述受网格技术影响的数字信息服务模式,以期获得一些有益的启示。

1 信息技术的飞跃——网格技术

1.1 网格的含义与产生背景

按网格研究专家、Globus项目的带头人I Foster所描述的:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多、更强,让人们透明地使用计算、存储等其他资源。”可以说,网格是一个一体化的网络基础设施,其目的是利用高速网络把分散在不同地理位置的各类计算机(计算机群)、数据源、外围设备等连接起来,组织成一台“虚拟的超级计算机”,形成对用户相对透明的虚拟高性能计算环境,实现计算资源、数据资源、信息资源、知识资源、存储资源、通信资源等多种资源的高度共享与高速存取,向每一个用户提供一体化的服务。

从20世纪60年代末开始研究计算机分组交换技术到今天,Internet已经走过两代历程。第一代是20世纪70~80年代,通过TCP/IP协议将分布在世界各地的计算机连接起来,形成互联网络,其主要功能为基于E-mail、FTP和Telnet等应用的简单信息交流及共享;第二代是20世纪90年代至今,基于Web的信息系统将大量的数据编织成相互关联的信息结点,使传统的信息发布和信息检索过程发生了巨大变化,而由XML和SOAP构建的Web Service更进一步加强了信息结点之间的信息共享,这种信息的发布、检索和共享的方式已成为信息时代的主要标志。随着人类对信息资源的需求和对信息服务的要求逐步提高,人们希望把整个互联网整合成一台巨大的超级计算机,实现计算资源、存储资源、通信资源、软件资源、信息资源、知识资源的全面共享。这些需求推动了网格技术的产生和发展,以信息服务网格为标志的第三代Internet将万维网(World Wide Web)升华为全球网格(Grear Global Grid)。采用网格技术建立高性能计算环境,可使总拥有成本得到控制,同时满足大型信息系统的要求。

1.2 网格的体系结构与功能

一个通用的网格技术体系结构可以满足虚拟组织的全部要求,如图1所示。这个通用的体系结构是一个多层结构,整个结构由一组协议、服务、APIs(Application Programming Interfaces)和SDKs(Software Development Kits)组成。其各层的机制和所提供的功能如下:(1)构造层。其功能是向上提供网格中可供共享的物理或逻辑实体资源。常用的资源包括处理能力、存储系统、目录、网络资源、分布式文件系统、分布式计算机池、分布式计算机群等。(2)连接层。它是网格中网络事务处理通信与授权控制的核心协议层。构造层提交的各种资源间的数据交换都在这一层的控制下实现,各资源间的授权验证、安全控制也在这里实现。资源间的数据交换通过传输、路由及名字解析等机制实现。(3)资源层。该层的作用是对单个资源实施控制,与可用资源进行安全握手、对资源进行初始化、监测资源运行状况、统计有关的资源使用数据与计费。(4)集合层。其作用是将资源层提交的受控资源汇集在一起,供虚拟组织的应用程序共享、调用。为了对来自应用层的共享进行管理和控制,集合层提供目录服务、资源分配、日程安排、资源代理、资源监测诊断、网格启动、负荷控制、账户管理等功能。(5)应用层。是网格上用户的应用程序。应用程序通过各层的API调用相应的服务,再通过服务调用网格上的资源来完成任务。应用程序的开发涉及大量库函数,为便于网格应用程序的开发,需要构建支持网格服务的库函数。

图1 网格技术体系结构

2 网格技术在数字信息服务中的应用分析

实现信息服务网格应用的关键在于网格管理软件。网格管理软件实际上是更高层次的网格操作系统,其核心技术主要是一体化的信息平台(单一系统映象)、语义网站(Semantic Web)、智能代理(Agent)和知识本体(Ontology)技术等。信息服务网格的服务包括文件消息、计算、信息内容、事务处理和知识服务等,因此信息服务网格可大致分为计算网格、信息网格与知识网格。其中,计算网格(computational grid)提供原始计算能力、高速宽带和数据处理。完成上述功能,必须是与网络连接和具有浮点计算和逻辑数据处理能力。信息网格(Information grid)采用接口连接主要的信息资源,允许同质对非同质分布信息进行访问。信息网格也需要高级分析以减少得到各种形式的信息所带来的技术的复杂性。知识网格(knowledge grid)使用基于知识的方法学和技术学。包括知识工程工具,智能软件代理,数学建模,模拟,计划等。知识网格也应对决策制定和假设产生提供智能指南。存储在知识网格中的信息资源应允许支持低层信息和数据的挖掘。来自Grid层的知识应能控制计算层中的数据获取。

数字信息服务方式的变革将是网格技术直接应用的结果,特别是对于对等计算技术的关注反映了数字信息服务系统对于高效率、低成本和高可靠性的基础技术环境的需求。对等计算和对等网络,简单地说就是计算机系统间通过网络的直接数据交换实现计算机资源和服务的共享,这些资源和服务包括信息交换、处理能力、高速缓存、备份设备和文件磁盘空间等。对等计算环境具有可以降低计算成本、提高可扩展性、便于工作组间的协调和分布式计算等优点。为了更好地实现各个子系统之间、人与资源之间的交互操作,需要基于本体(Ontology)建立统一的语义描述,应用XML语言作为网上数据交换标准,进而给予统一描述的知识实现系统互操作。基于网格技术,现提出一个层次化数字信息服务体系结构(见图2),它由以下6个部分组成。

图2 基于网格技术的数字信息服务体系结构

(1)数据网格与计算网格。它们是数字信息服务台的基础组成部分。数据网格可以集成多种异构、分布的数据源,进而为海量数据的存储、传输、处理与融合提供基础框架。计算网格由多个服务器集群构成,是大型、分布式系统的自然延伸,通过集群技术将多个单位的服务器融合成为一台透明的、功能强大的“高性能计算机”,用于提供高性能计算服务。

(2)信息资源网格。它基于数据网格和计算网格构建,是数字信息服务平台的重要组成部分。该层对于来自数据网格的数据和计算网格的计算结果进行处理,进而形成信息资源,并将其提供给服务网格层。

(3)服务网格。它是数字信息服务系统的核心组成部分和主要功能单元。服务网格提供数字信息服务系统所支持的各种服务,同时对于各个部门的应用系统提供服务支持,这种服务支持包括信息、知识、计算和智能信息处理服务等。服务网格提供的服务大多是单台计算机或单个子系统无法提供的服务,如协作计算、大规模实时多媒体应用等,同时可用于建立虚拟环境,使不同组织的人、系统可以协同和交互。

(4)系统建模与应用模板。它们根据来自应用系统和个性化信息服务访问接口的不同要求,相应地生成专有的系统模型和应用模板。服务网格根据其所生成的系统模型和应用模板,向应用系统或用户提供符合其要求的服务。

(5)个性化信息服务访问接口。它是数字信息服务平台的重要功能单元,是信息服务平台通用性、交互性、实时性的重要表现部分。针对读者的不同应用需求,数字信息服务平台各个应用子系统通过该接口可以很好地与数字信息服务平台进行交互,进而获取“量身订制”的个性化服务。

(6)开发规范与管理控制平台。它是数字信息服务平台的中央控制单元,通过该平台的集中统一控制,使得新建的数字信息服务平台子系统及服务网格、信息网格、数据网格和计算网格的各个子系统符合统一的规范,利于实现系统间的互通、互联和互操作,进而在管理控制平台的统一控制、协调下发挥出最优化效用。

3 基于网格技术的数字信息服务模式

3.1 信息集成服务模式

信息集成服务是一个现代化的信息服务概念,是对信息资源、技术资源和人力资源进行融合的过程,是对分布式服务的飞跃。集成服务一定要面向用户、面向任务,有明确的目标或主题。

网格最早是以集成异构计算平台的身份出现,接着跨入分布式海量数据处理领域,自然而然地,网格将在信息集成领域一层身手。所谓的信息网格,就是要通过统一的信息交换架构和大量的中间件,向用户提供”信息随手可得”式的服务。信息网格研究的中心问题有如何描述信息、存储信息、发布信息和查找信息;如何将异构平台、不同格式、不同表述方式的信息进行转换,实现信息的无障碍交换;如何充分利用现有网络技术,如HTTP、XML、WSDL、UDDI、SOAP等,构成一个完整的服务链;信息的语义表示,即如何赋予信息以内涵,以及如何避免信息的二义性;如何对信息加密,防止信息泄露,等等。

数字信息集成服务模式就是对具有差异性、分布性、管理的自治性的数字信息资源、技术、人员、机构与服务功能进行集成,实现对分散的数字信息资源系统的有效控制,使用户得到动态的并在时间和空间上一致的面向问题的全方位、多层次、多元化的信息服务,从而构建数字信息面向用户的高效能、综合化的信息集成服务体系。它以信息服务内容与产品的集成为目标,以功能的集成作为结构,以平台的集成作为技术基础,以人的集成作为根本保证,最终形成统一的检索平台、一次性用户认证、不同系统之间的无缝链接和完整的集成化数字信息服务综合平台体系。其服务模式如图3所示。

图3 基于网格的数字信息集成服务模式示意图

可以预见,信息集成将是网格最可能流行起来的应用方向。2004年1月20日,Globus联盟、IBM和HP等又联合发布了新的网格标准草案WSRF(Web Services Resource Framework),干脆把OGSI转换成了6个用于扩展Web Services的规范。这时,网格服务已经与Web服务彻底融为一体了。这标志着网格已经调整好方向,将信息集成作为第一目标了。我们认为,数字信息服务模式的发展趋势应当朝一种面向用户的、资源系统、服务系统与用户信息利用系统聚合在同一信息空间的、智能化的集成信息服务模式的方向发展。

3.2 数字化知识服务模式

正在兴起的网格技术,为人们对知识信息的需求由文本单元向知识单元深度发展提供了实现的可能性,同时也要求人类采用新的知识组织方式来建立知识管理的大平台。它将改变人类知识生产、知识传播、知识创新、知识分配的传统方式。网格技术将会对知识服务带来革命,并将引发知识管理学的诞生。构建网格的目的在于实现人类知识的有效利用。它不仅对网格管理软件提出了技术要求,同时也对知识服务的理论和方法提出了挑战。受网格技术发展的影响,信息交流和知识创造作为科学研究活动的基础环节和基本形态,正发生着巨大的变化。图4简单地描述了网格影响下的现代科学研究环境的变化及其对信息服务的要求。

图4 受网格技术影响的现代科研环境的变化

现代科学研究环境变化的基础特征是数字化、网络化。数字化基础上的分布式信息服务模式已经成为信息市场的主流模式,而且各种定制的个性化服务开始成为新的基础服务模式。在用户行为方面,数字化网络化地获取科技信息已经逐步成为前沿科研人员的一种基本要求和行为习惯,而且,用户强烈地要求这种获取和利用不再是针对众多复杂的数据库或系统,而是形成逻辑整体的集成检索与利用。此外用户信息活动的重点和瓶颈正从文献获取转变为知识发现,对知识内容进行挖掘,根据其内在特征和价值进行鉴别、关联、重组,识别和创造新的知识。所有这些,将是基于用户信息平台、按照个性化方式、集成整合多种信息资源和信息系统来进行。因而,需要对知识资源进行整合。网格技术的发展已经从技术手段上为海量的文献信息管理深化到“知识单元”层次提供了实现的可能性。下面给出基于网格技术的知识资源整合系统结构图(见图5)。

图5 基于网格技术的知识资源整合结构示意图

3.3 个性化信息服务模式

个性化信息服务即指网络使用者可以按照自己的目的和需求设立网上信息的来源、内容特征、表现形式、特定服务功能等,以方便快捷地获取自己所需的网络信息内容,并对这些信息进行有效的管理。个性化信息服务将接受信息的控制权交到了用户的手中。其服务方式可以是主动的,也可以是被动的。主动的个性化信息服务方式如果仅仅减轻用户的体力劳动,则是一种非智能化的推送服务;如果同时也减轻了用户的脑力劳动,则是一种智能化的信息服务方式。智能化是个性化信息服务的发展方向,对公众具有巨大的吸引力。随着智能技术的不断完善和成熟,它必然会成为网站的主要信息服务方式。这种智能推送方式的实现形式既可以通过改造现有的非智能化的信息推送服务,也可以在传统的拉取方式中加入智能化的“推”,具体实现方式便是开发和利用智能搜索工具。

网格技术的发展给数字化环境带来了丰富的、动态的网络信息资源,同时也呼唤新的检索机制与工具。虽然目前开发了不少搜索引擎,如Gopher Jewels、Yahoo、Alta Vista、Infoseek、Excite等,但是用户要想方便快捷地找到所需信息,却很不容易。因为用户在发出一个明确的查询请求后,返回的信息中往往有许多不相关的信息。为解决这个问题,可以采取两种方案。

(1)提供基于元搜索引擎的检索机制。所谓元搜索引擎,是分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作。元搜索引擎不像常用的搜索引擎那样拥有自己独立的数据库,却更多地提供统一联结界面,或进一步地提供统一检索方式与结果整理,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟逻辑整体,从而实现对这个虚拟整体中各独立搜索引擎数据库的查询与数据处理。

(2)建立基于Push技术的信息检索系统。Push(推送)技术通过它的信息代理机制,在用户初次使用时设定所需的信息后,能够把网上相关信息用推送(Push)或网播(Netcasting)的方式送到用户面前。Push技术为网格技术带来了重大的变革,使网络信息流不再是单一的“拉”,还包括反方向的“推”,从而使用户避免了网上漫无边际的查找与长时间的等待,极大地提高信息检索效率。

收稿日期:2005-04-20

标签:;  ;  ;  ;  ;  ;  

基于网格技术的数字信息服务模式探讨_大数据论文
下载Doc文档

猜你喜欢