我国信息网格技术研究进展(下)_元数据论文

国内信息网格技术研究进展（下），本文主要内容关键词为：研究进展论文,网格论文,国内论文,技术论文,信息论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

［分类号］TP393

1 引言

随着互联网的发展，信息资源逐渐呈现出海量、异构、分布等特性，“信息孤岛”大量出现。为了满足信息需求，用户就需要熟悉多种信息描述方式，并频繁登录多个信息系统，这种信息获取方式效率极其低下，同时使信息资源得不到有效利用。此外，现有信息服务均是通用信息服务，无法满足用户个性化需求，用户面临着“信息迷航”、“信息过载”等问题。因此，如何实现分布环境下异构信息资源的同构访问和以用户为中心的个性化信息服务就成为急需解决的问题，这也是信息管理研究的核心问题。

信息网格技术为该问题的解决提供了可能，其通过单一映像技术实现分布、异构信息资源的互联互通和透明访问，避免访问过程中的多次登录，并最终实现统一的信息资源采集、信息服务、资源管理和用户访问接口[1]。本文主要从信息连通、网格智能化和安全三方面介绍国内信息网格技术的研究进展。

2 国内信息网格技术研究进展

2.1 信息连通性和一致性

（1）信息连通性

信息连通性（单一映像）是指在不考虑安全的前提下，从逻辑上把相关联的数据连接在一起，实现用户对分布、异构信息资源的透明访问，核心是构建与信息表示和用户个性化密切相关的信息连通模型[2]。国内相关研究分为两种：一种是构建信息网格资源空间模型，并基于此构建统一的信息连通模型；另一种是将信息资源分为结构化和非结构化两类，分别制定信息连通模型。

（1）第一种利用信息网格资源空间模型中物理关系、虚拟关系和有效关系三层间的动态映射以及层次内的引用关系构建信息连通模型[3]，并基于此构建描述资源特征的多层元数据体系以及元数据之间的映射机制[4]，同时采用目录服务存储元数据，采用注册机制管理元数据，采用存储资源代理统一访问异构信息，采用权限管理进行访问控制，最终实现信息连通[5]。学者朱延东提出的元数据、XML和目录服务相结合的方法[6]，学者黄启峰提出的由统一资源表示法和资源代理组成的信息集成方法[7]均属此类。

（2）第二种是学者张炜提出的基于数据接口的信息连通方案[8]和学者郝正闯提出的信息资源连通方案[9]。前者提出由资源存取代理、服务接口、数据适配器以及数据库通用接口等组成的数据库接入方案：资源存取代理收到用户请求后，进行访问的数据资源类型判断，然后将请求转交给合适的服务接口，服务接口调用合适的适配器进行数据访问。对于文件系统和URL资源，则利用SOAP的附件机制实现数据传输和复制，复制到本地之后，应用本地服务提供访问操作；后者采用Web Services进行关系数据库接入，封装JDBC以后将其以Web services形式发布，实现与上层系统之间的松耦合；采用基于关系的文件接入模型进行文件接入：将文件描述信息从物理文件中提取出来，以关系的形式存储在数据库中，用数据库来管理文件描述信息。此外，学者游赣梅提出在应用模式和物理信息资源之间增加虚拟资源层，通过修改虚拟资源层和物理信息资源之间的映射算法实现信息网格中关系数据库的连通[10]。

（2）信息一致性

信息一致性是指信息连通后数据的正确性和有效性，是信息网格在信息集成中必须解决的难点问题。学者金迎提出用基于变化类型的虚拟视图调整算法来解决逻辑资源层元数据变化导致的虚拟视图失效问题[11]。

2.2 信息网格智能化

信息网格智能化是指信息网格从信息存储到用户浏览纵向为用户提供一体化解决方案，管理员只需简单配置即可建立服务平台[2]。国内相关研究集中在信息网格的资源管理、信息服务和用户管理三方面。

（1）资源管理

信息网格资源管理主要实现资源状态信息监控与收集，资源的表示、组织、部署、发布、发现和调度等[12]，从服务角度看，其核心是信息资源的发布、发现和更新[13]。

①资源管理模型

国内信息网格资源管理主要采用全局——本地两级管理模型，典型代表是学者张超速提出的由管理域和信息网格环境组成的两级资源管理概念模型：前者为若干逻辑资源单元，通常是网格节点，后者由管理域连接而成。每个管理域由资源管理器、资源使用者和资源提供者组成，集中组织和管理本域内资源信息，保证域内系统行为和管理策略的一致性，多个管理域通过协作以服务形式提供全局资源。管理域由域目录服务器DDS、资源信息路由器RIR和客户代理CA组成。DDS存储管理域内所有服务的资源属性和约束策略等信息，RIR用于访问域内DDS，CA用于接受客户端请求，然后转发给各个管理域的RIR以获取匹配的资源信息，自动发现并选择最适合的服务，随后由客户通过CA请求该服务[12]。此外，学者崔巍等提出基于本体与LDAP的信息网格资源管理机制[14]。

②信息资源组织

信息网格资源组织机制主要分为集中式、资源路由和资源空间模型三种，国内多采用资源空间模型，此外，学者段武明采用面向对象技术组织信息网格资源对象，包括节点数据源或抽象数据源，并按可继承的层次结构进行存放，子对象可继承父对象的元信息、权限等属性信息，采用元信息描述对象及相互间的关系，采用层次分布式结构存储、管理元数据[15]。

③信息资源部署

信息网格资源部署是一种动态部署机制，所谓动态部署是指资源在状态发生变化时通知网格环境，使其作出反应，包括资源信息的注册、更新、注销和维护，多采用服务形式，具体分为服务定义和发布两个阶段：前者确定描述Web服务的元数据，并以WSDL形式说明服务包括的操作、每个操作对应的输入输出参数类型以及它们如何绑定到具体的网络协议和端口等信息，用户可据此通过SOAP协议访问服务；后者绑定抽象的服务描述和具体的信息资源，即向服务所在管理域的DDS注册相应的服务描述，包括服务的静态和动态信息。在服务管理方面，静态服务采用UDDI机制，动态服务采用显式的注册／注销机制，同时采用软状态技术解决该机制的缺陷：服务崩溃时无法通知DDS删除相应信息，导致客户多次重复请求已失效的服务[12]。

④信息资源发布

信息资源发布是指如何将新产生的信息告知信息网格，包括资源描述方法、资源状态动态监测及发布机制[13]。学者杨顺钰提出使用XML、RDF和RDF Schema描述资源，由信息提供者采用RPC、广播等机制搜集、更新资源信息，并通过驻留在网格节点的共享目录监测器动态发现并监测网格资源，以收集相应信息，具体发布由信息提供者在网格目录中登记和网格目录信息发布机制来实现[13]。学者程青等提出向注册机构提交资源元数据的信息发布方式[1]。此外，学者郝克等提出基于P2P的信息网格个体资源发布与访问机制，其基于Web技术在资源节点本地发布个体资源，利用信息网格资源整合方法将个体资源注册到网格环境，然后借助P2P覆盖网络访问个体资源[16]。

⑤信息资源发现

信息网格采用动态资源发现机制，所谓动态发现是指使用者在得到服务之前先动态获取资源信息，然后按照某种策略选择提供服务的资源，具体分为资源请求创建、资源匹配和资源调度三个阶段[12]。国内相关研究先将信息资源封装成服务，然后制定相应的服务发现机制。学者李进华采用由用户层、资源路由器层和资源层组成的虚拟机模型进行服务发现，核心是进行资源信息路由转发的资源路由器层和支持资源发现的三层资源表示模型[4]。学者杨顺钰提出随机转发、学习、最好邻居和学习＋最好邻居4种信息路由算法[13]。学者谢成钢等提出面向完全自治UDDI注册中心的非结构化UDDI对等网络和面向协同UDDI注册中心的结构化UDDI对等网络两种分布式服务发现机制[17]。

（2）信息服务

信息网格信息服务包括信息来源管理、信息收集机制和信息管理机制[18]，国内相关研究集中在服务体系结构、信息网格自动处理、资源信息目录、信息监控、消息传递等方面[12]。

①服务体系结构

信息网格服务体系结构主要描述信息网格服务管理机制，比如服务的描述、注册、发布、发现、聚合、应用，消息传递等，国内主要采用分层机制，学者张小松提出的5层信息网格服务体系结构[19]、学者刘云翔等提出的7层SIG服务体系[20]均属此类。此外，学者沈记全等提出了具有三层结构（物理层、逻辑层、应用层）和二级映射的信息网格服务结构模型[21]，学者任彦等提出了基于管理中心的信息网格服务管理机制[22]。

②信息网格自动处理

自动处理服务主要实现信息网格智能管理，国内相关研究集中在网格工作流、网格事务处理等方面：学者王焕彬等利用工作流技术，通过人工干预实现网格服务自动整合，同时利用信息网格工作流引擎动态生成网格任务和调度[23]。学者张志强将工作流技术应用到信息网格平台，提出由流程相关数据、流程引擎、应用服务和操作界面组成的网格流程系统结构[24]；学者刘民利借鉴JTA（Java Transaction API）分布式事务架构，通过构造Web services事务管理器来控制事务提交过程，采用XML描述事务控制消息，采用RHTTP保证事务控制消息的可靠传递，最终实现Web Services事务处理功能，该技术用于资源访问代理可以实现信息网格的智能管理[25]。学者郭域峰等提出以社区为核心的信息网格平台自动处理流程体系结构，各社区保存各自的流程信息，并通过流程引擎操作和共享其他社区的流程[26]。

③其他相关研究

目录服务用于实现信息网格环境下信息的注册、发现、修改和注销等[12]，学者朱延东提出采用MDS实现信息网格目录服务[6]；学者黄飞等提出基于网格监测体系结构的监测数据源管理系统，由传感器、传感器管理器、数据收集器、数据收集管理器和系统管理器组成，当用户提出请求时，系统根据元数据选择合适的数据收集器和传感器动态采集监测数据[27]；学者郭域峰等通过测试得出JDBC对访问异构数据库效率比较高，SOAP可以有效解决信息网格平台中的分布、异构和松散耦合问题，并提出信息网格平台的消息传递结构体系，包括门户、控制平台、API、社区元信息、资源元信息、存储资源代理等[28]。

（3）用户管理

用户管理主要实现用户使用信息网格过程中的单一登录和跨域访问，国内主要对织女星信息网格进行了相关的研究。学者杨宁提出由三层主体信息（有效层、虚拟层和物理层）和两级映射（有效层到虚拟层、虚拟层到物理层）关系构成的信息网格主体EVP空间模型：有效层实现单一用户登录；虚拟层进行访问控制；物理层描述用户访问物理信息资源时的用户信息，同时通过主社区概念实现用户自主管理和系统用户管理的结合。此外，织女星信息网格提出面向用户行为的信息网格时空模型，该模型以用户为中心，由用户控制信息的共享、管理和信息服务，用户只需发出操作指令或服务请求，指令的实现以及与此相关的信息一致性等维护细节均由信息网格自动完成[29]。

2.3 信息网格安全

为了真正实现分属不同组织机构的分布式广域信息资源的有效连通，信息网格提供面向异构环境、跨自治域的安全系统集成框架及通用安全控制机制，以便对信息网格资源进行全局控制，同时支持资源节点管理者进行自主控制。此外，信息网格安全控制机制易于维护且独立于数据源本身，并在逻辑上提供不同的安全管理层次和控制粒度[2]，具体包括身份认证、权限与访问控制、系统安全检测与监控和审计4种机制[15]。

（1）安全体系结构

信息网格安全体系结构从宏观上描述信息网格安全的组成结构及运行机制，国内学者多从网格节点以及节点互访两方面进行信息网格安全设计，主要采用用户管理和访问控制技术[8]。学者龚强设计的空间信息网格安全体系和张超速提出的视频信息网格安全体系均属此类，前者由注册系统、网络资源安全系统、历史行为记录审核系统、行为跟踪模块、访问控制模块、安全数据库、地理空间信息网格资源、行为评估模块、资源监测模块、入侵检测模块、数据隐藏模块等组成[30]；后者采用信息网格安全基础设施GSI确保网格节点的安全，采用虚拟组织的访问控制技术，包括社区授权和虚拟组织身份认证来确保网格节点互访的安全性[12]。此外，学者刘怡文等提出了由构造层、GSI安全资源层、GSI安全协同层、安全应用层组成的网格安全体系结构[31]。

（2）权限与访问控制

信息网格访问控制主要是跨管理域的用户权限管理问题，学者邵桂伟提出基于角色的信息网格访问控制模型exRBAC，该模型采用权限预先分配和两次验证的方法解决跨管理域的权限授予与验证，采用带有权限传播深度的方法解决权限私有化问题[32]。学者杨宁等通过表示主体、客体、主体对客体的操作三者之间的关系实现信息网格的访问控制，并通过角色的继承关系和操作的蕴含关系进行角色授权的矛盾和冗余处理[33]。

2.4 其他研究

除上述研究外，国内学者还研究了信息网格评价问题，学者李晓林提出基于主体和客体全生命周期的信息网格评价模型[3]，学者杨宁提出用户正常使用信息网格时基于深广度的信息网格易用性评价方法[29]，学者张志强以响应时间为指标，采用全生命周期法对织女星信息网格的客户请求处理过程的时间成本进行评价，结果表明资源访问过程消耗的时间成本最高，主要影响因素是访问协议[34]，学者李慧提出了信息网格的全生命周期生产率评价指标体系[36]。

3 结语

综上所述，信息网格是一种实现分布、异构信息资源透明访问的新兴技术。其中，信息连通是其提供一体化服务的基础和核心，国内主要采用两种思路来实现，一种是基于资源空间模型构建统一信息连通模型，主要以元数据、资源目录、存储代理等技术为基础，利用信息网格资源空间模型中各层之间以及多层元数据之间的映射机制实现信息连通；另一种是将信息资源分为结构化和非结构化两类，分别制定信息连通模型；智能化是信息网格高效运行的根本保证，国内研究主要集中在资源管理和信息服务两方面，其中资源管理采用全局——本地两级资源管理概念模型，采用资源空间模型或面向对象技术进行资源信息组织，采用服务方式进行资源部署，并使用服务发布和发现技术进行服务管理。信息服务研究则集中在体系结构、自动化处理、目录、监控和消息传递等系统级服务；国内信息网格安全研究主要集中在体系结构和跨域访问控制两方面，目标是确保网格节点和节点互访的安全。同时，国内对信息网格中信息的一致性、用户管理、安全方面等的研究有待进一步深入。

收稿日期：2008－07－21

收修改稿日期：2008－08－17

标签：元数据论文; 用户研究论文; 虚拟技术论文; 网格系统论文; 动态模型论文; 访问控制论文;

我国信息网格技术研究进展(下)_元数据论文

猜你喜欢