网格技术将带来知识管理革命,本文主要内容关键词为:网格论文,知识管理论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
人类从工业社会向知识社会演进时,政治经济中心正从“生产”转向“发现、发明和创新”。知识正在成为创新的核心。网格技术将带来知识管理的革命,知识网格将成为知识创新服务的大平台。
1 网格时代的到来
Internet已经走过两代历程。第一代是20世纪70~80年代,主要的成就是把分布在世界各地的计算机用TCP/IP协议连接起来,主要的应用是email。第二代是20世纪90年代,主要成就是把成千上万个网站上的网页连接起来,主要的应用是Web信息浏览以及电子商务等信息服务。目前Internet正处于从第二代向第三代过渡时期。第三代Internet可称为信息服务网格(Information Service Grid),其主要特点是不仅仅包括计算机和网页、而且包括各种信息资源,例如数据库、软件以及各种信息获取设备等。它们都连接成一个整体,整个网络如同一台巨大无比的计算机,向每个用户提供一体化的服务。
计算机从CPU为中心发展到以内存为中心,目前转向以I/O为中心,网格存储设备成为热点产品。
最近,美国开始了STAR-TAP计划,试图将网格扩展到全世界。目前加入STAR-TAP计划的有加拿大、新加坡、日本和中国台湾;即将加入的包括巴西、俄罗斯、北欧、法国和亚太一些国家[1]。
信息网格(Information Grid)是中国21世纪的战略性基础设施,它对国民经济和社会发展的作用不亚于电网、交通网、对国家的安全的影响不亚于两弹一星[2]。
网格由6个部分组成,即网格结点、数据库、贵重仪器和设备、可视化设备、宽带网和网格软件。主干网将所有网格结点联成一体,其带宽可达Gbps量级。网格软件提供单一系统映像、透明性、负载平衡和资源共享等功能。网格结点、数据库、设备、主干网和网格系统软件构成了一个网格平台。
网格平台可提供下列功能:
(1)广域的高性能计算环境,不仅支持远端的高性能计算,充分利用高性能计算资源;而且可将各网格结点的资源协作构成联合计算环境。
(2)在Internet/Web上,数据和计算资源零散地分布在各个网络站点。而网格中,资源得到统一管理和使用。用户可以通过网格门户(Portal)之类的技术透明地使用整个网格上的资源。他们看到的是一个逻辑门户上的若干与自己相关的频道,而不必在成千上万个网站中去搜索自己想要的信息。
(3)网格操作系统提供目录和缓存等技术,可以大大提高网格信息查询和浏览速度,减少网络流量。
(4)用户、管理员和系统软件协同将零散的原始数据组织成一体化的信息和知识。
(5)网格结点是地理上独立的计算和信息中心,根据计算能力和使用方向分为两类:以科学计算为主的结点和以海量信息处理和服务为主的结点。以科学计算为主的网格结点配备有不低于每秒100亿次的计算能力。以海量信息处理为主的网格结点配备有可扩展到TB级容量数据存储设备,以及与之相匹配的信息查询和计算能力。
2 网格对知识管理的挑战
构建网格的目的在于实现人类知识的有效利用。它不仅对网格管理软件提出了技术要求,同时也对知识管理的理论和方法提出了挑战。
2.1 网格提供巨大的计算技术空间
网格管理软件实际上是更高层次的网格操作系统,其核心技术主要是一体化的信息平台、语义网站(Semantic Web)、智能代理(Agent)和知识本体(Ontology)技术等。
(1)计算网格(computational grid)。提供原始计算能力,高速宽带和数据处理。完成上述功能,必须是与网络连接和具有浮点计算和逻辑数据处理能力。
(2)信息网格(information grid)。采用接口连接主要的信息资源,允许同质对非同质分布信息进行访问。信息网格也需要高级分析以减少得到各种形式的信息所带来的技术的复杂性。
(3)知识网格(knowledge grid)。使用基于知识的方法学和技术学。包括知识工程工具,智能软件代理,数学建模,模拟,计划等。知识网格也应对决策制定和假设产生提供智能指南。存储在知识网格中的信息资源应允许支持低层信息和数据的挖掘。
2.2 传统知识管理模式的不足
传统的信息管理经历了5个发展阶段:20世纪50年代,是将文献与科技结合;60年代,重点研究信息处理基本技术,提高传统图书馆和信息服务工作效能;70年代,重点研究信息处理自动化,图书馆管理自动化、联合编目,计算机检索系统;80年代,重点开发联机检索系统、区域网络化、现代情报分析研究与决策支持;90年代,重点发展Internet信息服务、电子出版、内容开发技术、竞争情报和全球网络化[3]。
计算技术发生了日新月异的发展,而传统的文献整序与管理方法还基本上停留在文献管理的水平上,形成了巨大的反差。传统文献管理方法或是对文献的外部特征进行标引,以提供检索点,或是按文献的学科性质进行分类管理——分类法,或是按文献内容的主要对象选取主题词——主题法。这些方法,在以手工方式为主来组织文献的年代,起到了较好的作用。在运用计算机进行文献管理的最近几十年中,应该说也还是在继续应用图书情报学的这些传统的成果与方法。但是,国内外的许多有识之士,早就对这种以文献为单元的管理方法提出了质疑,而把目标定位在知识管理上。传统的情报学的发展已经到了一个新的转折点,应该突破传统的专业角色和视野来总结和发展情报学,并提出了建立“知识体系科学”的建议。
20世纪80年代初,著名的情报学家布鲁克斯提出绘制“认知地图”的任务[4]。他尖锐地批评了在图书馆界和情报界流行的分类法和主题法,认为这两种传统方法组织的不是知识,而是知识的载体——文献,以此组建的检索系统只能提供文献线索,而不能提供用户真正需要的知识。美国情报科学研究所研究人员斯摩尔(H.Small)提出用思想“网络图”揭示重大发现。用学术思想“网络图”来表述重大发现的来龙去脉[5]。
“情报组织”方法往往被局限在情报存贮与检索系统领域,有很大的局限性,不能适应信息社会乃至知识社会的发展,也不能适应情报科学的发展。布鲁克斯指出:“情报学的任务就是探索和组织客观知识。”[4]
由以上分析可知,现有的组织知识方式(如题录、索引、文摘、文献数据库等)有两大缺陷:其一,组织的是知识载体——文献,而不是知识本身;其二,检出的文献只含已有的知识,未能揭示其间的内在联系,不能为产生新知识提供联系。
如果说在手工操作时代,要想对海量的文献信息管理深化到“知识单元”层次只是一种无法实现的理想的话,那么,网格技术的发展,已经从技术手段上为人类的这一梦想提供了实现的可能性。现在的障碍在于,传统的图书情报学理论与方法难于对人类迄今的全部知识成果进行全面的梳理与组织,构建起“知识体系”的框架,并确定各个知识单元之间的逻辑关系。因此,我们认为,图书情报学的发展已经到了一个新的转折点,应该突破传统的专业角色和视野来总结和发展情报学,朝着建立“知识体系科学”的目标发展。
2.3 现代知识管理与知识创新
脱胎于传统图书馆职能的数字化图书馆,其所拥有的信息资源虽可以通过标题、关键词、作者、内容分类特征等“元数据”进行关联检索,甚至可以进行简单的全文任意词检索,然而对于“求知者”所要解决的问题来说,并不能迅速而准确地提供全面、系统、有针对性的知识信息。加之这些数据库在结构、信息加工标准和质量上的差异,使得数据库之间的信息关联、内容关联更加难以实现。在这个意义上,在现有数字化图书馆建设目标下开发的知识信息资源,本质上还只是一本一本“堆积”起来的数字化图书、期刊。除了信息量大、检索查询速度快等方便之外,数字化图书馆使人们感受到的获取信息的手段与方式,依然类似于传统图书馆的“计算机书目检索”与“开架借书”,与在现代信息技术水平之下人们追求的信息资源共享所应当达到的境界还相距甚远[6]。
“知识服务”理念,明确提出了现代信息服务业的任务和目标,成为当今知识信息资源共享模式设计的核心指导思想。在这种共享模式之下,人们从知识信息资源中获取的不仅仅是一条一条信息,而是一个一个针对特定问题的解决方案,即知识。这样的知识信息资源的共享方式,已经成为现代信息服务业所追求的高级境界。
知识标引与检索是知识创新生产,知识增值管理,知识有效利用的知识链研究。每篇文献由独立的知识元的链接组成,构成人类知识结构中的一个知识单元,知识单元与知识结构组成了个性知识与共性知识的知识系统;个性知识体现在知识的创新上,共性知识结构表现在知识的完整性上。个性知识单元由最小的知识元素“知识元”组成,知识元的不同排列构成了不同知识单元之间的差异,知识元也是知识结构的最小元素,在知识结构中可以由知识元直接组成新的知识单元,这就是知识学习与知识创新的过程。从人工智能观点看,知识是对事实的合理推理的结果。知识的表达与处理可以有多种方法,且已有许多优秀成果,但最关键的是如何实现知识元与知识单元和知识结构之间的继承性,如何实现它们之间的消息通信。研究知识元、知识单元、知识结构之间的信息与知识的变换成为知识管理与创新的关键。[7]
2.4 知识网格对知识管理的挑战
网格技术的进步远远超出了人类对知识管理的研究速度。1999年6月我国提出了名为“中国知识基础设施(CNKI)”的信息与知识服务模式。这个模式与数字化图书馆的信息服务模式的本质不同在于,其总的目标是,建成一个基于在“知识元”水平上全文关联的,数据结构标准化的,人与资源、实时多媒体信息交互的知识服务平台,无论数据库的物理位置何在,无论数据库专业性质和具体结构如何,都可以使其在知识信息的内容上跨越数据库界限而浑然成为一体。人们在这个平台上可以用平台的各种个性化服务手段,从所有数据库中任意获取所需要的知识信息,并可以在人与人的交流互动过程中得到新的知识。
笔者认为,知识网格是知识链路组成的知识网络图,是由“知识结构”、“知识单元”、“知识元”采用关联和链技术组成的层次知识链网状知识关系图。“知识元”构成了知识网格的最小单位,是求解问题的证据,是知识网格的核心。知识元具有独立性,封装性,继承性,被消息通讯性等特点。知识网络通过网格计算实现知识动态调用,达到知识动态利用。[8]
3 有关知识管理革命的几点设想
网格技术对知识管理提出了革命性的挑战。认识挑战并攻克它将是本世纪人类的重大使命。我们认为研究应解决以下问题:
(1)构造知识元结构:对人类全部文明成果在现有的学科分类体系的范围内,进行系统的整理、甄别、认定,以确定各学科的基本知识元,可组织专家就若干个成熟的基础学科的知识元认定进行实验。取得经验与公识,最终建立公认的人类全部知识的知识元库。由于人类知识是不断地发展创新的,所以要通过对知识元的必要的规范,形成知识元库补充、动态更新的有效机制,使之与人类知识的发展同步。
(2)开展知识链理论与方法研究:开展知识链理论与方法研究,实现知识组织结构由等级式向网络式转变。研究知识元的链接,实现由知识元组成新的知识结构。知识元之间的不同层次、不同学科的链接,是实现新知识生产、知识传播、知识有效利用革命的核心。知识链的建立应在传统的图书分类情报分类的基础上进行,并且深化到科学知识分类上。通过梳理各知识元的学科属性、等级范畴和相互之间的逻辑关系,从中找出各知识元之间的内在联系,还应通过对不同学科、不同层次知识元的具体分析研究,找出它们相互之间进行链接和组配的一般原则与方法,使知识链的组成有规律可循。在具体做法上也可通过一二个传统学科或该学科中的若干文献群进行探索性尝试,取得经验逐步推而广之。最终建立起各学科的主要知识链群和基本链接规律。
(3)建立知识平台。知识元的独立性与知识元的链接性是知识创新的途径之一。知识链的实现将依赖于知识平台的建立。知识平台将是实现知识创新革命的前提,将构建起整个科学分类体系,包括对诸多的综合科学和交叉学科框架的构建,使人类的知识成果系统化、有序化。知识元的独立性、拓扑性与知识元的链接性是构建知识平台的有效方法。
(4)提高隐性知识向显性知识编码转变的技术层次。隐性知识向显性知识编码转变是知识生产、知识学习、知识利用的基础。知识创新标引与创新检索同用户需求具有耦合共振性。解决知识创新标引与创新检索是知识不时滞的推动力。应用网格技术建立知识链与知识网络结构,达到对单元知识的任意存取。
(5)知识网格是“知识巨脑”。解决输入需求信息,输出特定知识的结果,是推动知识管理革命的目标。知识网格的建立远远比计算网格和信息网格困难,决不能只靠计算机专家来实现,而必须由情报管理专家、科学管理专家以及各学科的专家通力合作,才有可能实现。
(6)建立“知识管理学”。开展“知识管理学”研究,并在条件相对成熟的时候,考虑建立“知识管理学”。在原有的文献分类、主题标引等课程的基础上,建立知识管理学学科。在有关高校开设有关课程,推动对它的深入研究。
网格知识平台是一个集人类当前全部知识为一体的、合理组织的、表述和谐的、动态生长的网络知识集成系统,利用计算机网格通过信息集成和知识集成来实现知识的合理组织和动态生长,从而实现知识产生、传播和应用的总体最优化。
这一目标的实现将会把单个人直接与整个人类知识成果连接起来,它与引文索引的本质区别在于它不是文献链而是知识网络链。它会使知识的创新以无法预料的速度迅猛地增长。它的实现将需要一两代人的努力,但知识管理革命是人类无法回避的课题。