国内外知识库研究现状回顾与比较_机构知识库论文

国内外知识库研究现状述评与比较,本文主要内容关键词为:述评论文,知识库论文,现状论文,国内外论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      [中图分类号]G350 [文献标识码]A [文章编号]1003-2797(2016)03-0015-11

      1 引言

      知识经济时代,知识的价值日益凸显,它既是一种战略性资源,也是组织生存和不断进步的源泉。知识库是存储、组织和处理知识以及提供知识服务的重要知识集合,知识库正在成为各行各业开展知识管理和知识服务的基础。随着计算机技术的发展、知识管理理念的日趋成熟,国内外知识库方面的研究均取得了丰硕的成果。档案作为一种重要的信息资源和组织核心的知识资源,通过构建档案知识库可以深层次开发利用档案,充分挖掘档案知识,发挥档案知识价值效用,最终促进我国经济社会进步和档案事业的平稳发展。在此背景之下,本文拟对国内外知识库研究现状进行总结、评述和比较分析,为下一步档案知识库构建研究提供相应的理论支撑、技术支撑和参考借鉴,确保其具有扎实研究基础的同时避免进行无谓的重复性研究。

      2 国内知识库研究现状分析

      2.1 文献资料获取方式及获取结果

      国内部分文献资料主要通过检索中国期刊全文数据库(中国知网)、中国博硕士学位论文库(中国知网)、人大学位论文库等数据库获得。笔者在上述数据库中以与选题相关的关键词进行篇名精确检索,检索结果如表1所示。

      

      2.2 研究现状分析

      目前国内关于知识库方面研究的成果较为丰富,主要集中在理论、实践以及不同类型知识库研究这三个方面,理论方面主要是概念、特征、主要作用、实施流程等的研究;实践方面主要关于知识库构建的技术、工具等方面的研究;不同类型知识库主要是指机构知识库、基于维基(WIKI)系统的知识库以及档案知识库等的研究。

      (1)关于知识库概念方面的研究。概念是反映对象本质属性的思维方式,对概念的认知程度直接反映了对象的成熟程度。对于知识库的认识,目前存在着狭义和广义之分。狭义的知识库,主要指存放知识的仓库,是一个知识集合。张平等认为知识库是按一定要求存贮在计算机中的相互关联、经过分类和组织、程序化的知识集合[1],知识库系统、专家系统、决策支持系统(DSS)等一系列人工智能系统的关键和核心都是知识库[2]。可见,上述定义均体现的是对知识库狭义上的理解。而广义的知识库,则包含狭义知识库在内的推理部分、用户界面等,泛指知识库系统。吴丹[3]等认为知识库是以描述型方法存贮和管理知识的机构,由知识和知识处理机构共同组成,是对广义知识库的较好诠释。邱均平等[4],韩海涛等[5]均认为其是提供知识服务的人工智能系统。与知识库在一般意义上等价概念是知识仓库,在知识管理文献中,二者通常可交替使用,但总的来看,知识仓库是知识库的超集[6]。

      (2)关于知识库构建的理论研究。这些研究主要集中在构建原则、模型设计以及知识库中的知识抽取、知识标引、知识表示、知识组织、知识检索、知识发现以及知识库整合等方面,这些成果的成熟度直接决定了知识库构建的可行性和可操作性。李耀昌等[7]从宏观角度,基于知识组织层次模型,提出了知识库构建的原则和步骤,为知识库构建提供了思路。严亚兰[8],吴长彬等[9]将知识仓库的构架分为共享和获取隐性知识模块,知识的抽取、转换和储存模块、知识分析模块等6个模块,并指出目前已经开发出的一些知识仓库软件系统,包括IBM software Solution、Lotus Developments等。姜永常[10]认为知识元是知识仓库的基本单元,知识仓库的构建是在对文献信息的知识元抽取和标引,知识元库的构建再到知识仓库的构建过程中实现的。鄢珞青[11]则对知识库建设中的知识表示方式进行了探讨,并对直接式、说明式、产生式(过程性)、可视化及综合化等不同的知识表达方式进行了比较,在知识库建设中努力实现多种知识的表达方式共用,使用户能够较为轻松地获取到所需知识。更多的关于知识库构建方面的研究集中在企业领域,如陶颖[12]从宏观角度探讨了企业知识仓库构建的原则、标准和技术,邸强等[13]则在企业知识分类基础上,围绕外化、内化、中介和认知过程四个方面展开探讨了企业知识库的构建和管理。李生琦等[14]论述了企业知识仓库的构架体系。随后李贺等[15]也就企业知识仓库的构建和设计进行了研究。知识库是知识库系统中最为关键的组成部分,知识库系统的核心组成部分是知识库和推理过程[16]。知识库能否发挥作用,必须依赖于知识库系统。所以一般而言,构建知识库,也即同构建知识库系统具有重叠之处。

      (3)关于知识库构建的技术、工具等方面的研究。知识库中的技术和工具应用是知识库建设的前提基础和条件,知识库是现代信息技术、人工智能等技术发展的产物。不同的学者就知识库中的不同部分、不同环节所应用的技术作出了探讨。孙勇等[17]提出了通过建立蚁群算法知识库,来实现其知识检索上的越加优越性。杨炳儒等[18]则就知识库中的知识发现(KDK)进行了深入研究,探讨了基于事实和规则的KDK的结构模型和挖掘算法,这对知识库中的知识发现和知识获取具有积极意义。徐丽平等[19]则在建构知识库的基础上,将移动代理技术和本体技术引入知识发现中,提供了一种新的知识发现系统,该系统可通过提供良好的用户界面和推理机制,为用户提供满意的知识。杨龙等[20]认为单一分散的知识库并不能提供统一的知识资源全局视图,基于此,提出了知识库分割的多知识库整合方法,主要是在传统采用的知识库整合方法基础上进行优化,采用基于蚁群聚类的分割策略,将知识库有效划分为知识块集,并在此块集基础上进行整合。邱均平等[21]在分析传统搜索引擎的弊端基础上,探讨了基于知识库系统的智能搜索引擎技术和方法,发现将新一代的智能搜索引擎技术运用于知识库检索中具有更高的优势,并介绍了由美国CYCorp公司开发的CYC系统中的智能搜索引擎的应用。与此同时,张晓刚等[22],康桂英等[23]也对新一代智能搜索引擎技术进行了研究。

      (4)关于知识库具体的实践应用研究。吴长彬等[24]从数据—知识—应用三个层次对国土资源进行了深度的挖掘和分析,建设了国土资源知识库,并给出了知识库应用于国土资源综合分析系统的实例。韩海涛等[25]则构建了面向天津市滨海新区服务的知识仓库。

      (5)关于机构知识库的研究。吴建中[26]的论文《图书馆VS机构库——图书馆战略发展的再思考》标志着国内有关机构知识库研究的开始。目前国内关于机构知识库研究对象主要是指学术机构知识库,随着国外研究的不断成熟,其研究也在不断深入,从对机构知识库的定义、兴起背景、意义、开放获取以及尝试应用于图书馆及其他学术机构,逐步转向研究如何更加有效的发挥机构知识库运用于图书馆及学术机构所带来的积极作用,包括对一些项目和技术、软件分析的不断拓展。同时,关于机构知识库的研究逐步向机构知识库联盟和社区发展,同时关于机构知识库的网络建设、开放关联和互联操作等技术的研究等也在逐步加大。李大玲[27]在其博士论文中将学术机构知识库中的知识来源总结为知识对象所有者提交和从学术机构其他系统整合。李国俊等[28]以北京科技大学机构知识库为例,以元数据为格式标准,其知识库中资源主要是学校的期刊文献和会议文献,可见其资源来源仅限于机构知识库的管理者。马建霞[29]则认为目前我国的机构知识库建设还处于初级阶段,国内仅有少数几个高校基于自身优势开始构建自己的机构知识库,如国内著名的清华大学、中国科学院、浙江大学等院校建立了机构知识库,但其所存储的资源较为有限。

      (6)关于维基(WIKI)系统中知识库的研究。WIKI是一种支持多人协作的超文本写作工具,具有开放性、协作性等特点,具有协同创作、弹性分类、自动索引等优点,被人们广泛接受。它是一种开放的知识协作工具,利用WIKI构建知识库,所有人都可参与到知识库的建设中。目前利用WIKI来构建知识库,主要是在图书馆领域。武琳等[30],尚慧等[31]分别就利用WIKI来构建图书馆的学科知识库进行了论述,王勇[32],贾辉[33]都谈及了基于WIKI方式来构建图书馆的馆藏文献知识库。另外,陈莹[34]、沈洪杰等[35]还分别就利用WIKI协作方式和基于WEB2.0探讨了高校机构知识库和油田开发知识库的建设。

      从上述对机构知识库和基于WIKI系统知识库的研究,可以看出现有的机构知识库(IR)中知识库的管理是一种强调的“中心化”策略的管理,即机构知识库的组织者负责构建该知识库、建立知识描述的规则,并搜集、组织、存储和发布各类知识,提供使用这些知识的工具和手段,其最大特点是易于实现,但所有知识都是由知识库管理者来提供,很难实现提供海量知识、灵活的面向用户需求这一要求。而基于维基系统的知识库则与IR相反,其本质是一种“非中心化”策略的知识库,其最大优点是能由用户提供海量知识,直接面向用户,但由于用户对知识的理解程度不一等缘故,使得知识库中的知识较为混乱,质量不高,这对知识库中知识服务功能的实现是一个最大的障碍。

      (7)关于档案知识库方面的研究。目前,国内关于档案知识库方面研究的论文偏少,目前的研究主要集中在档案知识库的构建理论,档案知识库中档案知识资源处理的技术与方法以及档案知识库系统在实践中的应用等方面。

      档案知识库构建理论方面的研究主要集中在档案知识库构建的原则、指导思想和策略等方面。徐拥军[36]将档案知识管理系统(其核心是档案知识库)构建的原则归结为资源集成、功能集成和系统集成,并且档案知识管理系统构建的策略是基于知识管理的OA(或KOA)系统实现文档一体化管理并且利用知识管理的技术方法来提高文档管理的功能。孟歆[37]从知识管理视角,认为档案知识库的建立应该从档案利用者的需求分析知识资源的合理评估、知识开发与知识获取、知识挖掘与整理、知识分类检索以及知识检查和更新五个方面进行考虑。

      一个完整的档案知识库构建,包含档案知识资源的知识抽取、标引、表示、组织、检索以及档案知识库的维护等诸多方面,档案资源不同于一般的知识信息,其来源复杂、语义异构严重,且具有一定的有机联系性等一系列特点。因此,国内档案界关于开展档案(数字档案资源)知识服务方面的技术、方法等研究也不断深入,所有这些技术、方法的成熟,是构建档案知识库的重要保障。林周佳[38]基于XML技术,应用国际档案界元数据编写标准EAD探讨了档案信息资源的数字化及存储,尝试分析了档案的语义级检索,并建立了档案的语义级检索模型[39]。王应解[40]就如何进行档案的知识组织展开了研究,档案知识组织主要包括档案知识单元的标引、知识单元的整序和结构化组织以及档案知识的呈现三个方面。卞咸杰[41]将LINQ技术引入数字档案检索框架中,以实现数字档案的智能化检索。吕元智等早在2003年就现代档案的信息组织要求,将超媒体数据库技术应用于档案信息检索,初步实现了档案利用时的知识化和智能化查找需要[42],现又将关联数据技术引入数字档案资源知识组织中,构建了数字档案资源知识关联组织框架模型,用于解决数字档案知识元件的“关联”问题[43]。王兰成分别就基于语义的、XML-EAD的异构档案信息整合中知识组织中的实现技术和方法、档案检索平台和档案信息检索中语义异构性中的实现技术和方法进行了研究[44]。

      档案知识库在档案部门的实际应用也逐步出现。秦山核电公司在其完成的档案数字化基础上提出构建研发档案知识管理系统,并提出了其知识管理系统的建设思路,进而为提高档案知识利用创造条件[45]。周义刚[46]首次将本体作为设计数字档案馆知识管理系统的核心技术,以湖北省档案局2000年以来的11662篇经过数字化归档的政府公文作为原始材料,设计并实现了基于本体的数字档案馆知识管理系统,该系统具有数字档案知识识别与知识抽取、知识表示以及知识检索等功能,可根据用户需求提供个性化、智能化、专业化的档案知识服务。

      3 国外研究现状分析

      3.1 文献资料获取方式及获取结果

      英文文献获取时,“知识库”对应的英文术语存在Knowledge Base、Knowledge Bank、Institutional Repository、Knowledge Repository四种不同形式。通过对上述知识库的几种形式分别在不同的英文论文数据库中进行篇名精确检索,检索出大量与本选题有关的论文,具体检索结果如表2。从表2中还可以看出国外研究档案知识库的文献也比较少。

      

      3.2 研究现状分析

      国外对知识库的研究最早是在研究专家决策系统基础上进行的,随着人工智能技术的成熟和发展,对于知识库的研究也不断成熟。关于知识库的概念认识、框架和结构、知识库中运用的技术和方法以及知识库在不同领域的应用均有较为深入的研究。

      (1)知识库使用的必要性研究。澳大利亚学者Dong-Tsan Lee等[47]论述了在科学知识方面逐渐呈现出构建大规模知识库的发展趋势。在这样的知识库中,重要的不是使所有的知识之间都有密切的相互关系,而是要能够确定与当前问题有关的知识。Richard C.Hicks[48]针对已有的一些智能支持系统等并不能提供足够的验证测试问题,提出了知识库管理系统为业务规则和专家系统的发展和验证提供了一个完整的生命周期环境。通过对知识库管理系统生命周期和框架结构的深入研究,并在此基础上,通过知识库管理系统构建或建立了一个专家系统,强调每一个阶段的验证测试。知识库管理系统这一工具的可用性对知识库系统的可访问性大大扩展,使其有更加广泛的用户,也将促进知识库系统得到更好的发展。

      (2)关于知识库基本结构和基本理论的研究。Grigoris Antoniou[49]研究了知识库的结构,应该包含规则库R(是一系列有限的规则)、缺省的规则库D(包含多个默认缺省)和声明集(A declaration set)DêC,它主要包含目标文字的设置G、输入文字的设置Z和一些限制的设置C。Eric C.Okafor and Charles C.Osuagwu[50]则将知识库的知识使用框架结构描述如图1所示。

      

      图1 知识库中知识使用的框架结构图

      Andreja Andric等[51]探讨了知识库知识存储和输出格式,针对知识库对知识反馈要求较大的内存消耗问题,将整个知识库转化成一系列HTML文本,使内存达到可接受的程度,正如万维网(WWW)可接受来自世界各个地方的同时访问以及对同一问题的多次访问,万维网(WWW)的这一工作机制可以被运用于知识库中。N.A.Lorentzos等[52]认为任何专门领域的知识都和时间有一定关系,据此,可将知识分为两类:与时间无关的和与时间有关的。为了维持基于规则的知识库内容更新,三种方法被提出并评估。它们的共同之处在于知识被存储在数据库中,因此,当其被知识库所接纳时,数据库的所有优点也同时被继承。Adah S.等[53]等提出当合并多个知识库时,这些知识库可能包含不一致、不确定性和否定的非单调模式统一,研究发现,对注释逻辑进行适当修正,可用于不同知识库间的协调。与此同时,还对不同知识库合并的算法、数据结构和查询处理进行了研究。加拿大学者James P.Delgrande和德国学者Torsten Schaub阐述了基于一致性的知识库整合研究[54]。作者提出一个框架来表达各种合并操作符的信念集,其中有两个基本的合并操作符方法。第一种方法中,可信的来源被统一组合起来,以确保知识库合并后的结果是一个最大化的、一致的公式的组合,并且包含知识库中的知识节点;第二种方法类似于一个普遍的信念修正算法。不同的知识库被连接在一起,并且这种方法是独立于语义的。D.Xue,S.Yadav等[55]在产品生命周期特征模型、产品实现过程模型、数据关系维护模型和最优并行设计模型四种数学模型基础上,设计出了一种知识库和数据库智能并行系统。该系统引用特征概念,对产品生命周期的各方面进行描述,旨在开发一个基于计算机的并行设计环境,在保持产品生命周期各方面一致性的基础上,支持产品生命周期内的所有活动,从而为下一代的CAD/CAM系统的并行设计能力提供理论指导和实施的框架。Thomas Eiter等[56]则通过基于复杂性和规则条件下的条件知识库研究,填补了条件知识库中缺省推理下复杂性的清晰图谱。Grigoris Antoniou[57]探讨了非单调知识库(Nonmonotonic knowledge bases)中的一些异常,诸如冗余、矛盾和知识缺乏。他认为非单调性知识库在一些特定领域的应用将会不断增加,但是非单调性知识库中的检验和确认还没有引起足够的关注和重视,认为可以通过运用一些传统的验证方法来检测非单调性知识库中的一些异常(anomalies)。美国学者Eugene Santos Jr.等[58]探讨了贝叶斯知识库(Bayesian Knowledge Bases),提出了一个框架,可以克服时间约束下的不确定性。该框架的构建是将时间约束同不受时间影响的贝叶斯知识库有效融合在一起,时间约束贝叶斯知识库推理和融合算法在贝叶斯知识库中得到拓展,可在表示时间可变性和不确定性的过程中保持其语义不发生变化。同时,还讨论了该框架的一些特性和介绍了相应的算法来确保该模型建设中的确定性。

      (3)关于知识库技术和工具实现的研究。印度学者Keshav Dev等[59]探讨了遗传算法在知识库分割中的作用,在知识库几个分区中进行产生规则分配可以缩短专家系统应用程序的编制和执行时间,并促进它们的验证、确认和维护。针对知识库在整合中出现的NP完全问题,首先提出了一种遗传算法用于解决知识库的分割,然后与处理同一问题的一个启发式聚类算法比较其性能。研究结果清楚地表明,遗传算法要远比聚类算法更优。Eric C.Okafor等[60]评估了目前最成功的知识表示方法和技术的效能和水平。在专家系统知识库构建中,知识表示(Knowledge representation)在专家系统开发中是最为重要和最为关键的一环,文章列举了现有的一些知识表示技术,产生规则、语义网络、框架、逻辑,并对各种知识表示方法的优缺点进行了描述。由于单一的知识表示方法在知识表示系统(KMS)中都有其优缺点,为了获得更大的效率和进行更好的知识表示,两种或两种以上的知识表示组合方法在知识库构建时是必需的。J.Kingston[61]阐述了高性能知识库中知识获取与呈现的四种方法,即可通过AIAI's、TFS/Cycorp's、ISI's和GMU's共四种方法来解决知识库中的知识获取、表示、推理和呈现。通过运用上述四种方法和最新人工智能技术的发展成果,大型知识库能够被快速有效的建立起来,用于解决各类实际问题。Philipp Cimiano[62]等探讨了ORAKEL系统的知识库便携式自然语言接口,描述了其构成结构、设计选择及执行。同时还展示了ORAKEL的适应性模型,该模型允许用户在不熟悉自然语言处理(natural language processing)和形式语言学(formal linguistics)方法的基础上通过一个便携式的自然语言界面便捷地访问知识库。David Lubliner等[63]论述了知识库集成领域知识的功能作用。通过知识库设计图,描述了作为工具设计基础的知识整合理论模型,并提出可通过定性和定量的评价手段对知识库设计地图的有效性进行评估。文章同时还对语义网等相关知识库中的技术和方法进行了论述。Olivier Roussel等[64]阐述了基于循环检索的知识库所取得的成效。作者提出可通过一种新的循环搜索来实现检索/搜索的编译方法,该方法可以使我们精确识别那些之前连接不完整的知识或者我们已经完成的知识。这样做的结果是我们不必去关注单一关联,也可以尽量避免数量较多的无用计算。因此,借助于这个系统可以产生一个图形化的解释,有助于为编辑者发现更多的增值信息或知识。Michel R.Klein[65]论述了SIMAR的设计与实施框架。SIMAR是一种对知识库的管理策略进行定义和测试的应用程序,该应用程序在规则形式下允许策略性知识标准化。Udo Hahn,Martin Romacker[66]论述了SYND I KATE系统的内容管理:即如何实现将技术文本直接转化成文本知识库。S YND I KATE是自然语言理解系统中一个能自动从现实世界文本(例如,信息技术测试报告,医疗调查报告)中获取知识并转移这些内容到正式的框架结构中,从而构成一个组合的文本知识库。文章提出了一个通用的系统架构,集成了从单句的分析到引用链接的句子形式组合文本知识库的要求。Werner Winiwarter[67]介绍了用于访问FAQ知识库的自然语言界面结构,作为FAQ知识库检索入口。采用可扩展的语义枚举数(eXtended Semantic Enumeration,XSE)的机器学习模块在遍历树中从语义、语法以及务实分析来激活语言测试,实现使用者使用自己所用的自然语言就能轻松地获得他所要的请求。基于FAQ技术,目前国外已开发出应用价值较高的FAQ信息服务系统,如FAQshare、FAQFinder、AskJeeves、Answer BUS等,FAQ已经成为国外英文网络中一项重要的资源服务方式。

      (4)知识库对决策的影响研究。美国学者Kurt D.Bollacker等[68]论述了一种超分类器的分类器知识库构建方法。超分类器尽可能使用较少的训练样本,支持大量离散的样本数据,通过增加相关支持分类器的数量来添加知识,并且经由一个分类向量的输入值进行分类决策。他们认为,在理论上,随着更多的分类器进行重用,使用汉明最近邻分类器可以将预测真正目标分类的概率确定在一个指数比率上。Shuliang Li等[69]通过调查多代理的混合智能系统在国际市场计划中的支持作用,将多项代理、仿真、知识库和模糊逻辑进行整合来实现这一多代理混合智能系统的智能性,为国际市场营销决策提供参考依据,并通过评估研究证实了其在营销决策上的积极作用。Aviv Segev等[70]就知识库在医学诊断帮助中的作用进行了论述,临床决定或决策的做出是一个基于经验、判断和推理的复杂过程,通过整合病人过去就诊历史和现在的症状等做出诊断和作出治疗决策,才会更加科学。南非学者Herna L Viktor等[71]认为发达国家的管理面临的主要挑战是提高知识服务工作者的表现,而在南非这样的发展中国家,对政府而言一个发达的商业部门则更加重要。他们研究了以知识为基础的南非国家研究与技术(NRT)审计知识库的建设。该知识库使用归纳学习团队合作(CILT)的方法,通过数据挖掘工具从知识库中获得新的见解,为决策和政策制定提供知识库智能参考作用。

      (5)知识库在不同领域的应用研究。随着知识库相关理论和技术的成熟,知识库在不同领域的应用逐步普及。韩国学者Kim Jeong-Hyen等[72]研究了图书馆学领域中,使用冒号分类法的分面分类原则(CC)的自动分类知识库的设计。Bradley Wade Bishop等[73]探讨了知识库在图书馆联盟建立时如何更好地发挥本地知识效用,也即通过本地知识的填充建立的知识库能对用户在使用图书馆过程中存在的问题,用已有的答案给予回答,进而减少图书馆员的工作量并保证对用户回答的专业性。Chang Kyu Park等[74]论述了知识库对服装制造行业的促进作用,通过使用知识库可以搜索到最佳工艺条件,从而开发出高品质的成衣制造。Juan D.Vela’ squez等[75]针对网络挖掘工具可以对网络用户行为兴趣进行提取,但由于用户兴趣的频繁变动和网站自身的一些问题,使得新发现的知识可能在短时间内过时,而失去效用。针对上述出现的问题,文章构建了一种知识库,其拥有数据库类型的存储库、独特规则、独立程序,能提高和保持网站和其访问者的联系,进而实现及时同步的更新。这一知识库所运用的结构,在维持知识同步性方面,已在智利虚拟银行的实验中得到了验证。加拿大学者Natalia Villanueva-Rosales等[76]阐述了本体驱动的知识库——YOWL。作者认为知识管理是生物学家们一直以来所面临的难题,他们需要更加精细化的方法来存储、集成、检索所形成的数量巨大的、多样的、持续增长的生物信息。语义万维网首先为呈现、共享和发现这些信息提供了一个新的知识工程框架。作者还分析了他们基于本体论的知识库所做的研究——从本体设计和使用语义数据的样本到自动推理和语义查询回答,同时还探讨了他们在构建知识库的过程中所遇到的困难以及这些困难是如何被解决的。Alessandra等[77]以一家法国制造企业为例,探讨了企业知识库对企业生存的影响。他们认为,知识库所包含的知识创新性可以提高企业生存的概率,同时,企业知识库中关于搜索策略的开发,可以减少企业在运作过程中,故障事件发生的概率。此外,知识库知识的连贯性、多样性与企业生存存在着正相关的关系,而认知距离则会对企业生存产生负面效应。Wendi Bukowitz[78]指出企业越来越注重降低有效成本和提高营运效率,更加关注其收入增长。集体的创造力和具备专业知识的员工是一种新兴的预测客户需求并开拓新市场的最佳途径之一。该文回顾了安达信的经验,在发展知识库过程中专注于内容、知识共享和文化变革。M.Bertolotto等[79]介绍了基于知识库的地理空间图像,包括扫描的航空照片和卫星图像研究。他们开发了一个基于网络的系统,用户可以查询知识库中的图像,不仅可以使用元数据,而且可以根据用户感兴趣的配置对象绘制草图,以及凭借输入的文字描述其预定任务。该系统基于案例推理技术集成,形成知识基础,先前发出的查询,可以通过经验捕捉,改进今后的查询处理和建立组织记忆。作者同时还指出有效地设计和实施一个用户友好的图形用户界面对提供完善的人机交互和决策支持系统的重要性。

      4 国内外知识库研究的对比分析

      4.1 国内外研究的共同点

      (1)目前国内外研究的关注点基本相同,主要集中在知识库构建的必要性、理论基础、基本结构,知识库构建的原则、模型设计,知识库中的知识抽取、知识标引、知识表示、知识组织、知识检索、知识发现以及知识库整合,知识库构建的技术、工具等以及知识库构建的具体实践这些方面。

      (2)国内外在知识库研究方面的研究方法基本类似,即先进行理论分析,然后构建相应的知识库模型,最后对模型中具体实现所用到的知识抽取、标引、表示、组织、检索、知识库的维护和整合等计算机技术进行研究和讨论。同时发现,目前国内外知识库应用于不同行业、领域时,几乎均未涉及针对不同行业或领域使用者需求特点的研究。

      (3)目前国内外在档案知识库研究方面,不仅研究成果数目较少而且研究的深度也不够,这主要是因为目前档案学中知识管理方面的研究还主要是在理论层面,在实践应用方面的研究仍然较少。另外要想研究档案知识库,需要先对知识库技术进行研究,然后再将这些技术与档案资源的独特性相结合,对档案人员在技术方面的要求较高,这是制约档案知识库研究的一个因素。

      4.2 国内外研究的区别

      (1)研究主体不同。国内对于知识库研究的主体集中在高校、研究所中进行信息科学研究的学者,而国外对于知识库的研究不仅包括上述学者,还有企事业单位实践部门的研究人员,并且研究人员的学科不仅仅局限于信息学科,这样使得国外的研究主体更加多元化。

      (2)研究视角不同。国内学者研究的视角更多是从宏观视角去讨论知识建设的理论、原则、构建方式等,对于知识库中具体实践的细节研究较少。国外学者虽然在宏观层面有一定的研究,但是他们更加侧重于知识库构建的具体细节,例如实现技术、构建算法、框架接口等微观方面的研究。

      (3)研究深度不同。目前国内关于知识库的研究虽然在不断成熟,应用领域也在不断拓展,但是关于知识库的相关理论、技术、方法的研究,本国学者的成果少,多是学习和借鉴国外关于知识库方面的研究成果,研究的深度还不够。主要表现在:关于知识库的概念、构建原则、模型设计以及知识库中的知识抽取、标引、表示、组织、检索、知识库的维护和整合等方面的研究以及涉及上述环节的相关技术和算法很少有原创的,基本是源于国外算法的搬用或者改进。国内知识库的应用领域虽然与国外的有所差距,但是在不断地拓展,拉近与国外知识库实践的差距,主要表现在教育机构、企业等行业或领域,例如国内的多数高校都已建立起比较知名的IR和基于WIKI方式构建的知识库(如厦大的Libpedia图书情报网上百科等),对于知识库在企业的研究也在不断深化。

      国外关于知识库的理论、技术和工具实现的研究已经非常成熟,知识库在众多行业和领域得到了实施运用,而且研究得很深入,对知识库实现的细节方面的研究很多。主要表现在:理论层面中知识库的基本结构、语义一致性维护等的研究;在技术实现方面围绕知识库中的知识表示(知识描述)、知识组织、知识检索、知识获取、知识库用户界面以及诸多知识库中知识的关联实现、不同子知识库的外部封装等多个方面展开了研究;在知识库实践方面探讨了知识库在医学、教育、制造业等行业的实际应用以及在辅助决策中的实现。

      4.3 国内外研究成果对构建档案知识库的启示

      通过对国内外关于知识库研究的梳理和比较分析,为促进知识库在档案领域的实践,档案工作者还需在以下三个方面不断加强:一是加强对档案知识库的基础理论研究,如理论基础、档案知识库的内涵、性质,特点及其功能、服务模式与构建工具等,进而形成完整的理论体系,为档案知识库的实践提供理论指导;二是不断加强技术研究,探索档案知识库构建的主要技术与系统的开发方法;三是应用研究,从整体角度分析档案知识库的实施办法和相应的实现保障。档案部门利用先天优势条件,建设档案知识库,不断深化档案信息资源开发利用,实现档案知识资源的价值,为政府的公共决策提供最精准、最系统和最有效的知识服务将对政府决策水平和层次的提高起到至关重要的作用。

标签:;  ;  ;  ;  

国内外知识库研究现状回顾与比较_机构知识库论文
下载Doc文档

猜你喜欢