知识表示规范比较研究,本文主要内容关键词为:知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
知识表示规范是智能情报系统的重要研究内容,在智能情报系统组织和应用领域知识的过程中,它和知识、知识库、知识领域等概念一起构成了整个过程的研发基础。
Rosenberg[1]认为:知识是一组紧密结合的在实践中能产生有益性能的事实与关系;知识表示规范是在数据库 (也可称为知识库)中编码及存储知识的方式,依据系统解决问题类型的不同而有所变化;知识库是能表示智能情报系统特定应用所需的特定领域知识的一组数据结构及过程;知识领域是一个问题领域,其中包含了一组特定的知识,这组知识能有效地帮助解决该问题。
现有的知识表示规范可以分为两大类:知识结构规范和执行规范(Knowledge Structuring Schemes and Implementational Schemes)。前者用于组织总体上具有相同主题或相关目标的知识,如MOPS(Memory Organization Packet Scheme)。后者主要用于在计算机系统内表示领域知识,如逻辑、语义网等。本文的比较对象将限定在执行规范。
Brachman[2]曾指出“一个知识表示规范在调整适用于机器(符号层)或人(系统工程层)之前,必须先在知识层充分理解它能/不能表示什么样的知识”。考虑到这点,本文将在知识层比较研究各种知识表示规范,集中比较各规范能表示什么类型的知识。
一些研究者[3-7]曾对一个好的知识表示规范应具备的基本特征进行过深入研究,这些特征已被后续研究者接受。笔者将在这些特征的基础上构建一个比较知识表示规范的框架,并应用此框架比较几种常见的执行规范。
1 知识表示规范的基本特征
1)Bench-Capton的研究。Bench-Capton[3]认为知识表示规范应该具有充分性,即规范能保证进行知识表示所需的各种条件。如果任一条件不能满足将导致无法进行知识表示。具有充分性的规范应该满足如下3个要求:①规范支持的知识表示和事实之间不存在矛盾。②规范支持表示任何希望表示的事实。③规范支持知识表示自身即能表达解决问题过程中的推理。
此外,Bench-Capton认为好的知识表示规范还应具有以下特征:①每一个有效的知识表示都应该有且仅有一种解释。②具有可计算性,也就是说该规范能够在计算机系统中实现。③易于理解。④不管在哪个系统实现,表示既定事实的方式应该是一致的。⑤知识表示的评估不应该是绝对的,而是任务相关的。⑥不应该造成偏好性。即不会造成某些知识特别适合于用某些表示来表达,或造成构建系统/提供知识的人偏向于使用某些表示。
2)Reichgelt的研究。Reichgeh[4]将知识表示分为4层:执行层、逻辑层、认知层和概念层,并给出了每层知识表示应具备的一些特征:①执行层涉及知识表示在计算机系统内的实现,其主要特征是空间高效性和实践高效性。②逻辑层涉及知识表示的逻辑特性,其主要特征是语义清晰性和推理规则有效性。③认知层涉及知识表示所需的知识结构基元类型及推理策略的选择。主要特征包括自然性、模块性和粒度(本文的评估框架将采用这几个特征)。④概念层涉及知识表示所需的知识结构基元的具体选择。比如,在认知层选择语义网进行知识表示,那么在概念层就会具体选择使用哪些弧。这一层的主要特征是简洁性,即能用最少的基元正确地完成指定的知识表示。
3)Nisenfdd的研究。Nisenfeld[5]认为好的知识表示规范应该具有以下特征:①能在适当的层面表示所有应用相关的知识。②能推理出有用信息。③能明确地整合可提高问题相关知识有效应用的信息。④知识的组织结构方式允许系统仅关注与特定情境相关的知识。⑤知识的组织结构方式允许在知识库中自由增加删除信息而不影响知识库的有效性。
4)Rich的研究。Rich[6]认为好的知识表示规范应该具有以下特征:①表示的充分性,即能表示问题领域内所有类型的知识。②推理的充分性,即能针对新的知识从现有表示结构中得出对应的表示结构。③推理的高效性,即能在知识结构中整合额外信息从而引导推理过程。④高效的信息获取,即能快捷有效地获取新信息。
5)Winston的研究。Winston[7]认为好的知识表示规范应具有以下特征:①能清晰揭示出重要的知识/事实。②能揭示事实之间的自然约束属性。③完备的,即能表示所有需求。④简洁的,即能高效地表示需求。⑤可理解的,即不会出现无法理解知识表达式说的是什么。⑥可计算的,即可以通过现有过程进行演算。⑦可压缩的,即能将很少用到的信息剔除,但是当需要时仍能访问这些信息。
2 知识表示规范的比较框架
1)表示充分性。表示充分性指知识表示规范应能表示特定领域内所有类型的知识。该维度有两个属性:①可表示的知识类型。知识分为声明知识和过程知识两大类。声明知识指特定问题领域内有关事实、概念及关系的信息,使用这类知识的规范具有知识表示灵活省力、演绎过程充分且确定、系统易于调整等优点。过程知识指如何推理这些事实、概念及关系的有关信息,使用这类知识的规范则具有演绎过程直观明确且易于理解的优点。显然,这两类知识都是问题求解所必需的。智能情报系统所能表示的声明知识及过程知识的种类对其可以求解的问题类型有直接的影响,好的表示规范应该综合使用这两大类知识。②表示粒度。知识需占据一定的存储和表示空间,表示粒度就是指这个空间的规模。比如知识可以存储为一组事实,也可以存储为一组事实及事实之间的关系,还可以再加入相关的过程,那么其对应的存储和表示空间也会不同,即粒度不同,相应的在不同粒度层面的知识推理及问题求解肯定也会各不相同。因此,好的知识表示规范应允许针对不同的问题领域调整知识存储和表示的粒度。
2)表示属性。表示属性包含5个主要的比较点:①自然性。知识表示规范实际上是一种辅助思维工具,因此和自然语言一样,它也应该很自然地就能被人理解。也就是说,它应提供一种符合人类自然思考模式同时又能便于计算机处理的问题求解知识表示框架。具有良好自然性的知识表示规范可以更容易地进行知识编码及除错。②力度。知识表示规范的力度体现在4个方面:对不完全知识的表示和推理能力;对时间相关知识的表示和推理能力;对信念(Belief)相关知识的表示和推理能力;对默认知识的表示和推理能力。有些强力的知识表示会导致解决某类问题的效率降低,因此好的知识表示规范会在问题求解效率和表示力度之间达成平衡,在不影响效率的前提下提高表示力度以捕获更多的问题求解知识。③模块性。智能情报系统知识库中的知识会随时间有所变化,如知识领域改变了、在应用中发现知识结构有误等,这就要求在知识库中增加、修改和删除知识。模块化的知识表示规范可以将知识库的变化控制在最小范围内。④遵循Frege原则,即无论一个知识表示多么复杂,都可以通过构成它的更简单的知识表示及这些表示之间的语法结构完整无误地确定该表示的含义。⑤结构性。即知识表示规范如何组织知识。
3)支持的推理方法。知识表示规范支持的推理方法的多样性可以反映出规范的灵活程度,好的规范应该支持尽可能多的推理方式。本维度的比较点主要有3个:①推理策略。好的知识表示规范应该支持尽可能多的推理策略,常见的推理策略有演绎推理、归纳推理、知觉推理、默认推理、概率推理等。②数据及控制策略。数据及控制策略可以分为两类——独立型和混合型。如果表示的知识同操作它的过程分离,那么就是独立型策略;如果表示的知识无法从操作该知识的过程中分离,那么就是混合型策略。③搜索策略。问题求解中可利用的搜索策略有多种,如问题演绎、约束满足、广度优先、深度优先等,不同的知识表示规范会利用不同的搜索策略。
4)推理属性。知识表示规范的推理系统通过系统搜索实际问题的各方面来寻求一个问题解决方案,在应用知识库中的知识解决问题时,有几个重要的属性可以用来比较知识表示规范的推理机制:①计算效率。好的知识表示规范对计算机系统中的表示进行高效的操作。如同前文所述,计算效率同表示力度之间存在反变关系。②完备性。知识表示规范的完备性指为充分解决问题所需知识的量及表示这些事实所采用的知识表示的详尽程度。有的时候,智能情报系统会牺牲完备性以求快速解答问题。③一致性。知识表示规范的一致性指在问题解决过程中其所有的演绎推理都是正确的,即其结论不会自相矛盾且服从前提。也就是说,从同一组正确前提出发,得到后续所有演绎都是一致的。④透明度。知识表示规范的可信度指用户能清晰地跟踪推理控制流,理解推理过程,从而增强对问题解决方案的信息获取。
3 几种知识表示规范的比较
本部分将应用前文讨论的框架分析几种在智能情报系统中应用比较广泛的知识表示规范,即:逻辑、语义网、产生式规则、框架规范,分析结果见表1。
逻辑是最古老的知识表示规范之一,也是发展最完善的规范之一。逻辑是一种一般化的语言,在知识表示的意义和符号结构之间提供了一个定义清晰的界面。逻辑规范下的推理结果有很好的一致性和充分性。采用逻辑规范的智能情报系统有一些很重要的优点,包括:对不完全知识的表示和推理能力;推理规则是充分且完备的(Soundand Complete);模块性很好;逻辑规则易于理解,是一种自然的规则;逻辑规则能很好地遵循Frege原则等。
逻辑系统也有一些弱点,如表示和处理是分离的;当知识库中事实数据增加时,组合事实知识进行推理的方式会呈指数增长;问题求解过程有时会晦涩不清;推理规则的应用限制太多,如有些逻辑规则只能使用基于真值的演绎逻辑;缺乏组织知识的方法等。尽管有上述弱点,但是由于逻辑强大的表示力度、推理规则充分且完备,逻辑仍是一种非常流行的知识表示规范。
语义网是最一般化的表示结构,其自身无法直接用于知识建模,因此常作为其他知识表示的基础,如产生式规则和框架规范。语义网的主要优点是能继承其他节点的关系,即能推理和判断非直接连通节点间的关系。语义网最常用的推理规则是匹配。
产生式规则系统由规则库、推理引擎及数据库组成。规则库由一组相互独立的规则(规则形式为:如果〈情境〉那么〈动作〉)组成。推理引擎包含激活某推理规则的过程知识。当规则动作被激活后,数据库就做出相应的修改。推理过程由一系列的选择、激活规则的过程组成,直到数据库满足系统的目标。
产生式规则的优点有:能多种形式地利用过程知识,即能进行概率推理、默认推理、猜测等;模块性;易于表示某些种类的知识类型。弱点有:和语义网一样,其推理的充分性和完备性没有保证;问题领域的规模不能太大等。
框架规范通常由描述事物的各个方面的槽组成,每个槽可以拥有若干个侧面,而每个侧面又可以拥有若干个值。框架规范是一种复杂结构的语义网络。因此语义网络推理中的匹配和特性继承在框架系统中也可以实行。由于框架用于描述具有固定格式的事物、动作和事件,因此可以在新的情况下,推论出未被观察到的事实。
框架规范的主要优点有:表示力度和计算效率比较平衡;所表示的过程知识没有约束到任何预定义类型,因此可以支持多种推理策略。其主要缺点包括:Frege原则的遵循状态不太好;对不完全知识的表示能力比较弱。
4 结论
本文构建了一个比较和评估知识表示规范的框架并应用此框架比较了4种常见的知识表示规范。这种比较可以有效地指出各种知识表示规范的优缺点,也能有效地帮助问题求解比较和选择适当的知识表示规范,同时还能帮助构建和评估新知识表示规范。
收稿日期:2006-07-10