四种网络知识表示语言的比较研究_语义分析论文

四种网络知识表示语言的比较研究_语义分析论文

四种网络知识表示语言的比较研究,本文主要内容关键词为:四种论文,语言论文,知识论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

网络环境下知识表示语言日益丰富起来,涌现了XML(可扩展标记语言)、UML(通用建模语言)、XMI(XML元数据交换)、MOF(元对象设施)、ebXML(使用XML的电子商务)、UBL(通用商业语言)、BPMI(商业流程建模语言)、BPEL4WS(用于Web服务的商业流程实施语言)、SHOE(简单HTML本体扩展语言)、RDF(资源描述框架)、Topic Maps(主题图)、XTM(XML主题图)、TMCL(主题图约束语言)、DAML(DARPA代理标记语言)、OIL(本体交换语言)、DAML+OIL、OWL(万维网本体语言)等等。它们就像知识建模语言“树”不断长出的新枝[1]。其中XTM、RDF(S)、DAML+OIL和OWL属于基于XML的知识(本体)表示语言,被越来越多的人重视和利用。加强对这种四种语言的比较研究,有利于我们更加深入地了解和进行网络知识的组织与管理。

1 XTM、RDF(S)、DAML+OIL、OWL简介

1.1 XTM简介

XTM(XML Topic Maps),即XML主题图。所谓主题图,指一定主题领域的概念体系,可以是正规叙词表或分类表,也可以是一定资源集合主题内容的结构化表现(例如百科全书主题索引或网站)[2]。主题图是主题、联系和范围的集合,它可以两种方式存在:一是序列化的交互格式,如用XTM或其他语法表示的主题图文件;二是内部应用格式,如XTM处理要求。主题图中的主要概念是主题(topics)、联系(associations)、和事件(occurrences)。主题是计算机内一种代表或具体化现实对象(subject)的资源;事件是与主题相关的指定信息,不同的事件可以不同的方式与它们的主题相连;联系是一个或多个主题间的关系,包括类属关系、实例关系、逻辑关系及其他语义关系,每个主题扮演了这种联系中的成员角色。XTM基于ISO13250标准,其语法元素有19种类型[3、4]。

1.2 RDF(S)简介

RDF(Resource Description Framework)是一种描述网上信息的框架,是W3C在1999年2月22日所颁布的一个建议,主要是为元数据在Web上的各种应用提供一个基础结构,使应用程序之间能够在Web上交换元数据,以促进网络资源的自动化处理。RDF框架由三个部分组成:RDF数据模型、RDFS和RDF句法[5]。数据模型形成对资源的形式描述,由资源、属性、声明三元组构成。用RDF表达式描述的所有事物都可称为资源。属性是用来描述资源的一个特殊方面、特征、品质或关系。每种属性有特殊含义,定义了它的允许值、描述的资源类型和与其他属性的关系。资源、指定的属性与属性值三者构成一种声明[6]。RDF句法把形式描述通过其宿主语言XML转换成机器可以理解和处理的文件。RDFS是一种RDF词汇描述语言,它使用一种机器可以理解的体系来定义描述资源的词汇。RDFS的作用是:(1)定义资源的属性类、语法、属性值的类型;(2)定义资源类以及属性所应用到的资源类;(3)申明由一些机构定义的元数据标准的属性类。

1.3 DAML+OIL简介

DAML+OIL由早期的DAML本体语言——DAML-ONT与一种描述逻辑——本体推理层OIL合并而成[7]。DAML+OIL第一版发表于2000年12月,当前版本发表于2001年3月,它用XML Schema任意数据类型扩展了第一版的DAML+OIL[8]。

DAML+OIL本体由标题、类元素、属性元素和实例组成。标题中往往包括版本信息(daml:version-Info)与输入元素(daml:imports)。DAML+OIL把总体分为两部分:由属于XML Schema数据类型的值组成数据类型域,由被看作是DAML+OIL类的成员对象组成对象域。DAML+OIL主要关心的是那些描述(或定义)部分对象域的类的创建,这些类被称为对象类,包含类元素。类元素由对象类的定义(即类名称)和rdfs:subClassOf、daml:disjointWith、daml:disjointUnionOf、daml:sameClassAs、daml:equivalentTo、类表达式的布尔组合、daml:oneof组成[9]。DAML+OIL把属性分为对象属性(某类与另一类相连)与数据类型属性(某类与基本数据类型相连)。

1.4 OWL简介

OWL(Web Ontology Language)是一种定义和用具体例证说明万维网本体的语言[10]。OWL作为一种扩展的RDF词汇而发展起来,它来源于DAML+OIL[11],是DAML+OIL的一种修订[12]。设计OWL是为了提供一种语言来理解信息内容而非仅仅是内容的人工阅读显示。OWL语言也可清晰地描述术语词汇与这些词汇实体间的关系。OWL比XML、RDF和RDFS更能提高Web内容的机器可读性。OWL有三种表现力日益丰富的子语言:OWL Lite、OWL DL和OWL Full[13]。设计OWL Lite是为了易于执行和帮助用户开始使用OWL;设计OWL DL(这里DL代表描述逻辑)是为了支持现有的描述逻辑事务段和提供一种用于推理系统的令人满意的语言子集。完整的OWL语言(简称为OWL Full)减少了OWL DL中的一些约束以适用于许多数据库和知识表示系统,但这干扰了描述逻辑推理器约束。OWL Full与OWL DL支持同一套OWL语言构造。它们的区别在于一些特征的使用约束上。OWL Full允许OWL与RDFS的自由结合,并像RDFS一样没有执行类、属性、个体和数据值的严格分离。

OWL文档由本体标题、类公理、属性公理及个体事实组成[14]。像任何RDF文档一样,OWL编码可以是rdf:RDF元素的子元素,它们拥有XML命名空间和基本声明,而且一个OWL本体文档经常以几个实体声明开始。OWL本体是用RDF图表来编写的,这些图表是三元组的RDF数据。依靠RDF图表,OWL本体图表可以用不同语法格式来书写。OWL本体可以包括任意的RDF内容,这些内容可以用与RDF一致的处理方式来处理。OWL给RDF增添了一些附加含义,OWL语义与抽象句法文档详细说明了RDF数据哪部分被指定了特殊含义及含义的内容[15]。

2 四种网络知识表示语言的比较研究

2.1 XTM与RDF(S)的比较

XTM与RDF(S)对应关系如表1示,两者可通过事物(things)、关系(relationships)、属性(attributes)、事物种类(kinds of things)、关联(context)五方面来做简要比较[16]。

表1 主题图与RDF(S)的对应关系

主题图词汇 关系 RDF(S)词汇

主题图(Topic map) 对应于 RDF图表(RDF graph)

主题(Topic)对应于 资源(Resource)

对象(Subject) 对应于 资源(Resource)

资源(Resource) 对应于 网络可检索资源

(Network-retrievable resource)

不能设定地址的对象

对应于

非网络可检索资源

(Non-addressable subject) (Non-network-retrievable resource)

联系(Association) 是一种 声明(Statement)

事件(Occurrence)

是一种 声明(Statement)

命名安排 是一种 声明(Statement)

(Name assignment)

主题类(Class of topics)对应于 类(Class)

2.1.1 事物

事物在主题图中是用主题(topic)来描述的,而在RDF(S)中被称为资源(resource)。实质上,它们是相同的,即用数字符号表示一些明确的事物。在RDF(S)中,每种资源被表示为一个单独的统一资源标识符(URI),由URI来确切说明这种资源是什么。当RDF模型定义文件和文档时,URI就会在那个文件或文档中。但是,许多RDF模型讨论的是抽象事物,在这种情况下,URI只是资源的标识符。

在主题图中,主题所表示的现实世界中的事物被称为它们的对象(subject)。主题可用几种方式标识它们的对象,如用URI指定主题的对象资源。这完全形同于描述一个文件或文档的RDF资源。主题也可有对象指示符来注明主题词的范围定义。对象指示符可指向主题所属的特定概念类别的定义,也可指向主题所属的一个公共概念集中的概念类别定义。不管是应用RDF(S)还是主题图,一般都要把相同的URI分配到事物中去。

2.1.2 关系

在RDF(S)中,应用URI作为属性值可方便声明表示事件间的关系。在主题图中,事物间的关系通过使用联系(associations)来表示。像RDF声明一样,联系是分类的,这些类型是主题本身。许多主题可在一个联系中起作用,并根据它们的角色类型来定义。

在RDF(S)与主题图如何表示关系方面,有三种主要区别。第一是表示结构的区别。RDF(S)把一事物与另一事物相连,而主题图可联系到许多事物,并能清楚地说明关系中存在什么样的包含。第二,主题图中的关系是两向的(two-way)或者说多维的,但不存在反向关系与可传递关系。相反,RDF(S)具有逆向性,但在关系表示方式上并不是固有的。第三,更细微的区别是无法知道何时RDF声明判定两种抽象事物的关系和何时某一事物真正地是包含其他抽象事物信息的资源。

2.1.3 属性

RDF(S)与主题图属性的关系主要体现为:第一,命名可在RDF(S)和主题图中表示出来,但是只有主题图才能对于那些不了解模式(schema)的软件懂得哪种属性才是命名。结果是在任何界面下,主题图可通过它们的命名和RDF(S)来表示,这对于一般应用是很有帮助的。第二,简单属性在主题图与RDF(S)中是非常相似的。第三,RDF(S)中与事物相关的资源和关系是难区分的,两者都是用声明来表示。但是在主题图中,关系能够说明资源包含更多的事物信息,也可从事物类型说明中发现信息。因此,主题图比RDF(S)包含更多的显性语义。

2.1.4 事物的种类

在RDF(S)中,存在标准化属性rdf:type来表示类与实例间的关系。在主题图中,每个主题包括一组作为实例的类,可直接表示事物种类信息。主题图还可利用类——实例关系的标准化联系来表示事物的种类。事实上,主题图与RDF(S)有许多共同点,rdf:type与主题图的类——实例一样实用。

2.1.5 关联

在主题图中,关联即范围(scope)。范围由许多定义关联有效性并能附加到名称、事物与联系中去的主题组成。例如,如果某人想建立一个多语言信息系统来利用多种语言信息,将怎么办呢?RDF(S)的处理方式是为每种语言的名称和概念定义不同的属性,但这是笨拙的;而主题图的处理方式是把语言作为范围的一轴,名称是范围的最好结构成分,定义也可作为事物类型。主题图与RDF(S)在关联方面的主要区别是关联在主题图中更易操作,而且普通软件能了解每种应用中关联是如何表示的。

2.2 DAML+OIL与RDF(S)的比较

尽管DAML+OIL是用RDF书写的,是一种特殊的RDF置标[17],但是DAML+OIL与RDF(S)还是有许多差别。

2.2.1 DAML+OIL扩展了RDF(S)语义[18]

·把12类添加到子类细分中,把26种属性添加到子属性分类中;

·为每个新的类和属性指定了域与范围约束;

·定义了包含所有对象的类(Thing)、空类(Nothing)、具有传递属性的类、最多具有一个属性值的类(UniqueProperty)、一个属性值最多适用于一个对象的类(UnabiguousProperty)、不相交类的属性(disjointWith)、逆向于其他属性的属性(inverseOf)、类补充的属性(complementOf);

·定义了与对象、类和属性等价的属性(equivalentTo);

·定义了说明类是联合的(unionOf)、交叉的(intersectionOf)和不相交联合的(disjointUnionOf)属性;

·定义了各种各样的基数与属性值约束,包括:daml:cardinality、daml:maxCardinality、daml:minCardinality、daml:cardinalityQ、daml:maxCardinalityQ、daml:minCardinalityQ。

2.2.2 DAML+OIL对RDF(S)的继承[19]

DAML+OIL是建立在RDF三元组结构之上的。模型理论语义(model-theoretic semantics)严密地说明了哪个三元组被赋予了某种特殊的含义及这种含义是什么。DAML+OIL只是为能够说明“daml+oil.daml”定义模式的RDF图表部分提供语义解释[20]。

DAML+OIL中一些指定的三元组来自于RDFS,DAML+OIL为这些三元组赋予了语义,并利用RDF(S)类、类层次组织和属性的结构化:rdf:type、rdfs:class、rdf:value、rdfs:subClassOf、rdfs:subPropertyOf、rdfs:domain和rdfs:range。

2.2.3 DAML+OIL对RDF(S)的扬弃

DAML+OIL没有给下列RDF(S)元素赋予语义:

·声明的具体化。这是因为第一,对基础的本体结构语言不必需要这种语言结构成分;第二,不好理解RDFS结构语义。

·容器。RDF容器的一个重要属性是它们不是封闭的,外部资源可以常常产生另外的容器内容声明,从而增加一些元素。但是在DAML+OIL中,能说明容器确切包含指示参数是至关重要的。于是,容器的关闭条件是不可能(只少非常难)利用RDF容器来表示。

·RDFS元类组织(RDFS-meta-class organization)。这里元类意味着某类还有其他类作为其成员。RDFS允许元类,但在DAML+OIL中,这些元类没有赋予任何语义,因为DAML+OIL只允许把实例作为类的成员,类可以成为其他类的子类,但不是成员。也就是说,DAML+OIL不包含元类。

2.3 OWL与DAML+OIL的比较

OWL是在DAML+OIL基础上发展起来的,OWL与DAML+OIL的区别体现在如下方面[21]:

·语义发生了显著变化,DAML+OIL语义只近似于OWL DL语义。

·命名空间变为http://www.w3.org/2002/07/owl。

·RDF核心工作组将RDF和RDFS的更新材料合成一体了,包括:(1)允许循环的子集;(2)多种rdfs:domain和rdfs:range属性可以作为合取(conjunctive)处理;(3)rdf:parseType=“Collection”代替了rdf:parseType=“daml:collection”;(4)RDF语义;(5)数据类型:RDF和OWL使用了XML Schema命名空间http://www.w3.org/2001/XMLSchema而非http://www.w3.org/2000/10/XMLSchema,OWL不支持把数据类型作为某类。

·去除了有限制的约束,导致减少了如下属性:daml:cardinalityQ、daml:hasClassQ、daml:maxCardinalityQ、daml:minCardinalityQ。

·改名了多种属性和类,如表2。

表2

┌───────────────┬───────────────┐

│ DAML+OIL │ OWL │

├───────────────┼───────────────┤

│daml:differentIndividualFrom │owl:differentFrom│

├───────────────┼───────────────┤

│daml:equivalentTo│owl:sameAs

├───────────────┼───────────────┤

│daml:sameClassAs │owl:equivalentClass │

├───────────────┼───────────────┤

│daml:samePropertyAs │owl:equivalentProperty

├───────────────┼───────────────┤

│daml:hasClass│owI:someValuesFrom

├───────────────┼───────────────┤

│daml:sameClassAs │owl:equivalentClass │

├───────────────┼───────────────┤

│daml:samePropertyAs │owl:equivalentProperty

├───────────────┼───────────────┤

│daml:toClass │owl:allValuesFrom│

├───────────────┼───────────────┤

│daml:UnambiguousProperty │owl:InverseFunctionalProperty│

├───────────────┼───────────────┤

│daml:UniqueProperty │owl:FunctionalProperty

└───────────────┴───────────────┘

·增加了owl:SymmtricProperty。

·OWL Full中owl:DatatypeProperty可以是一种owl:InverseFunctionalProperty。

·去除了RDF和RDFS类与属性中的许多同义词,包括daml:comment、daml:domain、daml:label、daml:isDefinedBy、daml:Literal、daml:Property、daml:range、daml:seeAlso、daml:subClassOf、daml:subPropertyOf、daml:type、daml:value。

·去除了daml:disjointUnionOf,因为它影响owl:unionOf、rdfs:subClassOf和owl:disjointWith的使用。

·daml:equivalentTo改名为owl:sameAs,不再是owl:equivalentClass、owl:equivalentProperty和owl:sameIndividualAs的上层属性。

·增加了如下属性与类来支持版本信息:owl:backwardCompatibleWith、owl:DeprecatedClass、owl:DeprecatedProperty、owl:incompatibleWith、owl:priorVersion。

·增加owl:AllDifferent和owl:distinctMembers以说明唯一命名假设(Unique Names Assumption)。

总之,OWL与DAML+OIL的实质区别体现为:OWL通过选择Web本体取消了有条件的数量限制并直接说明属性是对称的;减少了一些不规则的DAML+OIL结构抽象语法,特别是对外层组件的约束和它们意义的差别;各种结构名称也有改变[22]。

2.4 RDFS、DAML+OIL与OWL的联合比较

RDFS、DAML+OIL与OWL的联合比较见表3[23、24、25]。

表3 RDFS、DAML+OIL与OWL的联合比较

比较方面 详情 RDF Schema DAML+OILOWL

管理者W3C DARPA

W3C

开发时间 >3 >2 >1

商业支持

卖主数目

>10≤10≤2

开放源支持是 是

关联 是 是 是

daml:Class owl:Class

对象类与属性

rdfs:Class、rdfs:Property daml:ObjectPropertyowl:ObjectProperty

类daml:DatatypeProperty owl:DatatypeProperty

继承性 rdfs:subClassOf、 rdfs:subClassOfrdfs:subClassOf

rdfs:subPropertyOf rdfs:subPropertyOf rdfs:subPropertyOf

属性/元素范围 rdfs:range rdfs:range

daml:Restriction

rdfs:range

daml:onPropertyowl:Restriction

daml:toClass

owl:onProperty

属性/元素领域

rdfs:domain

rdfs:domainrdfs:domain

属性/元素 属性/元素基数

否 daml:minCardinalityowl:minCardinality

约束 daml:maxCardinalityowl:maxCardinality

daml:cardinality

owl:cardinality

daml:UniquePropertyowl:FunctionalProperty

owl:InverseFunctionalProperty

版本信息rdfs:labeldaml:versionInfo

owl:versionInfo

数据类型

基本数据类型利用XML Schema数据类型 利用XML Schema数据类型 利用XML Schema数据类型

与实例 属性/元素值详表 否 daml:oneOf可指向XMLowl:oneOf可指向XML

Schema列举数据类型 Schema列举数据类型

实例rdf:IDrdf:ID rdf:ID

续表3

比较方面 详情 RDF SchemaDAML+OIL OWL

数据集有限列表 rdf:parseType=“Collection” rdf:parseType=“daml:collection” rdf:parseType=“Collection”

有序数据集

rdf:List daml:List rdf:List

非、析取、非

否daml:complementOf owl:complementOf

与合取析取类

否daml:disjointUnionOf

owl:unionOf

daml:unionOf

owl:disjointWith

合取类

否daml:intersectionOfowl:intersectionOf

owl:sameAs

定义 类成员关系所必需 否daml:sameClassAs

owl:differentFrom

和足够的条件

daml:UnambigousPropertyowl:AllDifferent

owl:equivalentClass、

反向的

否daml:inverseOf owl:inverseOf

传递的

否daml:TransitivePropertyowl:TransitiveProPerty

2.5 四者的应用比较分析

主题图可标引信息资源并建立相应索引、交叉参照、引文体系等,可链接复杂主题范围的分布资源来建立虚拟知识体系,可通过主题概念与资源的不同链接在同一资源集合上定制面向不同用户的界面[26]。因此,主题图可解决信息的发现性(findability)问题,即在大量信息中如何找到你要寻找的信息。主题图不仅被认为是一种语义网络的开放技术,而且还可应用于知识管理、Web门户开发、内容管理和企业应用集成(EAI)[27]。

RDF主要应用于语义网络,也可作为一种内容管理技术、知识管理技术、门户技术和电子商务的一种支撑技术。它体现为资源发现中提供更好的检索引擎能力;在编目中描述某个专门网址、主页或数字图书馆的内容与内容关系;通过智能软件代理促进知识共享与交互;可用于内容分级;可用于描述代表单个逻辑“文献”的页面集合;可用于描述Web页面的知识产权属性;可用于表示用户偏好与网址的保密性政策。用数字签名的RDF是为电子商务、合作与其他应用建立可信任的Web的关键[28]。

DAML+OIL主要应用于语义网络,也可解决资源的发现性问题,还能应用于电子商务与知识管理领域。OWL能支持网络门户、多媒体馆藏、企业网站管理、工程文件设计、信息代理和服务、随遇计算(Ubiquitous computing)[29]。也就是说,OWL能应用于语义网络、内容管理、Web门户开发、电子商务、知识管理与企业应用集成等许多领域。四者的应用比较见表4。

表4 四种语言的应用比较

┌──────┬───┬────┬─────┬──┐

│领 域 │ XTM │RDF(S)│DAML+OIL │OWL │

├──────┼───┼────┼─────┼──┤

│可发现性│是│是 │是│是 │

├──────┼───┼────┼─────┼──┤

│门户│是│是 │是│是 │

├──────┼───┼────┼─────┼──┤

│内容管理│是│是 │是│是 │

├──────┼───┼────┼─────┼──┤

│企业应用集成│是││ │是 │

├──────┼───┼────┼─────┼──┤

│电子商务│是│是 │是│是 │

├──────┼───┼────┼─────┼──┤

│知识管理│是│是 │是│是 │

├──────┼───┼────┼─────┼──┤

│语义网络│是│是 │是│是 │

└──────┴───┴────┴─────┴──┘

标签:;  ;  ;  ;  

四种网络知识表示语言的比较研究_语义分析论文
下载Doc文档

猜你喜欢