本体论在知识图书馆中的应用初探,本文主要内容关键词为:本体论论文,馆中论文,知识论文,图书论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号 G250 文献标识码 A 文章编号 1007-7634(2003)01-0106-03
本体论原属哲学研究的范畴,近些年来,在知识工程、人工智能、信息系统等领域的研究中,则被用来表示有关领域的对象、概念、实体以及它们之间的关系。本文在对知识图书馆(Knowledge Library)概念作进一步阐述的同时,初步探讨了知识图书馆中片断知识(Knowledge Segment)的分类、组织和存放的本体论模型和相应的知识图书馆逻辑结构。
1 知识图书馆概述
(1)概念。所谓知识图书馆(Knowledge Library),就是适应知识经济社会的需要,利用现代先进的计算机、通信、管理等技术,组织与管理各种图书、文献、期刊、音像等资料中的知识,并能向用户提供面向用户问题域的片断知识或主题知识,以辅助用户决策与创新的图书馆。
知识图书馆管理和组织的对象不再是作为整体的图书期刊,而是图书期刊中的知识与信息。事实上,图书期刊本身可以看作知识信息的集合。知识图书馆根据图书期刊这一性质,对其中的知识信息进行划分与组织,得到若干的知识子集。在知识图书馆中,系统管理的最小单位是知识子集。用户通过与知识图书馆的交互,将解决问题所需要的知识描述提交给图书馆,图书馆经过相应的处理,最后返回给用户所需要的以知识子集为单位的片断知识或主题知识。
(2)特征。①组织、存放、查询的对象为知识子集; ②支持知识管理,兼容不同知识库系统的访问;③为用户提供方便的知识检索工具,提升知识创新的速度;④完善的著作版权保护,保证各方利益。另外,与知识工程不同的地方在于,知识图书馆并不负责检查知识本身的逻辑特性;不负责创造性地解决实际问题,它只负责知识的划分、组织、存储以及为用户提供方便、快捷的知识服务。
(3)知识图书馆片断知识的划分、分类、组织和存放概述。 ①片断知识的划分。知识是对客观世界中进入主体认识领域的客体及其属性的描述,或者对客观规律的记载和反映。片断知识是对知识进行划分后形成的子集,它只包含知识的一个或若干个侧面。不同的主体,由于认识问题的角度和需要的不同,对片断知识划分的大小有不同的理解。一种解决方法是,可以把片断知识划分到最小的程度,然后根据人们的需要按一定的顺序把小的片断知识组合起来,形成较大的片断知识,如此下去,直到用户满意为止。因此,知识图书馆中的知识必须具备可重装性的性质。②片断知识的组织、分类。片断知识一般都会包含一些特定的词汇,词汇与词汇之间又有着千丝万缕的联系;同时,由于知识图书馆中的知识千差万别,不同的片断知识所包含的词汇会有所侧重。知识图书馆就可以利用本体论的研究成果,对词汇之间的联系进行建模,在此基础上,实现片断知识的分类、组织和存放。③片断知识的存放。知识图书馆将采用扩展标记语言(XML )格式来描述和存放片断知识,因为XML具有可以用来组装自描述的数据,支持片断重组, 支持定制的显示方式等一系列优点。但是,由于XML技术本身并不太成熟, 它采用人们可以读懂的方式来描述数据,却不能保证机器的可读性。因此,本体论在知识图书馆中的应用,可以为不同人群和不同知识库系统使用知识图书馆提供了公共的理解问题的基础。
2 本体论概述
(1)本体论(Ontology)的起源。本体论(Ontology), 由希腊ontos(存在)与logos(学说、言论)派生出来,被解释为“关于存在的学说、言论”。 本体论一词最早出现于德意志哲学家郭兰克纽(Rudolphus Goclenius)所著的《哲学词汇》一书。西方哲学意义上的本体论,主要是从自然内部、从客体与客体之间的联系中去寻找万物的本体,力图摆脱人在自然、客体中的作用和影响,努力构建一个无人的本体世界,从本质上讲,属于唯心主义的范畴。马克思主义主张辩证法、认识论和逻辑学的统一,在坚持物质第一性的基础上,确立了实践本体论的观点。
(2)形式化本体(Formal Ontology)及本体化依附事项(Ontological Commitments)。形式化本体是概念的显式表示(Aexplicit specification of conceptualization),用来描述客体或客体域的概念及概念之间的关系。如果领域知识可以用陈述性的形式本体体系来表示,那么可以表示的对象的集合就被称作是语境世界(the universe of discourse)。对象之间、对象集之间以及对象与对象集之间的联系,可以用代表性词汇来描述。
本体化依附事项(Ontological Commitments )是知识基中使用的词汇和相关形式化本体使用词汇之间的一种映射关系。使用了本体化依附事项后,主体与主体之间可以在某一语境世界进行交流,而不要求主体们拥有共同的理论。当一个主体的可以观察的行动与一个形式化本体的定义一致时,就称它依附于(committo)一个形式化客体。人们可以通过观察主体的行为来判断一个主体是否具备某种知识。如果一个主体按照拥有该种知识的情况下行动并且通过理智的行动来达到目标,就一般认为该主体拥有该种知识。
(3)本体论在实践中的应用。近几年, 由于本体论具有一些方法和结构上的独特性,使其在人工智能、计算机语言学和数据库理论方面都得到了广泛的运用。从方法上来讲,其独特性在于高度互约束的方法,能够对特定领域的结构进行高度概括地分析,能够建立该领域明确严格的词汇表。从结构上来说,它在广义的信息系统中处于核心地位。
3 本体论在知识图书馆中的应用
(1)片断知识建模。人类的认识领域,可以分为若干的子领域, 任何一个领域的专门知识都可以作为人类整个知识世界里面的一个子集。当然,这些子集又可以进行更进一步的划分,从而形成层次结构。子集之间会出现一些相交的情况,对应着交叉学科领域,相同道理,整个认识世界可以归结到一个由许许多多互相联系和制约的形式化本体模型,各个子领域的形式化本体本身又包含着更小的相互联系和制约的形式化本体。人类认识世界的能力不断发展,认识的成果日益丰富。图书馆的功能之一,就是要将人类实践和认识的知识结果保存和积累下来。因此,知识图书馆所使用的形式化本体模型需要具备动态性和可扩展性。
Roger H,l.Chiang在《A smart web query method for semantic retrieval of web data》中提出了一个弹性的、动态的、可扩展的、包容的形式化本体模型。Ontology:
Ontology (Ontology Name)
Ontology Properties (Ontology Name,Property Name,Value)
Ontology Relationship (Ontology Name,Super Ontology Name)Term:
Terms (Ontology Name,Term,Definition,Source)Term:
Relationships:Relationships (Ontology Name,Relationship Code,Relationship Type)
Relationship Properties (Relationship Code,Relationship Property Name,Relationship Property Value)
Relationship Terms (Relation Code,Term)
Relationship Origin (Relation Code,Term)
图1 形式化本体动态模型
(2)知识分类、组织和存放。知识图书馆中知识的分类、 组织和存放,表现为对知识的载体——片断知识的分类、组织和存放。在得到了关于领域知识的形式化本体模型之后,对于某一具体的片断知识,可以考察不同形式化本体在其中的分布情况,通过使用人工智能的一些方法,可以量化、比较片断知识的相似性和差异性,这就为知识图书馆中知识的组织和存放提供了可靠的依据。
(3)知识智能检索。知识图书馆的智能检索, 可以通过建立多头代理(Multi-agent )架构来实现。通过对代理之间会话过程的详细研究和考察,可以建立一个检索会话通信过程的形式化本体模型,从而可以由用户建模代理(User Modeling Agent)建立用户模型, 模拟用户的行为,实现智能检索和个性化定制。
4 知识图书馆的逻辑结构
知识图书馆的逻辑结构如下图所示:
图2 知识图书馆逻辑结构图
知识图书馆管理系统(KLMS)负责对片断知识进行管理,例如,片断知识的组织、分类、存放、本体模型库的维护以及查询的优化处理、返回纪录集等。知识分解器(Knowledge Decomposer)负责对原始知识形式进行加工、分解,生成片断知识(Knowledge Segments)。查询管理器(Query Manager)负责对查询请求的语法检查、 分解核对查询的智能响应等工作。本体模型库(Ontological Model Library )负责存放形式化本体模型。
5 总论
知识图书馆的出现,将是图书馆发展史上的一个里程碑。它使得人们不再在书籍的海洋中迷失了方向,它帮助人们最快的获取所需要的知识,并为思路的展开创造了更多的机会;它还通过对用户检索的建模,支持智能和个性化的服务;同时为不同的知识库系统、专家系统的访问提供了公共的接口,为企业的智能决策提供知识信息资源;它还充分利用移动网络,为更多的用户提供方便、快速的服务等;它的出现,还会带来出版行业的根本性变革。对知识图书馆的进一步探讨和研究,其意义是显而易见的。