Wiki知识元语义图的研究_mediawiki论文

Wiki知识元语义图研究,本文主要内容关键词为:语义论文,知识论文,Wiki论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

知识协同交流成为一个重要的研究方向,受到国内外广泛的关注[1]。近年来,人们提出知识检索系统不是通过标引来组织数据和文献。而是通过知识元的连接组织知识的新思想[2]。Wiki系统开创了一种新的内容管理和知识管理的流行工具[3]。Wiki作为一种新的协同系统技术,在不少领域广泛应用。如利用Wiki开展学生在线学习、协作、师生互动、学习调查[4,5];在软件开发方面利用Wiki系统作为交流平台,建立相互感兴趣的技术性话题[6];Wiki在企业知识管理、地图信息发布、医学等领域也逐渐受到重视和应用[7,8];利用Wiki平台建立的Wiki百科全书风靡全球,成为知识共享的典范。为了语义检索的需要,Wiki扩展了本体语义网技术,使得语义Wiki具有专题语义检索和管理的功能。本文探讨如何基于Wiki协同交流平台,通过编辑器标注知识元,用软件技术将知识元转换成可视化的知识元语义图,构建本体语义知识元库,实现知识元组织与管理的知识交流与知识创新的目标。文章第2节为Wiki平台的知识组织与管理模式,第3节为构建知识元本体模型,第4节为知识元库生成系统,第5节为Wiki网站上的知识元语义图实现,第6节为小结与展望。

2 Wiki平台的知识组织与管理模式

2.1 Wiki知识交流工具

1995年,沃德·坎宁安(Ward Cunningham)为了方便社群的内部交流,建立了一个波特兰模式的知识库(Portland Pattern Repository),由此提出了Wiki的概念。Wiki系统把协同知识创造作为自己的中心目标[1]。与其他知识管理工具不同,Wiki鼓励知识创造的一个非常重要的管理理念是:Wiki给用户提供几乎是完全自由的内容开发过程,没有硬性的工作流、存取或预定义结构的约束,允许用户自己定义知识结构。目前Wiki广泛运用于百科全书系统、软件开发、项目知识管理、个人知识管理等领域。

2.2 Wiki系统的知识组织结构

Wiki是一种基于Web2.0技术的应用系统,已经出现了很多种支持该系统的引擎软件。按照引擎软件运行环境可分为3类:运行于PHP+MySQL环境的MediaWiki,CooCooWakka等;运行于JSP环境的JSPWiki等;运行于ASP环境的JesWiki,OperatorWiki等[9,10]。MediaWiki是目前世界上最大的开源Wiki软件系统,功能比较完善,支持中文系统,持续更新。Wiki协同知识交流平台的知识组织与管理原理可归纳为两个独特的特点:

1)Wiki是一种开放性的网络协作式写作系统。它以节点(node)和链接(link)作为概念系统。所有的内容都被看做节点,节点本身可以包含节点,节点与节点之间通过链接进行串联,通过节点的相关名词实现快速查找。这是知识管理中非常重要的一环。

2)Wiki和BBS、BLOG一样,都是将更多权力交给广大网民的社区工具。BBS以话题为主线组织版面,表现方式是注册用户在相应的版面中发帖、跟帖。BLOG是简易的发布系统,以个人为主线组织版面,表现方式是个人主页。Wiki以知识点为主线组织版面,表现方式是成千上万个志愿者在修改成千上万个文档。

2.3 Wiki系统的知识管理技术

具有强大页面链接的传统Wiki系统的知识是机器所不易理解的。为此,语义Wiki的概念被提出[2]。语义Wiki系统的目标在于将传统的Wiki系统与语义Web技术相结合,如用RDF、OWL和主题图或概念图对现有的Wiki系统进行扩展,领域专家与本体专家一起工作,发挥知识创造的协同性。这种组合为许多应用领域带来巨大的潜力。

语义Wiki除了具有传统Wiki的基本特点之外,还需要着重解决3个问题:如何对Wiki内容进行标注;如何对内容进行形式化描述;如何对内容进行导航?通常有下面一些语义扩展方法[3]。

1)链接标注(Annotating of Links)。这种标记方法是对不同系统进行编辑。有些语义Wiki把标签作为Wiki语法部分,像Semantic MediaWiki;其他对附加标签分开编辑,像IkeWiki。

2)上下文陈述(Context-Aware Presentation)。基于语义标签陈述的内容改变路径。

3)加强导航(Enhanced Navigation)。提供更多的导航信息,增加相关链接描述的附加信息。

4)语义查询(Semantic Search)。大多数语义Wiki提供基于后台知识库的语义查询。

5)推理支持(Reasoning Support)。使用预先定义或用户定义的规则,在知识库中从进入系统的事实中推出附加的、隐含的知识。

3 构建知识元本体模型

3.1 知识元本体结构

文献[1]提出语义知识检索系统不是通过标引来组织数据和文献,而是通过知识元的连接来组织知识。因此建立知识元的本体结构是实现语义知识检索的关键。本体是一种明确的概念化的规范说明。近年来,本体在知识处理系统中的应用已成为人们研究的热点[9]。

知识元本体结构可描述为如下四元组:

k=(c,p,m,r)(1)

其中,k表示知识元本体元素,c表示某个领域概念,p,m分别是概念c上的一组属性和方法,r则是建立在c上的与其他概念的一组关系。

为进一步明确知识元本体元素的含义和内部结构关系,将式(1)分解为式(2)和式(3):

(c,p,m)(2)

(c,r)

(3)

式(2)是对领域概念c自身的描述,体现为对属性集p和方法集m的定义和描述。式(3)则是概念c与领域中其他概念之间的一组特定的领域关系,的描述,例如并列、隶属(度)、关联(度)、蕴涵、双向蕴涵、继承关系等。

其中X为图的点集,E为边集,X的值域为概念集C,E的值域为关系集R。不难看出,知识元本体通过概念之间的关系集R构成了相对完善的知识元内容体系和网络化结构。

3.2 知识元本体映射

知识元本体构建定义了知识元的组织骨架模型。为了对Wiki知识元库中分类存储的知识元实行集成组织和统一管理,还需要利用知识元本体映射技术将模型知识元与不同的独立本体元素进行映射,建立知识元与本体元素间的联系,实现基于知识元本体库的知识集成组织。

对知识元本体映射定义如下:

定义1:知识元本体映射

设S为某领域知识元的数据源,如果知识元本体元素k=(c,p,m,r)使得有序对(k,S)在该领域内有意义,则称该有序对构成知识元S到k的知识元本体映射ζ,记做ζ(k,S)。

从知识元本体映射的定义可以看出,有序对(k,S)即本体类的实例的创建是否合理,需要领域专家根据自身所拥有的领域知识、经验、智慧等做出综合评判。因此,为了正确实施知识元本体映射,领域专家可借助知识元本体映射向导,以交互操作的方式创建出有序对(k,S),即本体类的实例。

3.3 知识元关联发现

进一步分析基于本体的知识组织模型,可得到一个重要特性:知识关联发现。

定义2:本体蕴涵

4 知识元库生成系统

4.1 知识元库生成系统框架

知识元库生成框架是Wiki知识元语义图创建的核心。它由6个主要功能模块组成:①常用领域知识元本体;②人机交互的本体编辑器界面;③知识元语义标注;④领域本体知识元抽取;⑤知识元语义图生成;⑥知识元关联推理与新知识发现。如图1所示。

(1)常用领域知识元本体。在传统的Wiki平台基础上创建领域专家本体模型,让专家选择自己关注的模板进行知识元标注。

(2)人机交互的本体编辑器界面。采用本体技术提供RDF/OWL语法辅助编辑工具,显示语义标注的上下文信息来扩展和激发交流者的知识元生成环境。

(3)知识元语义标注。专家可通过简单的语义标注工具对文本加注标记,标记出知识元。

(4)领域本体知识元抽取。基于本体模板,从领域专家提交的文本知识元标记中软件抽取知识元,建立临时知识元库。

(5)知识元语义图。采用Protégé或Semantikos技术,对临时知识元库中的知识元实现语义图。

(6)知识元关联推理。将静态的语义本体与人工智能中的对象技术结合,实现知识元的动态推理。

4.2 知识元对象的抽取算法

知识元对象的抽取算法是从文本单元中分离出知识元对象结构(C,P,M)和关系结构(C,R)的过程。算法简述如下:

while

S是文本的句子集合,

C是KUO中的概念集合,

P是内部属性集合,

M是KUO中的方法集合,

R是关系集合,

G是映射集合,

X是KUO的节点集合,

E是KUO的关系集合,

KUOM是知识元对象映射。

4.3 知识元语义图模型

本体用于描述各种资源之间的联系。它揭示了资源本身以及资源之间更为复杂和丰富的语义信息,从而将信息结构和内容相分离,对信息作完全形式化的描述,使内容信息具有计算机可理解的语义。利用本体技术,将领域知识元结构本体化,建立知识元动态本体知识元库。领域知识元库由三个部分组成,知识元语义图,元数据信息库,关系特征库。

知识元语义图是领域知识元库模型实现的关键,模型如图2所示。知识元语义图分为内部结构和外部结构。内部结构组成知识元的实体,外部结构组成知识元之间的关联关系。

图2 知识元本体语义图模型

元数据信息库:表达知识元本体数据类型。知识元本体数据类型由元数据信息库存储。

关系特征库:关系特征库存放知识元本体的各种关系,这不仅是实现知识元交流的基础,也是实现知识元推理及知识发现的基础。

5 Wiki网站上的知识元语义图实现

5.1 知识元语义图的Wiki平台创建目标

著名管理学家彼得·德鲁克认为,知识创新是指“赋予知识资源以新的创造能力的行为”[10]。日本学者野中郁次郎和竹内提出了知识创造的SECI模型[11]。然而如何借助IT技术加速知识交流与知识创新的速度却一直是难以解决的重要问题。

调查表明,现有的Wiki应用系统采用的数据处理技术是基于PHP软件语言与MySQL数据库语言结合的数据库管理方式,它具有开放性,支持面向社群的协作式写作等功能。但这种数据库管理技术难以实现专家经验知识的形式化,难以提供用语义图和语义推理的方式进行知识发现。因此,在一般Wiki平台的基础上,我们重点探索创建可视化的知识元语义图Wiki平台,利用Wiki平台的开放性来实现知识元语义图导航的语义知识交流与创新活动。

5.2 Wiki网站创建的基本步骤

PHP是一种开发动态网页程序语言,可以用来设计留言板、讨论区或聊天室等动态网页,由于它具有免费、跨平台、易学及效率高等优点,所以它是目前很流行的一种设计网页的程序语言。

然而开源软件(Open Source Software,OSS)授权用户可以任意使用软件,自由浏览与修改软件源代码,随意复制、散布原始或经修改的软件。它的特性主要有:①取得与重复使用成本低;②稳定性佳,程序错误修补快速;③采用非传统的软件授权但尊重知识产权。与商业软件比较,开源软件具有可靠、高性能、安全、可伸缩性佳、可快速升级、低成本的特点,因此成为众多网站开发爱好者的必备所选。

本文所使用大部分软件都是开源软件,包括服务器平台搭建软件,以及建设Wiki网站的软件都是开源的,这为我们在建设Wiki网站的过程中带来了极大的方便。创建Wiki网站有一下几个步骤:

步骤1:平台搭建

AppServ是PHP网站建站工具包,由泰国作者(http://www.appservnetwork.com/)将一些网络上的免费的资源重新包装成单一的安装程序。目前AppServ官方网站上最新版安装包是appserv-win32-2.5.9,工具包中包括Apache,MySQL,PHP,phpMyAdmin四个软件。安装完成这个软件包,就搭建好了一个自己的Wiki平台。

步骤2:在本机上建造一个Wiki网站

把meidaWiki软件包拷贝到根目录www下对其进行安装,在浏览器输入:http://localhost/mediaWiki/index.php,按照提示进行安装,直到出现已经建好一个自己的Wiki网站。

步骤3:创建一个普通的Wiki页面

在MediaWiki中,创建一个新的页面有以下3种方法:

(1)从现有链接创建新页面:当在阅读Wiki条目时,会发现一些链接指引到还没有内容的条目,这些链接一般用红色显示。这时只要点击该链接便可以对其进行编辑,进而创建了新的页面。

(2)创建一个红色链接:在自己的个人用户页中,在要创建的标题前后各以两个中括号括起(例[[知识元]]),点选「保存本页」后,若显示为红色,即可点击进入开始内容创建。

(3)从搜索创建新页面:直接利用搜索框进行搜索,如果没有搜索到输入的关键词,可以创建一个以搜索关键词为标题的页面。

尽管MediaWiki可以支持HTML语言,在进行页面的编辑时应该尽量使用Wiki语言来编写内容[12,13]。

步骤4:语义功能的实现

要想实现语义功能,必须对MediaWiki进行语义扩充,Semantic MediaWiki是MediaWiki的扩充,扩充了原本的Wiki语法可用来描述Ontology。当我们导入了Semantic MediaWiki之后,我们可以用如下的Wiki语法来把这种关系表示出来:

定义:用[[联系::目标文章]]来表示当前页面与目标文章的关系

用[[属性:=属性值]]来表示当前页面的其中一个属性及它的属性值

我们所使用软件为:appserv-win32-2.5.9,semediaWiki-1.1.1,mediaWiki-1.12.0,Notepad2,namowebeditor。网站运行平台为:windows xp+Apache+MySQL+PHP+PhpMyAdmin。

5.3 知识元语义Wiki平台功能

采用以上方法搭建的语义Wiki系统具有三大模块功能:人机界面交互功能、页面RDF信息提取功能、基于语义Web技术的Wiki引擎功能。

(1)人机界面交互功能:提供用户和Wiki界面交互的接口。当用户登录进入系统后,除了可以对当前Wiki页面中的条目进行编辑、修改功能之外,还可对当前页面中所感兴趣的条目进行语义标注功能。

(2)页面RDF信息提取功能:运用RDF三元组来规范化描述表示页面的元数据信息,从而定义每个页面的主体、客体以及谓词关系。

(3)Wiki引擎功能:为用户编辑和浏览Wiki页面提供Web界面、将用户标记的页面脚本文件转化为HTML文档以供Web浏览器浏览、以文件或数据库的方式管理Wiki页面的存储以及处理由语义标注和RDF提供的语义信息,呈现页面之间的关系数据,以此来保证Wiki内容的结构性及增强的导航功能。

我们利用以上技术创建立了一个“知识元本体结构”的语义Wiki页面。图3给出的是我们在语义Wiki编辑器上定义的“知识元本体结构”的语义标注页面。

对语义Wiki编辑器运行,加上语义标签后的“知识元本体结构”的运行结果就以红字突现出来,如图4所示的知识元本体结构;同时也给出了语义图,如图5所示的Fact about知识元本体结构。

5.4 知识元语义图实现

尽管我们在MediaWiki平台技术基础上扩展了Semantic MediaWiki软件插件,使得MediaWiki有了语义功能,但是它的语义功能还是比较低。由图5可以看出,“Facts about知识元本体结构”给出的语义图只是一种目录形式的结构图,且结构的排列按照字母的顺序排列。人们很难看出结构的语义关系。为了实现更加清晰的知识元语义图,我们在语义Wiki平台的基础上利用。Protégé 3.3工具构建了知识元语义图。图6是采用protégé 3.3工具构建了知识元语义图。

图6 知识元语义图

6 总结与展望

本文的贡献在于给出了知识元的本体模型,将知识元本体结构分解为描述内容的内部结构和描述关系的外部结构;给出了知识元库系统构建模型,知识元的抽取算法,知识元语义图模型。讨论了Wiki平台的搭建和语义Wiki页面的创建过程。探讨了在普通Wiki编辑器上实现知识元语义标注方法,借助于知识元抽取算法在所建立的语义Wiki平台上进行了知识元抽取试验,借助于protégé软件对现有语义Wiki的语义功能进行了提升,建立了基于Wiki平台的知识元语义图,实现了基于Wiki平台的知识元语义图的知识交流。目前国外已有一些语义图工具,但大都不支持汉字,我们下一个目标是研究已有语义工具与汉字的支持问题,同时开发RDF自动语义图转换问题。构建高效的基于知识元语义图的知识组织与检索系统。

收稿日期:2008年7月1日

标签:;  ;  ;  ;  ;  

Wiki知识元语义图的研究_mediawiki论文
下载Doc文档

猜你喜欢