面向专家的知识地图研究,本文主要内容关键词为:地图论文,专家论文,知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
知识管理是近年来一个热点的研究领域,包括知识创造、获取、加工、存储、传播和应用等。专家作为组织中掌握大量知识的人力资源,一直是知识管理研究中的重要因素,而知识地图作为知识管理的一个主要技术线路,力图以直观的方式展示知识、知识源、知识创造者、知识使用者之间的关联以及知识的产生、发展和传播路径等,以帮助组织做出最优的决策[1]。近年来,许多研究人员针对专家和知识地图展开了深入的研究,取得了一定的成果,从而使专家知识地图成为知识管理中一个比较活跃的分支。本文从专家知识地图的基本概念与研究现状入手,探讨专家知识地图的基本特点与分类,总结专家知识地图的构建方法,列举并评述不同类型专家知识地图及其应用实例。
1 研究背景
1.1 专家知识地图的概念
知识地图最早是由英国情报学家B·C·布鲁克斯在其经典著作《情报学基础》中提出,指出情报学的真正目的是组织、加工和整理客观知识,并绘制以各个知识单元为节点的知识地图[2]。知识地图应该完成两个任务:一是通过知识资源调查、获取的知识资源目录,二是确定目录内各款目之间的关系。
许多重要的知识都是以隐性知识的形式被少数的领域专家所掌握,专家是在不同领域和行业中对某一事物精通或者具有独特见解的人,专家的主要职责是深入研究某一学科或者行业领域中的知识,为学科或行业的发展提供理论分析和实践指导,对热点、难点问题提供决策支持。针对基于专家的知识地图,陈强等[3]将其定义为:知识管理领域中的知识地图是用于定位知识的知识管理设施,能将散落的专家知识汇整起来,予以有效的管理与维护;刘彤等[4]从社会网络分析的角度将其定义为:以专家为节点的知识网络,在各节点上通过对专家所具有的知识及各种技能进行显性化的标引,以此来实现专家的定位功能。本文将面向专家的知识地图理解为:通过获取专家在其学科、领域内的专长知识,实现专家的定位和导航,挖掘有用的隐性知识,整合领域知识并以一种通用、直观的可视化方式将零散的专家知识予以呈现的一种方法。
1.2 专家知识地图的特点
由定义可以看出,专家知识地图应该具有目的性、针对性、直观性和概括性的特征。
(1)目的性。用来挖掘领域或学科中的专家知识,揭示专家知识体系,快速查找目标专家或专家知识,提供有效的知识导航。
(2)针对性。针对某一学科或领域数据集,从中识别出具有有效性、潜在有用性以及最终可理解模式的专家知识。
(3)直观性。面向专家的知识地图需要通过可视化的形式来直观呈现,表现形式可以是网状地图、树形地图、星状地图、点状地图、条列地图和等高线地图等。
(4)概括性。通过一系列的操作将零散的专家知识进行整合,以一种综合和概括的方式予以呈现。
1.3 专家知识地图的分类
为了进一步探究不同专家知识地图中存在的共性和差异性,可以从不同的角度对专家知识地图进行划分。按照研究对象的不同,专家知识地图可分为专家研究领域知识地图和专家社会网络知识地图[5]。专家研究领域知识地图是分析和展示领域或学科内专家团体或个人的知识地图;专家社会网络知识地图是将专家或专家知识作为知识地图中的组成要素——节点,构建专家网络知识地图,从而分析隐含的专家联系和专家知识联系[6]。
按照专家数据来源的不同,专家知识地图可分为基于期刊文献的专家知识地图、基于Web数据的专家知识地图和混合型专家知识地图[7]。
按照研究所采用的方法不同,专家知识地图可分为基于语义技术的专家知识地图、基于挖掘技术的专家知识地图和基于人工智能的专家知识地图等。
根据以上分类,本文从研究对象入手,深入探讨知识地图对专家研究领域的描述和对专家社会网络结构的描述。
2 专家知识地图的构建方法
2.1 专家知识地图的一般构建步骤
面向专家的知识地图的相关文献重点多放在知识地图的功能和表示上,对其构建过程介绍不多,总结起来专家知识地图一般由专家知识单元、专家知识管理和专家知识资源地址三部分组成。夏立新等认为构建专家知识地图一般需要经过专家知识获取、专家知识索引、专家知识关联和专家知识地图四步[8]。
(1)专家知识获取。由于大多数专家知识都是以隐性知识的形式存储的,使专家知识的获取有一定的难度。目前,专家的隐性知识获取方法和途径主要有三种:①个人填写。能最确切地将自己的隐性知识显性化。②文献、专利调查。可以通过检索该专家已发表的期刊、会议论文和所从事的项目研究来获取专家主要研究领域和专长。③网络调查法。主要通过检索专家在博客、维基等发表的言论来获取专家所表达出来的隐性知识。
(2)专家知识标引。专家知识标引是通过标引专家知识节点来规范专家知识描述的方法。专家知识节点的标引工作可以分为三个部分:专家专长信息(包括专家主要擅长的领域和课题)、专家基本信息(包括专家的个人信息,如姓名、工作单位和部门、职称、联系方式和住址等)和专家人际网络(包括专家之间、专家与组织之间的关系网络,如工作岗位等级关系等)。
(3)专家知识关联。专家知识关联主要包括专家知识本身的关联和专家之间的关联。其中,专家之间的关联方式可以概括为工作岗位关系中的等级关联(如上下级关系)、专长或技能关联和共同经历关联(如参加同一培训、上过同一大学、联合发表过同一论文等)[19]。
(4)专家知识地图。陈强等认为专家知识地图的构建不仅应遵守知识地图的算法流程与原则,还应包括四个关键技术:①构建专家基本数据库。搜集专家学历、职称、专长、电子邮件等信息。②构建专家专长数据库。抽取专家的研究课题、研究方向、发明专利等信息。③专家人际关系线索、个人及所属团体的关系等的自动收集,并构建专家社会网络。④提供专家基本资料、接触目标专家的关系路径等的图形呈现,建立专家知识地图[10]。
3.2 构建专家动态知识数据库
专家知识地图的构建是一个动态、循环的过程,其核心问题是如何获取有效信息构建专家基础信息库、专家专长信息库和专家社会网络信息库。具体的构建方法和顺序如图1所示。
具体而言,首先从专家知识信息源(包括网页和期刊等)搜集专家的各种信息,构建专家基础信息库。然后根据专家基础信息针对专家的专长和人际关系网络信息分别构建专家专长信息库和专家社会网络信息库。最后设置专家专长信息和专家社会网络的参数,利用可视化工具对专家知识进行可视化分析,实现专家知识地图的可视化。
数据源是构建专家知识地图的重要基础,专家的期刊文献信息和网络信息(专家的个人主页、博客/微博、论坛等)是两类主要的专家知识数据源,专家知识地图的构建多是从这两类信息展开。梁勇等认为通过期刊文献信息构建专家知识地图应该从三个方面入手:专家的基本信息、专家的研究领域信息、专家之间的关联信息。可以通过文献作者之间的合著关系和专家发表文献时相互引用的关联信息等来实现专家知识的关联。通过借鉴期刊关联系数还可以进一步计算专家之间的关联系数,从而构建专家知识地图。
针对专家的网络信息,不同的信息结构采用的分析方法不尽相同。Tse-Ming Tsai等致力于针对专家博客数据利用语义技术来挖掘领域专家榜[11]。领域专家榜就是一种在专家博客数据中使用语义技术和交互索引技术以发现专家专业知识水平的应用技术。通常使用的专家数据有专家博客中使用的关键词和专家之间交互作用的记录两类。图3描述的是使用专家数据和概念空间来实现领域专家榜的过程。
3 专家研究领域知识地图
3.1 组织内部的专家知识地图
基于组织内部的专家知识地图是针对某一机构组织搜集相关的专家信息、抽取专家知识、构建公司或者团体专家知识地图,从而评估整个团体或公司内的专家知识水平,发现科研优势和不足,这样的组织机构包括公司、团体、大学、研究所等。组织利用专家知识地图能够帮助改善内部人员的选择和配置,加强对员工的培训等。
Ajita John等使用标签、用户和标签活动,描述和设计某软件技术公司的专家领域知识地图[12],如图4所示。可以看出,该公司的技术专家主要的知识领域有三个,即JAVA、STOCKS和J2EE App server X(图中面积较大的圆)。另外,该公司对开发团队也十分重视(外圈中的深色圆点较多),对图4进一步研究和扩充还能够发现潜在的、用户没有进行标记的标签和领域。
3.2 专业领域的专家知识地图
基于专业领域的专家知识地图是从某专业领域的范围描述专家知识地图,目的是快速发现研究领域中的专家,评估专家的专业水准,并绘制该领域内的专家关联。用户能够知道:(1)在某个领域内哪些人能够达到专家水准,能回答他们提出的问题或者满足他们的要求;(2)这些专家与领域的其他专家相比是否具有更大的优势[13]。
Zan Huang等利用SOM和MDS算法对专家知识(数据源是科技文献)进行降维处理,分别构造了基于SOM和MDS的专家领域知识地图[14],分析和构建台湾商务管理领域知识地图,并利用SOM算法和MDS算法进行可视化展示。
Xiaodan Song等建立了一种以用户为中心的专家发现模型——ExpertiseNet[15]。ExpertiseNet结合动态语义检索技术实现了两个方面的专家挖掘:一方面列出与搜索领域直接相关的专家列表;另一方面检索出与给定知识领域间接关联的“知情人”列表,这些“知情人”是对相关知识领域中部分专家信息比较了解的人,他们与专家之间的关系比较密切,这样就可以通过“知情人”渠道找出对应的领域专家。
Delroy Cameron等利用本体技术来解决领域专家搜索问题。在选择和表示专家数据时引入了语义网,大大提高了专家数据表示的精度,然后利用主题分类法,根据所给定的主题分类信息来确定专家研究领域,将已经创建的100个主题分类知识导入系统中来辅助专家发现[16-17]。通过SwetoDblp本体研究技术,实现在不同主题的本体中将专家列表进行关联,Moya-Anegón等人也做了类似的研究工作[18]。
3.3 个人领域的专家知识地图
个人领域的专家知识地图是指通过搜集某位专家的个人数据来构建针对专家个人的知识地图。搜集与专家个人(可能是权威专家)相关领域信息,如科技文献、博客数据、负责的项目课题等,分析和评估其研究专长,并绘制相应的专家知识地图。利用这类专家知识地图还可以用来研究某专家目前的研究动态和评估某研究领域的发展方向(当研究的专家是研究领域的权威时)。
巩军等利用维基百科作为背景知识构建出专家个人的知识地图[19]。首先利用文本挖掘技术,提取科研成果中的关键词作为知识节点;然后在维基百科知识的基础上,计算知识节点间的相关性;最后根据提取的知识节点和计算得到的相关度就可以构建出专家的知识地图。图5是数据挖掘专家韩家炜的知识地图。
Boanerges Aleman-Meza等尝试从专家的出版物中分析与领域紧密相关的特征项,并确定特征项之间的作用关系,建立专家研究领域的分类体系图[20]。根据基于语义技术的分类体系图以及专家出版物的数量与给定领域中出版物的总和来实现对专家研究领域的度量。
4 专家社会网络知识地图
另一类专家知识地图主要描述专家的社会关系网络,将专家作为社会网络图中的节点要素构造专家知识地图。一方面,专家社会网络知识地图可以帮助组织或团体有效地分析和评估内部的科研合作状况,相关的管理部门可以针对专家社会网络知识地图中的专家情况,合理地调整科研团队的组合,加大对优秀科研团队的支持力度,稳固具有明显优势的团队合作[21]。另一方面,利用专家社会网络知识地图能帮助寻找组织或团体中具有加快网络知识流动、起到催化剂作用的关键资源。企业或团体通过调整内部结构能够发挥关键资源所起的中坚作用,加快内部隐性知识的流动。例如,成员A是某专家网络知识地图中的关键人物,表明他与其他成员的交流活动能有效促进网络内隐性知识的传播。因此,对于该成员应该采用职位或工作性质的调整,使其充分感受到自我价值的提升,继续为组织或团体服务。
Jun Zhang等在社会网络分析中引入基于网络的排序算法(包括PR值和HITS方法)和高度的专业知识来判断团体中的哪些用户具备专家级水准[22],这种基于论坛中“提问-答复”对的相关系数剖面图描述了答复者与提问者的比值,分析提问者与答复者之间的关系,其中长期答复提问的用户被视为论坛的专家。
专家知识地图不仅要考虑专家的个人兴趣,还应该考虑在一定范围内专家之间的合作关系。Daniel Schall等提出了一种基于PR算法和上下文链接信息的方法来评估专家水平[23],其构建的专家知识地图如图6所示,在该领域中Tim和Bill是最具有权威的专家,他们在社会网络知识地图中占据着核心的位置,不仅节点的入度值最大而且在给定独立子图中的交互强度也是最强的。组织或团体可以据此不断巩固他们的中坚力量,充分发挥他们在专业领域中的模范带头作用。
Kate Ehrlich等使用SmallBlue Net工具对处于同一个团体内或者基于某个主题领域的专家进行社会网络分析[24],以便发现专家之间的内在联系和相互作用关系。用户可能更希望找到团体或主题中与专家关系紧密并且能够准确评估专家水平的专家,而Small-Blue Net正是用来寻找这些特殊专家的工具[25]。
将专家知识作为社会网络分析图中的节点要素也是一种专家知识地图。Weimao Ke等利用数据清理和语义空间技术实现了这类专家知识地图[26],如图7所示,每一篇文献都由一个圆圈来表示,节点的颜色深浅表示文献发表年限的长短,节点之间的连线表示文献之间的直接引用关系。
5 结语
面向专家的知识地图作为知识地图的一种特定形式,不仅可以用来管理显性专家知识,还能够管理和挖掘隐性专家知识。专家知识地图的研究主要集中于两个方面:一是强调对专家研究领域的挖掘和展示,知识地图不仅能够发现和搜索领域中的专家,评估专家的专业水平,还能帮助管理者绘制组织知识地图,发现组织知识领域科研中的优势和劣势,从而调整组织的战略目标和策略;二是强调利用专家社会网络分析专家之间的联系,从而发现网络中的核心专家、重要的专家关联关系与小团体。
不同的研究成果从不同的需求和角度以知识地图的形式展示了专家各个层面,但是尚没有一个全面的专家知识地图模型和可以普及的应用系统。提高专家知识地图的准确性和智能化是未来的研究方向之一。一方面,绘制专家知识地图前可以引入智能算法,如数据挖掘中的分类或聚类算法对专家知识进行数据清理和预处理,使得专家知识地图的输入数据更能代表专家的知识水平。另一方面,可以结合SOM、MDS等数据挖掘算法和上下文链接信息、本体等语义技术对专家隐性知识进行挖掘,绘制精确的专家知识地图。