从知识运作模式看知识挖掘_隐性知识论文

从知识运转模式论知识挖掘,本文主要内容关键词为:知识论文,模式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

随着计算机技术、网络通讯技术、高密度存储技术、数据挖掘技术等的广泛应用,改变了情报研究组织获取信息的方式和方法,以及其内部信息资源保障体系的服务手段和工作重心。这就要求情报研究知识管理系统不仅要完成一般性的知识管理功能,还应该在对知识管理的基础上应用现代化手段实现知识挖掘,即利用智能工具挖掘蕴藏于海量显性知识中的隐性知识。

1、知识与知识运转模型

1.1 显性知识和隐性知识 1958年,英国物理学家和哲学家M.Polanyi在其代表作《个体知识》中首先提出了隐性知识和显性知识的概念,后来,I.Nonaka又对隐性知识和显性知识的概念进行了较明确的定义[1]:隐性知识(Tacit Knowledge)是建立在个人经验基础之上并涉及各种无形因素的知识,多为主观洞察力、直觉和预感性知识。其根植于个人行为、经验和知识情景中,与人们的行为紧密相连,难以编码和度量,是计算机不容易直接处理的知识;显性知识(Explicit Knowledge)是指那些有形媒体所携有的知识,能够以正式的语言,通过书面记录、数字描述、技术文件、手册和报告等明确表达和交流的知识,是可以被进行编码和度量的、可由计算机处理的知识,是对隐性知识一定程度的抽象和概括。

1.2 基于知识管理的知识运转模式 I.Nonaka和H.Takeuchi把知识转化归纳为下列四种模式[2]:社会化、外在化、综合化以及内隐化。社会化是个人间分享隐性知识的过程;外在化是对隐性知识的明晰表述,是从隐性知识向显性知识的转化;综合化是一种知识扩散的过程,通过分布式文档管理、内容管理、数据仓库等工具将个人知识上升为组织知识;内隐化意味着显性的组织知识转化为组织中其他成员的隐性知识,成员吸收后在其工作过程中创造出新的隐性知识。在此基础上他们提出了“知识应用—知识获取—知识组织—知识扩散”的转换过程,组织知识创造是隐性知识和显性知识持续互动的结果。个人隐性知识是组织知识创造的基础,在知识创造螺旋中四种知识转化模式是相互连续的、螺旋上升的,不断增加着个体和组织知识库的容量。知识管理所要实现的是组织中个人的隐性知识(即内隐)到组织的显性知识(外显),再到组织的内部知识之间的转化。其目标是促进系统内知识的获取、存储、发展和共享。这就需要首先使知识能够在系统内运转流动起来。从知识之间的四种转化模式分析得出,在系统知识管理过程中,知识运转经历以下几个环节:沉淀,即知识编码,是知识从隐性到显性的过程;共享,即知识能够为更多组织成员所学习和应用的过程;学习和应用,即吸收组织内的隐性和显性知识应用于工作实践从而创造价值,与共享环节一起改善知识扩散度;创新,即获取外部新知识或提升内部知识层次。沉淀、共享、学习和应用、创新四个关键的知识运转环节组合成一个螺旋上升的闭环,称之为“知识运转模式”(如图1所示)。

附图

图1 知识运转模式

图1说明组织中的知识经过沉淀、共享、学习和应用、创新四个环节的循环之后,实现了螺旋式上升,组织中的知识不断地进行着隐性知识和显性知识的相互转化。在这个过程中,从个人的内隐知识转化到组织的外显知识时,必须利用智能工具挖掘蕴藏于海量显性知识中的隐性知识,知识挖掘技术起着非常重要的作用。

2、知识挖掘概念

知识挖掘属于知识科学中的概念。知识挖掘是从资料集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识挖掘是对资源所包含的显性知识进行提炼,如从各类文献中提取断言型、解释型和数值型的知识元;对同类数值型知识元进行列表对比,发现文献的隐性关联;对知识元进行可视化处理、文献智能聚类等,使信息增值。

知识挖掘的目的是运用最新的智能工具来挖掘蕴藏于海量显性信息中的隐性知识,并形成专业知识库和知识仓库。将隐性知识显性化并给予管理利用,非常符合情报分析研究用户对个性化、隐性知识的需求,能够真正支撑起情报分析研究知识管理系统的显性知识与隐性知识全方位开发战略。

3、Lotus知识发现实例分析

Lotus的知识挖掘方案是一种成型的知识挖掘模式(如图2)。这种模式主要是通过知识仓库来实现,知识仓库是外部异构的相关数据库和本机构知识库构成的虚拟“库集合”。知识库中的所有知识单元被统一于同样的标准之下[3]。这样,知识挖掘就可以通过统计和分析工具在知识库中完成。

附图

图2 Lotus第三代OA构架

3.1 Lotus 知识发现的新理念 Lotus知识发现解决方案是包括前端桌面应用和后端服务器应用的完整系统,能够帮助企业发现和有效利用存储在信息系统中的“信息内容”和掌握在人脑中的“专家技能”。前端的Lotus知识工作站(K-Station)是一个基于Web 的知识门户解决方案,结合了Lotus先进的门户技术、实时协作平台(Sametime)和群组协作解决方案(QuickPlace)等核心协作工具与服务,集应用、协作服务和个人服务3个基本层次于一体,把“人、场所和事件”3个知识管理的基本因素统一到单一的界面上,提供群组协作应用功能,允许相关人员通过Lotus Notes 客户端或浏览器单一访问入口,以发现、共享和传递知识。后端的LoNs知识发现服务器能够发现“人、场所和事件”之间的关系,帮助用户从存储在企业文档、数据库、电子邮件、Web以及ERP等业务系统的信息中挖掘知识。

3.2 Lotus第三代OA构架分析 第三代办公自动化系统以知识管理为核心,随着Internet技术的迅速发展,Lotus进一步将Internet/Intranet/Extranet(因特网、内联网、外联网)的技术和应用与群件技术进行成功的集成,从而形成了以知识管理为核心的信息技术。图2显示了Lotus第三代OA构架。

其中底层是企业的基本信息支撑环境,它包括MRPII(Manufacture Resource Planning II)、MIS(Management Information System)系统对企业内部各种层次生产经营管理过程的信息化支撑,以及对企业外部Internet的信息获取。三类系统的相互作用体现了Intranet的思想,通过设计与实现优秀的Internet信息获取工具,可以有效地利用外部的有用信息为企业内部的经营管理过程服务。第二层是企业多维知识仓库,存在于底层企业信息支撑环境中的企业信息资源是庞杂而海量的,需要在数据挖掘与模式提取的工具支持下,发掘其中有价值的模式与知识,进行紧密而科学的组织,这是支持知识管理系统实现的有利依据。图中的圆环代表了企业员工的工作环境,其上的各个结点代表企业中不同岗位上的企业员工。

知识管理的目的就在于更好地支持各个层次企业员工的工作流过程,包括:a.员工与企业知识仓库之间的个人知识挖掘与融合过程,用于完成员工不断根据个人需求在知识仓库中的映射与知识提取,以及员工个人知识不断融合进入企业整个知识仓库的过程;b.员工之间的知识流转与共享过程,提供了不同知识映射集合之间共享与交叉的可能,同时也提供了无法进入企业知识仓库中的非结构化个人头脑知识的交流与互动的机会,从而可能引发新知识的产生;c.个人知识支持的工作过程与信息反馈过程,是在个人知识平台支持下指导实现员工的工作过程,以及工作结果的信息反馈过程。充分利用这一过程,可以及时地收集知识利用的反馈信息,为闭环知识管理系统的完善与控制提供了必要基础。

基于企业多维知识仓库还可以通过进一步的知识支持与决策分析过程,建立面向决策的企业决策支持系统,也就是图中的第三层。通过建立决策模型与先进系统理论的应用,支持企业决策者高层次的管理决策过程,从根本上决定与引导企业的发展演变过程。

由上述分析,可以看到知识在企业内部的纵向提取过程、员工与知识系统的发散性融合作用、企业员工工作环境中员工知识的相互交叉作用,相增相长,以及员工知识在企业信息管理中的循环更新过程,这正是知识管理系统的逻辑实现模型。

4、基于知识挖掘的相关技术

从对Lotus系统构架的分析,可以看到知识挖掘所涉及的主要技术有知识分类技术、数据仓库技术、联机分析挖掘技术、Web挖掘技术和信息可视化技术等。

4.1 知识分类技术(Knowledge Classifying) 知识分类是直接对知识,而不是对图书资料进行分类,它不同于传统的图书分类法,知识分类是基于现代科学理论和认知理论,参照教育部制定的学科分类、科技部制定的自然科学基金学科指南以及其他分类方法编制的知识分类体系,据此对资源进行知识层面上的分类。

4.2 数据仓库技术(Knowledge Warehousing) 数据仓库概念的创始人W.H.Inmon 在《Building the Data Warehouse》一书中指出:“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持经营管理中的决策制定过程”[4]。首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据。

数据仓库系统体系结构包括以下四个部分(见图3):a.数据源。是数据仓库系统的基础,是整个系统的数据源泉。b.数据的存储与管理。是整个数据仓库系统的核心,数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。c.OLAP服务器。对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。d.前端工具。主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。

附图

图3 数据仓库构架

知识仓库强调为决策者提供一个提升知识管理流程全过程的智能分析平台。知识仓库能够对不同类型的知识(显性知识和隐性知识)和不同形式的知识(纯文本、二进制对象、模型、图形等)进行捕捉、存储、编码、组织和分析。另外,这些知识还包括元知识(关于知识的知识)和分析后产生的新知识。数据仓库的目的是要建立一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息,组织内的成员都可以在此单一的环境之下,通过运用其中的数据与信息,发现全新的视野和新的问题、新的分析方法,进而发展成制度化的决策系统,并获取更大效益。

知识仓库应具备以下主要功能:生产和组织知识的功能、检索和管理知识的功能、隐性知识共享和转化功能、知识存储和检索功能、知识分析和决策功能、新知识的产生和反馈功能、用户行为分析跟踪功能等。

4.3 联机分析挖掘技术(OLAM,Online Analytical Mining) OLAM是OLAP和DM相结合的产物,OLAP(Online Analytical Processing,联机分析处理)与DM(Data Mining,数据挖掘)是基于数据仓库技术而发展起来的信息分析与挖掘工具。在系统中OLAM和OLAP往往是集成应用的(如图4)。

附图

图4 集成的OLAM和OLAP结构

OLAP是验证型的,建立在多维视图的基础上,重在根据已有的模式将直接源自数据仓库中的不同信息源的大量相关信息联系起来,以给分析人员一个清晰、一致的视图。OLAP的多维数据分析与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。OLAP的多维数据分析主要通过对多维数据的维进行剖切、钻取和旋转来实现对数据库所提供的数据进行深入分析,为决策者提供决策支持。多维结构是决策支持的支柱,也是OLAP的核心。多维结构中的维突破了三维概念,可以是超立方体和多立方体的数据结构。OLAP主要有两个特点:一是在线性(online),即对用户的请求做出快速响应;二是可以应用多种统计分析工具、算法对数据进行多维分析(multi-analysis)。DM是挖掘型的,建立在各种信息源的基础上,重在发现隐藏在大量原始数据深层中的对人们有用的模式(patterns)。DM有两个主要过程,即建立模型和预测未来结果。

OLAM兼有OLAP多维分析的在线性、灵活性和DM对数据处理的深入性,OLAM服务器可以执行如概念描述、关联、分类、预测、聚类、时间序列分析等多种数据挖掘任务,它通常由多个集成的数据挖掘模块组成,比OLAP服务器复杂得多。目前OLAM正处于研究之中,针对OLAM的发展驱动力和基本结构,以下几点是必要的:OLAM建立在多维数据库和OLAP的基础之上,能对任何它想要的数据进行挖掘;用户对挖掘算法具有动态选择的权力;具有强大的基于超立方体的挖掘算法;能够协调好执行效率与挖掘的准确性之间的关系;具有灵活的可视化工具和良好的扩展性。

通过把OLAM和WWW技术相结合,形成网络联机分析挖掘技术。 特别适合数据量巨大、信息类型复杂、表现形式繁多的网络信息资源的挖掘和组织,这是目前最新的数据挖掘技术。

4.4 Web挖掘技术(Web Mining) 随着Internet在流量、规模和复杂度等方面的飞速增长,WWW成为一个巨大的、分布广泛的、全球性的信息服务中心。Web中包含了Web页面的内容信息、丰富的超链接信息以及Web 页面的访问和使用信息,为数据挖掘提供了丰富的资源。Web挖掘就是利用数据挖掘技术从Web文档和Web活动中抽取人们感兴趣的、潜在的、有用的规律和模式。Web挖掘可分为三类:

a.Web内容挖掘(Web Content Mining)。对Web页面的内容进行挖掘,主要是对各种非结构化数据,如文本、音频、视频和图形图像等各种数据相融合的多媒体数据挖掘。b.Web结构挖掘(Web Structure Mining)。对Web页面之间的结构进行挖掘,从WWW的组织结构和连接关系中推导知识,如HITS算法[5]。c.Web使用信息挖掘(Web Usage Mining)。通过Web日志文件和相关数据,对用户访问Web 时留下的访问记录进行挖掘,发现用户访问Web页面的模式。

4.5 信息可视化技术(Information Visualization) 信息可视化技术正在成为信息科学的一个重要分支。它的目标是实现信息的知觉化、感知化。信息可视化集成了多方面的内容,包括信息抽取和描述、人机交互、数据挖掘、制图学和成像学等。信息可视化对知识挖掘的支持是将抽象的、典型的非数字化(如文本)信息转换为二维或三维图形的形式。它可帮助用户理解大规模数据集合,在处理信息可视化空间内,可以显示和观察数据属性,被显示的对象之间的隐藏关系变得显而易见。

附图

图5 信息可视化参考模型

可视化信息系统的开发由以下几部分组成[6]:a.确定有意义的信息特征,即真正了解准备可视化的信息;b.清晰地定义一个可视化空间(二维或三维),这个空间用于存放可视化对象;c.映射数字化描述或者确定在二维或三维可视化环境中可视化对象的位置;d.集成用于搜索可视化信息和与其进行交互的工具。

信息可视化运用图形化技术支持多种多样的交互功能,便于用户探索概念关系和隐含的信息。

5、结束语

由上面的分析可知,如果在情报分析研究工作平台中提供知识挖掘功能,将能更好地支持知识管理目的在情报分析研究工作流过程中的实现:情报研究人员对内部知识仓库不断的个性化知识挖掘,促进了个人知识不断融入机构的知识管理过程;知识挖掘促进了研究人员之间的知识流转与共享过程,加速了研究人员头脑中隐性知识的显性化,从而促使新知识的产生;情报分析研究用户的个性化知识挖掘,使得研究机构和人员可以及时地收集关于知识被利用情况的反馈信息,为知识系统的完善提供支持。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

从知识运作模式看知识挖掘_隐性知识论文
下载Doc文档

猜你喜欢