20年可视化发展历程对情报学的影响,本文主要内容关键词为:情报学论文,发展历程论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 可视化的发展历程
迄今为止,可视化的发展经历了科学计算可视化、信息可视化和知识可视化3个阶段。
1987年美国国家科学基金会举办的可视化会议,首次正式提出可视化这一术语,标志着可视化作为一个研究领域开始出现在人们的视野中。这次会议对可视化的定义如下:可视化是一种计算和处理的方法,它将抽象的符号表示成具体的几何关系,使研究者能亲眼看见他们所模拟和计算的结果,使用户看见原本不能看见的东西。它丰富了科学发现的进程,增强了人们的洞察力。可视化的目的是通过这种视觉的方法提供一种新的科学洞察分析方法,从而弥补现有科学分析方法的缺陷[1]。从这个定义我们可以看出,它主要是针对科学计算可视化而定义的,其研究对象主要是科研试验中产生的大量数据,它的定义存在一定的局限性,可视化不仅仅是一种计算方法,它可将所有这些非空间抽象的信息全都可以通过映射为或转化为一种可视化形式来方便观察。
随着人们对可视化研究的加深,可视化研究范围的不断扩大,1989年,Robertson,Card和Mackinlay在《用于交互性用户界面的认知协处理器》[2]一文中首次提出了“信息可视化”这个概念。他们认为,由于技术的发展,使得在用户界面中使用硬件系统的图形性能和速度来探索3D和动画成为可能,为了充分发挥其功效,必须开发新的软件结构以支持复杂的多智能体异步交互的问题。而信息可视化技术是解决问题的关键所在,此后信息可视化作为一个学科逐渐成长起来。而实际上信息可视化的提出是基于3D动画提出的,如今,信息可视化的研究范围已远远超出这个领域。
在科学计算可视化和信息可视化发展的基础上,知识可视化应运而生。知识可视化是在科学计算可视化、数据可视化、信息可视化基础上发展起来的新兴领域,它应用视觉表征手段,促进群体知识的传播和创新[3-4]。一般来讲,知识可视化领域研究的是视觉表达方式在提高两人或两人以上之间的知识传播和创新中的作用。这样,知识可视化指的是所有可以用来建构和传达复杂知识的图解手段。除了传达事实信息之外,知识可视化的目标在于传输见解、经验、态度、价值观、期望和预测等,并以这种方式帮助他人正确地重构、记忆和应用这些知识[5]。
2 信息时代情报分析的关键环节
传统情报研究的步骤包括情报搜集、资料整理、情报分析和形成研究报告等。信息时代,情报学从对文献的研究已扩大到对信息和知识的研究,情报分析也逐渐演变为信息分析。笔者认为,一个完整的信息分析系统应包括信息组织、信息检索、信息分析和信息服务,这四要素之间的关系如图1所示。有机的信息组织和有效的信息检索方式是快速获取有用信息的基础,是信息分析的前提条件,而信息分析则是对检索获得的信息的深度挖掘。信息服务是信息分析的最终表达形式。
图1 信息分析系统四要素关系图
2.1 信息组织
信息组织是对信息的序化或整序,它是信息管理和信息分析的前提条件。传统的信息组织以文献为主要研究对象,采用手工编制目录、索引、文献、综述等形式进行信息组织。在网络时代,针对文献信息的标引方式已不能满足网络信息资源的有效组织,人们开始研究利用XML、RDF(Resource Description Framework)、元数据、网络技术、语义网和本体等信息技术组织信息。
2.2 信息检索
检索是人类从大量信息中获取相关的有用信息的途径,检索问题的研究贯穿了情报学的始终,它从最早的手工文献检索已经发展到了今天的信息检索。信息检索指“将信息按照一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程”[6]。信息检索经历了机械化检索—自动化检索—联机检索—网络检索4个发展过程。在计算机出现后,信息检索摆脱机械化检索,步入自动化检索阶段,并且在自动标引、自动文摘和自动分类等方面取得了一系列研究成果。
2.3 信息分析
信息分析是进行情报研究的一个重要环节,是理解信息的关键,它是以对已知信息的内容进行整序和科学抽象为主要特征的一项信息深加工活动,目的是为了产生具有决策作用的增值信息,以便更好地开发和利用信息资源[7]。传统的信息分析方法包括定性分析方法和定量分析方法两大类。定性分析方法包括因素分解法、逻辑方法、历史比较法、社会调查法和德尔菲法。定量分析方法包括时间序列分析法、因子分析法、聚类分析法、引文分析法和主成分分析法。定性分析和定量分析经常结合使用。
2.4 信息服务
广义上讲,信息服务是指根据用户的需求,提供有用的显性知识(如用文字、图像、符号表述的印刷品或电子产品)内容的一切信息服务性活动。依据这个定义,信息组织、信息检索和信息分析都是信息服务的手段,其中,信息组织和信息检索是基础性的信息服务,而信息分析则是增值性的信息服务。在本文中,信息服务特指信息服务提供的最终表达形式。
3 可视化在情报分析的应用与发展
实现对信息的理解是情报学研究的终极目的,情报学研究的最终成果应该实现对信息理解。可视化这种方法具有“一图胜千言”的强大理解力,因此,可视化在情报学界广泛展开研究。从可视化的发展历程可以看出,可视化在正式提出的20年来,已从科学计算可视化、信息可视化发展到知识可视化,其研究对象已从数据、信息扩展到知识。通过对可视化20年发展历程的思考,我们发现可视化已渗透到情报学的各个领域。
3.1 可视化与信息组织
本体和语义网是新兴的信息组织方式,它们的应用将促进信息组织向知识组织发展。由于本体之间关系的复杂性,引入可视化技术表现本体,能加深人们对信息的理解和认识。本体可视化的发展已取得了一定的进展,开发出了一些比较成熟的本体可视化工具,如Protégé和Kano,它们都能提供多种可视化技术表达本体。Protégé由斯坦福大学研究设计,它是目前比较完善的一种本体支持工具,目前,已经有很多专业领域的本体利用Protégé构建。Protégé使用到的可视化方法包括分类浏览器、Jambalaya、TGVizTab和OntoViz等。分类浏览器提供了一个Windows浏览器界面,通过分层的方法表达本体之间的关系。
3.2 可视化与信息检索
传统信息检索模式利用主题词、关键词和摘要等相关项进行检索,实际上是将提问词与文献标引词进行严格匹配,这种检索方式在用户对要检索的领域不熟悉时,很难得到准确的检索结果。传统信息检索模式对用户来讲是一个不透明的黑箱[8],用户输入检索词后,检索过程交给计算机处理,计算机系统怎样实现检索词与文献标引词的匹配,以及怎样对检索结果进行排序等对用户都是不透明的,因此,更谈不上用户对检索过程的控制。传统信息检索模式不能有效地展示检索结果,当检索返回的信息量很大时,为浏览所有的结果,用户只能不停地翻页。
为解决传统信息检索模式中存在的一些问题,把可视化引入到信息检索中来。信息检索可视化是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转化成图形,在一个二维或三维的可视化空间中显示出来,并向用户提供信息检索的技术。检索可视化技术应用可以贯穿到整个信息检索过程。信息检索可视化为用户提供了一个良好的人机交互环境,能根据用户的需求,自动调整检索策略,并使检索过程变得透明,从而加大了人们对信息检索过程的控制能力。对于检索结果,可视化的信息检索环境则向用户提供了更为丰富的信息,除检索结果外,还能反映出文献之间的联系及文献与引文之间的联系等。
目前已有一些信息检索的可视化系统投入应用。如用于对一个文献全文进行可视化处理的TileBars、通用信息检索可视化平台Visual Net,对ACM Computing Classification System信息系统进行可视化信息管理的GRIDL和基于空间距离和角度的信息检索可视化系统DARE。
3.3 可视化与信息分析
数据挖掘是一种信息分析常用的技术,它是从大量的数据中挖掘出有用的信息,即从大量的、不完全的、有噪声的、模糊的、随机的数据集中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程[9]。
数据挖掘成熟的理论方法为发现显性信息背后隐藏的隐性知识提供了强有力的技术依据。然而,美中不足的是数据挖掘是一门多学科的交叉技术,它是在统计学、数据库和人工智能等学科基础上发展起来的,数据挖掘算法本身都相当复杂,所以一般的用户难以理解和接受。为弥补数据挖掘算法复杂性的缺陷,把可视化技术引入到数据挖掘中,由此产生了可视化数据挖掘技术。可视化数据挖掘充分利用可视化的直观性,从可视化角度分析和理解数据挖掘的全过程,最大限度地弥补了数据挖掘算法复杂性这一缺陷。可视化数据挖掘的出现为用户提供了一种易于理解的信息分析工具,提高了人们理解信息的能力。
可视化数据挖掘包括数据预处理阶段的可视化、数据挖掘过程的可视化和数据挖掘结果的可视化。目前的可视化数据挖掘工具能够提供常用的挖掘技术,但可视化技术的应用仍然有限,主要体现在数据预处理阶段的可视化和对数据挖掘结果的可视化,对数据挖掘过程的可视化的研究还比较薄弱。
目前已出现一些比较成熟的数据挖掘工具,如IBM开发的Intelligent Miner、SAS公司的Enterprise Miner、SGI公司的MineSet、Thinking Machines开发的Dawin、SPSS公司的Clementine和IBM Almaden研究中心开发的Quest系统等。其中,SGI公司的MineSet挖掘器和IBM公司的Intelligent Miner挖掘器将关联规则生成、聚类、决策数分类等数据挖掘操作与数据可视化捆绑在一起,这样既能对结果进行评估,又能实时调整挖掘过程中的算法及参数。其他系统提供的可视化工具远不能满足用户的需要。
3.4 可视化与信息服务
数字图书馆是信息服务的典型代表,在数字图书馆中,可视化的应用主要体现在信息资源的可视化、信息检索的可视化和人机界面的可视化。数字图书馆为用户提供了一个虚拟的图书馆环境,在这个虚拟的信息环境中,用户可以很好地从视觉上实现和计算机的交互,实现信息的检索和浏览。构建一个数字图书馆要综合运用到信息组织技术、信息检索技术和信息分析技术,因此,可视化与情报分析的应用能在数字图书馆中得到集中体现。
Visual Net是可视化在数字图书馆应用中的一个案例。它将Belmont Abbey学院图书馆的馆藏投影到一个以等级结构为基础的可视化主题地图上。在这个可视化主题地图上,用户可以进行数据挖掘,数据检索,寻找所需的资料。它的可视化空间实际上是一个语义地图。在对图书资源的馆藏分布上,Visual Net采用目标体(文献)图标释义图,用图标的中心圆、白色圆和绿色圆分别代表文献的类型、文献的长短和文献的新旧,蓝色箭头代表文献是外文文献,黄色箭头代表文献是参考文献。用户可以通过点击这种表达清晰的图标选择所需文献。
4 可视化在情报学应用中存在的问题及建议
4.1 可视化在情报学应用中存在的问题
目前,可视化技术虽然已趋于成熟,但却并没有得到更加广泛的应用,造成这种情况的原因是可视化是一门涉及多个学科的交叉学科,而情报研究人员大多不是技术人员,因此导致情报人员有时对可视化方法感到无所适从,不知怎么使用这些可视化技术为情报分析服务,造成其应用受限。面对可视化这一新涌现的热点问题,研究者们开始在各个领域展开对可视化的研究,试图让可视化成为自己领域内的有力工具,然而,可视化不是神话,它并不能解决所有的问题,错误的使用非但不能提高人们的认知理解能力,反而成为人们理解的障碍。
4.2 可视化在情报学应用中的几点建议
可视化方法已渗透到信息组织、信息检索、信息分析和信息服务这4个情报分析的关键环节中,在情报分析中发挥着重要的作用。这表明,可视化已成为情报学重要的一份子,与情报学研究成为密不可分的一体。在对可视化的研究中,我们应当注意以下几点。
1)明确可视化的目的是提高对信息的理解力。在实际应用中不要盲目地追逐潮流,一味地采用可视化方法解决问题。可视化虽然是一种行之有效的提高理解力的方法,但并不适用于所有的情况,在情报学的研究中,应结合情报学的特征,正确使用可视化技术。
2)明晰可视化的分类方法。建立正确的可视化分类方法不仅能帮助可视化的理论研究者理解可视化设计,而且能帮助可视化的应用者理解怎样选取可视化方案和应用已有的可视化技术,从而推进可视化技术的应用,使可视化逐步发展成为一个完善的学科体系。
3)与应用领域紧密结合,对不同对象所采用的可视化方法有时可能完全不同,甚至大相径庭,脱离实际应用的可视化研究缺乏实际意义,应开发研制与应用领域相结合的可视化技术模块,使可视化技术黑箱化、模块化及在特定领域的成品化,使情报分析人员无须了解可视化的技术原理,也能利用这些特定的模块从事情报分析工作。
4)进一步研究可视化的评价标准。目前,人们用表现力和有效性来评价可视化的效果,表现力是指可视化的结果使所有的数据得到表现,而且没有其他的东西被引入;有效性是指可视化能够使用户充分发现数据之间的关系和理解数据[10]。评价标准有助于指导用户设计合理的可视化方案。
标签:信息可视化论文; 情报学论文; 数据挖掘论文; 信息检索论文; 数据挖掘算法论文; 用户研究论文; 信息发展论文; 信息搜集论文; 用户分析论文;