信息研究方法的聚类分析_聚类分析论文

信息研究方法的聚类分析_聚类分析论文

情报研究方法的聚类分析,本文主要内容关键词为:情报论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:G350文献标识码:A文章编号:1007-7634(2006)10-1561-07

1 对情报研究方法及情报学方法论的重新认识

情报研究方法特指个人或组织在对信息资源(Information Resource)进行收集、整理、分析,并最终形成判断、预测和解决方案的情报过程中所使用的方法的总和。曾任美国副国务卿的鲍伊(Robert.R.Bowie)曾建议把情报界定为“设计用来协助行动的知识和分析”[1],那么,情报方法就是在这种“设计”过程中所使用的方法,它是一种求知的工具(intellectual tool)[1],是一种“激活”或“活化”知识的工具[2]。情报方法施加的对象是信息资源,这种资源可以是显形的,如文献资料等,也可以是隐性的,如个人或组织的经验等隐性知识(如know-how类知识、know-who类知识);可以是印刷型的,也可能是电子型、网络型的。运用情报方法所输出的结果(outcome)是intelligence(情报),其表现形式为判断、预测、预警和解决方案等。

一般认为,方法论指的是关于科学研究中所使用的方法的学说或理论。据此可知,情报学方法论则是关于情报方法的知识或体系,研究如何使科学化的情报研究方法得以有效、有序的运用,并使各种情报方法的知识得以整合,增强情报人员研究情报和情报规律的能力[2]。

20世纪80年代以来,我国图书情报界兴起了关于情报学方法论体系的讨论,比较公认和成熟的有“三层次说”、“四层次说”等。如乔好勤、吴慰慈、王崇德等学者提出的“三层次说”,包含哲学方法、一般方法和专门方法;周文骏的“四层次说”则包含哲学方法、一般方法、相邻学科方法和专门方法。这些方法论体系的提出,具有较强的逻辑性,对情报学方法论体系的建设具有指导意义。

经过20多年的发展,我国的情报实践得到了充分发展,各种情报研究方法的运用积累了大量案例,这为我们运用归纳法来研究各种情报研究方法提供了可能。如果说20世纪80年代关于情报学方法论体系的讨论,对我国情报学方法论研究具有指导意义的话,那么,对20多年来国内外情报实践中所运用的情报研究方法进行归纳、梳理、聚类,则不仅能揭示各种情报研究方法的生长规律、各自的情报功能及相互关系,还能探究情报学方法论研究的时代特点和发展趋势。

2 聚类依据:研究对象的情报特征

“聚类”本身就是一种情报研究方法,作为一种思想,它起源于数值分析中的“聚类分析”(clustering analysis,又称“簇群分析”),情报学中应用这一方法将各种形态的情报研究对象按其不同的特征聚类,并揭示其动态关系,从而研究它们的内在联系以及发生、传播、生长点等内在规律[3]。聚类方法是一个从“个别”到“一般”的研究过程,从对个体(研究对象)的分析开始,将相关的对象合并为一类,寻找其上位类,在这个由具体到一般的聚类过程中,揭示杂乱无序的情报/情报源之间的逻辑联系或知识谱系关系。

在关于情报学方法论的专著、学术期刊和数据库(CNKI)中所能检索到的各种情报方法,十分杂乱。因此在大量收集各种情报方法的基础上,进行有效的甄别,是对情报研究方法进行聚类研究的一项关键工作。为此我们将情报研究方法界定为个人或组织在对信息资源进行收集、整理、分析,并最终形成判断、预测或解决方案的情报过程中所使用的方法。其中,信息的收集、整理是情报研究的基础,情报分析是关键,情报研究的结果应表现为具体的判断、预测或解决方案。情报研究的这三个过程缺一不可,这样,关于信息检索的方法由于只在情报研究基础阶段发挥作用,而不能入选。同样,谍报中通过非正常手段获取情报的惯用方法,由于没有经过情报分析过程而直接获取,也不在入选之列。

聚类分析的关键在于发现各种情报研究方法的关联性,并将相关的情报研究方法归为一类。当我们回顾、审视20多年来国内外图书情报界在方法论建设方面的研究成果时,我们大致弄清了情报学方法论建设过程中的发展轨迹,初步发现了一些发展趋势。各种情报方法的诞生与应用,是与不同时代的科技发展水平和社会情报需求紧密联系在一起的。我们能约略感觉到从定性研究到定量研究,再到注重定性与定量相结合的发展轨迹,感觉到从以文献及其构件为情报研究单元,到以文献中的知识以及人或组织所掌握的知识为情报研究单元的发展趋势。

我们发现,从事情报研究,可以根据特定的用户需求从不同的角度切入,正因为这个原因,才产生了众多功能各异的情报研究方法。进行情报研究的“角度”或“切入点”,必须能够揭示情报研究对象的情报特征。例如,有些研究对象的情报特征可以用数据进行描述,有些可以通过语词出现频率、引文情况等文献特征来表示。因此,数据、文献等才能成为情报研究的切入点。为此,我们将各种情报研究方法所反映出来的情报特征,作为聚类依据。正是由于研究对象的不同情报特征,才规定了各种情报研究方法在信息收集和情报分析阶段具有不同的侧重点,情报功能也有所差异。对情报研究方法进行聚类分析,首先要分析不同历史时期、类型庞杂的情报方法分别是从什么角度来描述研究对象的情报特征的。我们通过对大量情报方法的个别分析,将各种情报研究方法聚为六类,即:①基于数据的情报研究方法;②基于文献及其构件的情报研究方法;③基于知识的情报研究方法;④基于人的情报研究方法;⑤基于组织的情报研究方法;⑥基于认知的方法(具体聚类情况见表1)。

表1 各种情报研究方法的聚类情况

类别

情报研究方法示例

基于数据的方法 回归分析法、聚类映像法、判别分析法、主成分分析法、因子分析法、趋势外推法、时间序列法、模拟模型法等

基于文献及其构件的方法 文献计量学方法、引文分析法、内容分析法等

基于知识的方法 空白点分析法、知识基因法、非相关文献知识发现法等

基于人的方法德尔菲法、交叉影响分析法、头脑风暴法、个别访谈法等

基于组织的方法 宏观环境PEST分析法、技术经济分析法、产品生命周期分析法、核心竞争力分析法、顾客满意度分析法、企

业战略组群分析法、决策分析工具、排队工具、帕累多工具、产品定位工具、财务分析方法、定标比超法、反求

工程、SWOT分析法等

基于认知的方法 哲学方法、理性思维方法、形象思维方法、灵感思维方法、创造性思维方法、信息方法、系统方法、控制论方

法、比较方法、历史方法、案例分析法等

3 对各类方法的情报特征与情报功能分析

3.1 基于数据的情报研究方法

3.1.1 特征分析

基于数据的情报研究方法包括回归分析法、聚类映像法、判别分析法、主成分分析法、因子分析法、趋势外推法、时间序列法、模拟模型法等。

这类情报方法适用于那些可以用数据来描述研究对象的情报问题,其特点是从多角度对所研究的情报问题进行考察,一次考察形成一个样本,一个角度即为一个变量,然后运用数理统计中的一系列理论和方法,对由此得出的大量数据进行各种提炼加工,从涉及多因素相互交织的复杂现象中推断出有意义的结论[4]。

由于运用这类情报方法所得出的分析结果是统计意义上的,所以特别适合于对结果的精确性要求不太高的社会科学领域,又由于它是面向大批量数据的,因而在许多注重数据的领域都得到了广泛的应用,如经济预测、区域规划、医疗、气象、地质、人口调查、体育等。

这类方法从20世纪30年代开始发展,70年代以来,在国外的应用已渐趋成熟。我国从80年代开始步入运用十分活跃的时期,基于数据的情报方法在众多领域得到了广泛运用。

需要说明的是,基于数据的各种情报方法,主要是从定量的角度对研究对象进行研究,但作为一种思想,大都也适用于情报问题的定性研究。实际上从广义来理解,所谓“数据”,不仅包括描述情报问题的各种数字,还包括描述情报问题各种概念、特征和语词。比如,定量研究中的聚类分析、判别分析,分别与定量研究中的归类研究、分类研究,它们在思想渊源上是一致的。正是由于这一原因,情报研究中的定量研究与定性研究才能相互配合、联合使用,从而更好地发挥各自的长处,弥补各自的局限性。一般认为,定性分析与定量分析是相辅相成、缺一不可的。定性分析是定量分析的基础和前提,定量分析则是定性分析的精确化和具体化。尤其在数据的收集阶段,主要依靠的是定性方法。

3.1.2 主要情报功能[4]

(1)简化数据结构。采用主成分分析、非线性映射等方法,可在保留大部分主要信息的同时简化数据结构。

(2)分类与聚类。从思维过程来讲,“分类”与“聚类”的方法正好相反。分类的过程一般是先给定一个分类体系,然后将研究对象在分类体系中找到一个恰当的位置,亦称“判别分析”;而“聚类”则是从对个体(研究对象)的分析开始,将相关的对象合并为一类,寻找其上位类,在这个由具体到一般的聚类过程中,揭示杂乱无序的情报/情报源之间的逻辑联系或知识谱系关系,亦称“聚类分析”。

(3)变量间的相互依赖性分析。不区分自、因变量的有相关分析;区分自、因变量的有单元回归与多元回归。

(4)揭示数据内在结构。用因子分析可以产生新的公共因子以建立与原有各变量的联系;对应分析在全局数据变换基础上将变量与样本在同一二维平面上对应显示,能揭示变量间、样本间、变量与样本间的群落对应关系。

(5)确定重要影响因素。在回归基础上发展起来的多元逐步回归可以实现对变量的自动筛选,保留对因变量有重要影响的自变量,从而达到选择自变量“最佳”子集的目的。

(6)建立模型、预测预报。回归模型、趋势外推、聚类映像可用于定量地预测预报;判别分析可用于定性地分类识别。

3.2 基于文献及其构件的情报研究方法

3.2.1 特征分析

这类方法包括文献计量学方法、引文分析法和内容分析法等。

文献作为人类文明成果记录与传播的重要载体,不仅是情报学的研究内容之一,也是图书馆学、文献学等相关学科的研究对象之一。虽然作为研究客体的“文献”,在这些学科的地位与内涵不尽相同,它们的外延却严重地重复。事实上,文献作为一种重要的情报源,是开展情报研究的基础,是情报工作者和研究者必须利用的资源。因此,基于文献的情报方法由于具有强烈的学科特色,成为这些相关学科的核心方法,也是情报学中比较成熟的专门方法,是情报学走向成熟的标志性方法。

这类方法的特点是,在利用数学和统计学方法的基础上,逐步加以创造、完善,使其具有情报学特有的学科思维方式,是其他学科的研究方法所无法替代的。其统计分析的对象,可以是整篇文献、期刊、报纸或专著;也可以是标志文献的形式特征(如篇名、作者、引文、出版社、网站、借阅与复制的情况等),或标志文献的内容特征(如概念、词语、关键词等)。借助收集统计数据的工具往往是书目、索引、文摘、百科全书、数据库等二次或三次文献,也可以是报纸、期刊或网络上发表的原始文献。

由于文献工作是开展科学研究的基础,所以,基于文献的情报方法往往能超越内在的学科特色,对其他科学研究的思维方式、手段与方法,产生一定影响。例如,布拉德福在研究相关论文在期刊上的分布规律时,确立了特殊的统计方法——等级分布法。等级分布法与频率分布法相比是一种更为逼近的分析法,不仅用于解决文献的统计分析,而且能有效地解决其他社会科学学科所提出的问题[5],显示出基于文献的情报方法具有较强的输出性。

由于计算机科学的发展,基于文献的情报方法借助于计算机技术,得到了新的发展,在图书馆学、文献学、社会学、新闻学、科学学等众多学科领域的研究中得到了广泛应用。

3.2.2 主要情报功能

(1)描述情报研究对象的现状。例如,文献计量学方法和引文分析法用于分析期刊的刊文、出版、订阅、利用情况,内容分析法用于社会调查等。

(2)概括情报研究对象的发展规律。由于采用了形式化的数学语言进行情报分析,文献计量学的方法能够对研究对象的发展规律进行较好的概括。文献分散规律(布拉德福定律)、著者分布规律(洛特卡定律)、词频分布规律(齐夫定律)、文献增长规律(普赖斯曲线)和文献老化规律(巴顿-凯普勒方程),成为研究文献规律的基本原理。

(3)进行情报分析和评价。文献计量学的方法、引文分析法用于与文献相关的各种要素(作者研究领域与水平、出版水平、期刊质量等)以及科技发展的分析与评价;内容分析法用于政治、军事、科技、经济情报的分析与研究。

(4)预测情报研究对象的发展趋势。文献计量学的方法、引文分析法用于与文献相关的各种要素(作者研究领域与水平、出版水平、期刊质量等)以及科技发展的趋势分析;内容分析法特别适用于社会和文化变迁的趋势分析。

(5)挖掘和发现重要情报。内容分析法在这方面有着特别作用,例如,第二次世界大战期间H.D.Lasswell等人在美国国会图书馆组织的名为“战时通讯研究”的工作,以德国公开出版的报纸为研究对象,通过内容分析法为法国获得了重要的军政方面的机密情报。

(6)确定重要影响因素。这类运用定量的方法,善于分析研究对象中居于主要地位的因素。

3.3 基于知识的情报研究方法

3.3.1 特征分析

这类方法主要包括空白点分析法、知识基因法、非相关文献知识发现法等。

基于知识的情报方法是近年来情报学方法论研究的趋势,在情报研究中,主要适用于科学技术情报的研究。由于知识在人类文明中所起的作用越来越大,人类已经进入了信息化社会,而且正在向知识化社会迈进。正是在这样的时代背景下,人们开始注意到,仅仅依靠数据和文献来进行情报研究是不够的,还需要深入到知识层面来开展情报研究。当我们淹没在信息的海洋里,却日益渴求知识的时候,基于知识的情报方法很好地迎接了这种挑战,它们对提高情报识别的质量和效率是很有益的。该方法的掌握与运用,会使情报人员发现更多更有价值的情报。这类方法的提出是在20世纪末期,目前主要处于理论探索期,在情报实践中的运用尚不多。

知识的挖掘和发现是一个复杂的认知过程,是以情报研究人员自身的知识储备和认知能力为基础的。由于基于知识的情报方法深入到了情报研究对象的知识层面,所以在应用这类方法的时候,往往需要情报人员和特定学科领域的专家合作开展研究。

这类方法的应用前景还有待于与信息技术的紧密结合。只有充分利用现代信息技术,利用计算机进行辅助性知识分析,才能激发这类方法的生命与活力。

3.3.2 主要情报功能

(1)简化知识情报的结构。情报简化方法体现于情报工作的全过程——情报搜集、加工整理、情报研究、编译报道、检索服务及情报机构的职能工作等[6]。为解决“知识爆炸”的危机,知识基因法能有效地简化和浓缩知识或情报,以利于知识或情报需求者吸收。

(2)发现知识孤岛。空白点分析法通过了解研究目标的现有知识存量,并将现有知识存量与达到目标所需要的知识总量进行比较,从而找出带有研究性质的未知的特定参数,勾画未知事物的边界,发现知识孤岛。

(3)揭示知识谱系。知识基因法通过挖掘知识演变过程中具有遗传性质的概念、特征、人物、主题等因素的总结与分析,较好地追踪概念的发展图式,探寻其演变历程,揭示知识谱系中各遗传因素之间的逻辑关系。

(4)挖掘新知识。基于非相关文献的知识发现方法较好地把立足于文献外部特征的文献方法和立足于文献内容实质的知识方法有机地结合起来,为跨学科研究中的知识发现提供了有力的工具。

3.4 基于人的情报方法

3.4.1 特征分析

这类方法主要包括德尔菲法、交叉影响分析法、头脑风暴法、个别访谈法等。

这类方法又可称为专家调查法或专家评估法。在情报研究中,人是最重要的因素,基于人的情报方法主要依靠专家的知识与经验,以隐性知识为信息源,充分发挥和调动人(尤其是专家)在情报研究中的作用。20世纪60年代中期,国外许多政府机构和企业热衷于建立电子计算机数据处理系统,但是,实践证明,利用专家头脑的直观判断仍具有强大的生命力,专家的作用和经验是计算机无法完全取代的,在许多情况下,只有依靠专家才能作出判断和评估[4]。

根据对专家的知识和经验的处理方式,这类方法可以分成个别决策和团体决策两种类型。前者如个别访谈法,应用这一方法时,专家没有心理压力,其判断与分析可以不受外界干扰;后者如头脑风暴法、电子会议法、大墙会议法等各种会议法,其优点是便于激发创新思维,但能否成功地达到预期的情报研究效果,很大程度上取决于会议的组织工作。各种会议法的差别,主要也就在于会议组织流程的差异,从而导致了不同的情报研究效果。

德尔菲法和交叉影响分析法较好地融合了专家个人智慧和组织智慧之间的优势,既避免了会议法中经常出现的心理压力问题,又充分发挥了团体决策的长处,使许多定性问题得到了定量化处理,为政府和企业实施决策民主化、科学化作出了重要贡献,近年来得到了广泛应用。

3.4.2 主要情报功能

(1)促进隐性知识的收集与交流。德尔菲法通过函件进行专家意见的征询和反馈;头脑风暴法和个别访谈法通过面对面的交流进行情报传递。

(2)促进创造性思考。德尔菲法通过函件反馈其他专家的意见促进创新思考;交叉影响法考虑了情报要素之间的交叉影响关系;头脑风暴法通过“思维共振”激励创新思维。

(3)团体决策。德尔菲法、交叉影响法和头脑风暴法通过建立有效的专家意见处理方法,使决策建立在民主和定量分析的基础上,发挥了团体决策的优势。

3.5 基于组织的情报研究方法

3.5.1 特征分析

这类方法包括宏观环境PEST分析法、技术经济分析法、产品生命周期分析法、核心竞争力分析法、顾客满意度分析法、企业战略组群分析法、决策分析工具、排队工具、帕累多工具、产品定位工具、财务分析方法、定标比超法、反求工程、SWOT分析法等。

基于组织的情报方法又称竞争情报的方法,它们立足于关于某一或某些特定组织的情报的收集、整理与分析,为组织提供竞争环境、竞争对手以及组织预警等方面的竞争性情报,从而为组织决策服务,实现提升组织竞争优势的战略目标。这类情报方法在企业竞争情报领域应用最广,我们认为,只要组织需要发展,这类情报方法在各种类型的组织中都可得到应用,比如各级政府、研究机构、医院、学校等都可以应用基于组织的情报方法为其战略决策服务。

基于组织的情报方法所处理的情报对象基本上公开或半公开信息源,它们主要是对公共信息进行获取和分析的方法。许多竞争情报分散在与市场营销、产品开发、生产经营管理、科学技术相关的各种图书、报刊、技术标准、专利文献、统计资料、政府文件、广告等资料中。但它们与基于文献的情报方法不同,基于文献的情报方法通过对文献的形式特征和内容特征进行情报分析,这是因为,情报研究对象可以通过文献的形式或内容(如引文、概念、词语等)来揭示其特征;而基于组织的情报方法则是对有关组织的特定信息(如财务数据、客户、产品、企业战略等)进行分析,换言之,这些特定信息揭示了组织的情报特征。

基于组织的情报方法与基于知识或人的情报方法也不同,基于知识的情报方法主要应用于科技情报领域,基于人的情报方法以挖掘隐性专家知识或决策民主化、科学化为特色,当然,基于组织的情报方法可以与基于数据、文献、知识或人的情报方法联合使用。基于数据的情报方法中的回归分析、聚类分析、因子分析、判别分析、时间序列分析、趋势外推等方法,基于人的情报方法中的德尔非法、头脑风暴法等,都可用于组织的情报分析与决策。

基于组织的情报方法兴起于20世纪80年代,适应了企业竞争日益加剧的发展环境,体现了第二次世界大战以来情报工作的重点由军事领域转向科技、经济、政治等领域的时代趋势。

3.5.2 主要情报功能

(1)确定竞争对手。竞争对手的确定是组织情报工作的基础。竞争对手一般分为实际竞争对手、当前竞争对手、直接竞争对手、潜在竞争对手和间接竞争对手等。确定竞争对手可用AHP法(一种定性与定量相结合的分析方法)来确定谁是最主要的竞争对手,并按对手的强弱排出顺序。也可用专利分析法,从所提供的产品与服务的角度来识别和跟踪竞争对手。

(2)市场地位的分析。包括情境分析法、定标比超法等。

(3)获取技术产品情报。运用反求工程可以了解先进技术产品的特点,促进技术创新。利用专利分析法,及时把握本行业的技术发展动向、确定行业技术领袖。

(4)了解竞争对手的核心能力。财务分析法可了解竞争对手的盈利能力、财务状况,从而可以分析竞争对手的市场地位和核心能力。

3.6 基于认知的方法

3.6.1 特征分析

情报认知的主要任务,是根据情报调查和整序的结果,针对选题的目的,提出明确的判断、预测或解决方案。这类方法包括哲学方法、思维方法和一般科学方法。其中,哲学方法主要是运用辩证唯物主义的原理来认识情报研究对象;形象思维、抽象思维、灵感思维、创造性思维等思维方法突出了“人”在情报研究中的主体性认知作用;系统方法、控制论方法、信息方法、历史方法、案例分析法、比较方法等现代科学技术方法和传统科学方法,由于揭示了事物运动的普遍规律,具有了认识论的意义,所以,我们也把它们看成是基于认知的方法来看待。事实上,如前所述的各种情报方法,都或多或少地运用了这类方法的认知功能。

情报认知与情报的搜集、整理、分析等环节一样,是情报研究的重要组成部分。认知情报学派认为,情报的接受(用户)与传递(情报系统)都需要与知识结构发生作用,并以知识结构的改变和完善为目的[7]。只有运用了哲学方法、思维方法或现代科学方法,才能使情报研究人员对研究对象的认识从感性阶段提升到理性阶段,从而得到关于情报研究对象的更本质的判断和更准确的预测。

3.6.2 主要情报功能

(1)认识功能。哲学方法、思维方法和一般科学方法所提供的认识功能,主要体现在为情报研究提供一种理论基础,或者世界观与方法论的知识,或者一般思维规律,而不是提供具体的专业知识。这类方法往往能解决专业领域所无法工作直接解决的问题,如情报预测的一般规律,情报研究活动的流程等等,它们与如前所述的各种情报方法一起,构成了情报学方法论的有机组成部分。

(2)启迪功能。基于认知的方法适用于包括情报研究在内的所有学科的研究活动,它们高于一切具体学科。当已有的各种情报方法在情报研究中不能有效地解决问题时,运用这类方法往往能给人们提供新的思路。例如,当前情报研究方法中出现的定量研究与定性分析相结合,宏观考察与微观分析相结合的状况,主要就是受益于信息论、系统论、控制论等现代方法对情报研究的影响,推动着情报研究更加全面、系统、动态地看待情报问题。

(3)预测功能。情报研究不仅要更好地解释过去与现在,更重要的是要有效地预测将来,加强对未知领域的预测是提高情报研究生命力的重要途径。而各种具体的情报研究方法,由于它们有着各自的适用范围和研究视角,只能从某一个特定的方面揭示情报研究对象的特征,只有借助于基于认知的方法,才能加强对情报研究对象的全面认识,高瞻远瞩地预见其发展趋势和一般规律,推动情报人员作出合理而明确的情报预测。

4 结语

我国学术界从20世纪80年代开始情报学方法论的讨论,至今各种情报研究方法得到了不同程度的研究和应用。本文的目的在于探讨各种情报研究方法之间的关联性,而不是各种具体方法的内涵与应用。这种关联性揭示出情报研究方法的生长规律是,各种方法的地位、作用与不同历史时期藉以描述研究对象情报特征的途径密切相关。在文献时代,基于文献的方法居于主导地位。在信息时代,基于数据的各种情报研究方法得到了广泛的应用和推广。随着知识社会的来临,各种基于人(专家)和组织的方法,得到了前所未有的重视。虽然理论界当前关于基于知识的方法的研究尚处于探索期,相信随着计算机技术、人工智能技术等相关学科领域的进展,基于知识的各种方法将会取得较大进展,并有着良好的发展前景。

应当指出,我们对情报研究方法的聚类分析,旨在探讨不同历史时期描述研究对象情报特征的途径与方法,各种情报方法在这方面分别有着各自的侧重点,但由于情报研究对象本身的复杂性,因而各类方法之间并不是彼此孤立的,在具体的情报研究活动中,往往需要综合运用多种方法,发挥它们各自的优势,才能更加全面、准确地判断和预测未知事物的发展状态,更好地为科学决策服务。

标签:;  ;  ;  ;  ;  ;  ;  ;  

信息研究方法的聚类分析_聚类分析论文
下载Doc文档

猜你喜欢