信息研究方法的发展现状与趋势_文献分析法论文

情报研究方法发展现状与趋势,本文主要内容关键词为:发展现状论文,情报论文,趋势论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]G350

1 情报研究方法解析

情报研究工作主要包含三个过程,即信息的收集和整理、情报分析以及情报研究方案。其中,信息的收集和整理是情报研究的基础,情报分析是关键,情报研究的结果表现为具体的判断、预测或解决方案。在情报研究工作中,贯穿于这三个过程,所使用的方法称为情报研究方法。概括地说,情报研究方法是指个人或组织在对信息资源进行收集、整理、分析,并最终形成判断、预测和解决方案的情报过程中所使用的方法的总和[1]。在情报研究过程的信息收集阶段,主要以信息检索方法为主,因此这种只在情报研究基础阶段发挥作用的方法在严格意义上不属于情报研究方法。同样,通过非正常手段直接获取信息,由于没有经过情报分析过程,也不属于情报研究方法。

伴随不断发展的科技水平,为了满足不同用户的情报需求,情报研究需要从不同角度切入,于是涌现出各类情报研究方法。

在宏观上,就分析方式而言,既有定性研究和定量研究,也有定性和定量相结合的研究方法。由于两者功能各异,优势互补,越来越多的情报研究工作已经不再孤立地使用其中一种方法,而是更多地将两者结合起来开展情报研究工作。

在微观上,就分析单元而言,由于情报研究的对象是信息资源,这种资源可以是显性的,如文献资料等,也可以是隐性的,如个人或组织的经验等隐性知识;可以是印刷型的,也可能是电子型的、网络型的。因此,情报研究方法既有以数据或文献及其构件为情报研究单元的方法,也有以文献中的知识以及人或组织所掌握的知识为情报研究单元的情报研究方法。纵览这些角度不同的切入点,可以总结出,在分析单元方面现有情报研究方法主要包括以下5种:①基于数据的情报研究方法;②基于文献的情报研究方法;③基于人的情报研究方法;④基于组织的情报研究方法;⑤基于认知的情报研究方法。这些方法在不同社会背景下受到不同程度地重视,并且方法之间不是相互平行、完全独立的,而是相互渗透的,其中不仅渗透着定性分析、定量分析以及定性和定量相结合的分析方式,各类方法之间还存在着相互渗透,交叉使用的情况。

本文将以上述5种方法为基础介绍情报研究方法的发展现状,期望为情报研究方法的未来发展提供可参考性的帮助。

2 各类情报研究方法的发展现状

2.1 基于数据的情报研究方法

基于数据的情报研究方法,其情报研究对象可以用数据来描述,从多角度对所研究的情报问题进行考察,然后运用数理统计中的一系列理论和方法,对大量数据进行各种提炼加工,从涉及多因素、相互交织的复杂现象中推断出有意义的结论[2]。这种情报研究方法主要包括回归分析法、聚类映像法、判别分析法、主成分分析法、因子分析法、趋势外推法、时间序列法、模拟模型法等。比如,时间序列法就是考虑研究对象与时间之间的相关关系,把时间作为自变量,将研究事物的特征值统计数据按其发生时间的先后顺序排列作为情报研究的样本。

基于数据的情报研究方法,经常作为一种统计工具被交叉使用在其它类型的情报研究方法中,用来处理大批量数据,所得出的结果一般具有统计意义。因此,该方法通常作为定量研究中的中介方法,不仅适用于社会科学领域,目前也被应用于很多自然科学领域,如能源、医学等领域。

2.2 基于文献的情报研究方法

长期以来,文献作为人类文明成果记录与传播的重要载体,一直是科学研究工作最直接的体现。因此,在情报研究工作中,经常选取文献作为重要的信息源。基于文献的情报研究方法正是以文献及其构件作为分析单元,即使在信息时代,传统的印刷型文献被大量的电子型文献和网络型文献所包围,情报研究工作依然沿用传统的基于文献的情报研究方法,并且不断吸收计算机技术来深化这些方法,使它们向自动化、智能化发展。

基于文献的情报研究方法具有强烈的情报学特色,是情报学中开展情报研究工作专门的分析方法,主要包括文献计量学方法、引文分析法和内容分析法等。这些方法的研究对象可以是整篇文献、期刊、报纸或专著;也可以是标志文献的外部特征(如篇名、作者、引文、出版社、网站、借阅与复制的情况等),或标志文献的内容特征(如概念、词语、关键词等)。基于文献的情报研究方法的数据源详见图1。获取这些数据的途径可以借助书目、索引、文摘、百科全书、数据库等二次或三次文献,也可以从报纸、期刊或网络上获取发表的原始文献。

图1 基于文献的情报研究方法数据源

基于文献的情报研究方法以文献及其构件为数据源,利用“共现”原理,即相同或不同的文献特征项共同出现的现象,比如,共词、共篇、共引等,被广泛应用于科技领域的情报研究中。利用这些方法可以描述情报研究对象的现状,概括情报研究对象的发展规律,分析和评价研究对象,预测其发展趋势,利用文献之间明显的相关性挖掘更为重要的隐性信息。

为了获得更为有价值的情报研究结果,借助计算机技术,共词、共篇、共引等方法在原有基础上不断改进和拓展,形成了一些新的基于文献的情报研究方法。新方法的重点在于将研究对象引入到知识的层面,突破了早期仅依靠数据和文献来进行情报研究。这种新兴的基于文献的情报研究方法又被称为基于知识的情报研究方法。

基于知识的情报研究方法主要以知识的挖掘和发现为基础,最终目标是要经过情报研究方法的使用,找到不具有关联的信息或者在不具有关联的信息之间建立起某种关联,把研究对象引入知识的层面,进而发现更具价值的情报。该方法基本上是以文献及其构件作为主要研究对象,这类方法主要包括空白点分析法、知识基因法、非相关文献知识发现法等,其中空白点分析法可以更好地发现知识孤岛,知识基因法和非相关文献知识发现法都可以揭示知识间的关联,并且非相关知识发现法还可以发现新知识。

2.2.1 共词分析的新发展——数据库内容结构分析法 以传统的共词分析为基础,美国海军研究部20世纪90年代初的文本挖掘示范项目中提出了数据库内容结构分析法(DT)。这种方法基于“临近度”原理,研究学科主题的分布和变化趋势。整个DT法大致需要三个步骤[3]:第一是文本检索流程建立检索结果数据库;第二是识别广义主题以及广义主题和子主题之间定量和定性关系的确定;最后是跟踪这些主题的演进和之间关系的变化。目前DT法的研究与应用尚未涉及最后一步,分析只到第二步为止。

DT法中实现的自上而下的共现聚类的分类体系,可以更加客观地揭示主题领域内的知识结构、研究层次以及科研活动的活跃程度,精确地确定主题领域的发展方向,短语的临近度分析有效揭示了领域内的科技关联。因此,DT法可以在某种程度上揭示和挖掘特定领域内的研究空白和知识创新点,是揭示知识演化关系、预测演化趋势的有效手段。

2.2.2 共引分析的新发展 从最初提出共引分析,到由文献共引扩展到作者共引、期刊共引,共引分析方法不仅实现了研究对象的拓展,还在数据处理方面进行了探索。在共引分析方法的统计分析技术中,除了经常使用传统的统计分析处理技术,如聚类分析(clustering)、因子分析(factor analysis)、多维尺度(multidimensional scaling)等,近年来,提出了两个新的数据分析技术,基于模型的聚类算法——自组织映射(SOM)技术和PFNETs(Pathfinder Network Scaling)技术。

●SOM技术。1997年,美国肯塔基州大学的Linxia已开始尝试将SOM技术应用到作者共引分析中。SOM技术是一种神经网络模型,自组织学习方法,具体的工作原理是将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变。此外,网络通过对输入模式地反复学习,可以使权重向量空间与输入模式的概率分布趋于一致。这种自组织聚类过程是在系统自主、无导师指导的条件下完成的。其优势是尽可能忠实地保存输入数据之间的距离关系,映射保存了输入数据之间最重要的相邻关系,并使这些关系清楚显示出来;特征图根据它们出现的频率,为输入向量分配不同数量的节点。[4]。

●PFNETs技术。PFNETs发展于认知科学用以确定网络中最突出的链接。它对不同概念或实体间形成的语义网络进行表达,从一定程度上模拟了人脑的记忆模型和联想式思维方式,主要应用于认知心理学和人工智能等研究方面。PFNETs算法首先检查所有数据之间的关系,然后建立数据间最有效连接的路径。最后将数据以及数据之间的关系表达成一个图,图中节点表示数据,边表示数据之间的关系。PFNETs已被用于作者共引分析,其中将作者视为节点,假设节点间由加权的路径相连,权值为作者的共引频次,并且仅显示节点间最短路径。PFNETs计算快捷,并且具有很强的可视性[5]。

SOM技术和PFNETs技术的应用扩大了共引分析方法的应用层面,使得共引分析的研究范围由单一的小学科逐步扩大到多学科甚至整个科学结构的展示;从最初研究科学发展历程、科学结构发展到展示科学交流模式等,特别是随着信息技术及网络的发展,又用于信息检索可视化及研究网络结构等,它们已成为重要的分析方法。

2.2.3 非相关文献法 非相关文献主要是指,文献数据之间没有明显的相关性,这些数据缺乏外部特征方面的共性,且在内容特征方面,不同文献表面看起来在关键词或是题名上也不具相似性或者相互引用的关系。这些文献数据彼此间呈现出一种独立状态,通常是分属不同学科或是收录于同一学科不同分支的不同数据库中;其获取方式也不是仅仅依靠一次性的信息检索从外部或是内容信息线索就可以获取的,而是要通过对这些文献数据中的内容进行挖掘,将这些原本没有关联的文献数据通过一定的逻辑关联联系起来,进而发现其内容所富含的更深层次的知识关联。

非相关文献法的实施过程始于一个研究人员感兴趣的开始词,然后利用一个文本挖掘子系统来发现一系列与开始词具有直接关联性的词,并形成一个有序的关联词列表。之后,对每一个关联词利用同样的文本挖掘子系统来确定与其直接相关的词,这些词被称为目标词。最后,目标词被聚集起来,并且基于产生该词的关联词的数量进行排序,这样就为开始词提供了一个有序的可能存在关联的词汇列表。这种方法的实施模式主要有两种,即开放式和封闭式[6]。

开放式模式的特征是可以产生科学假设,从关键概念A出发,找到与A有密切关系的关键概念B,此时的B可能有很多个,再通过这些B找到与它们有着密切关系的C,同样,C这一关键概念也不会是一个,通过某些规则找出关联度较高的候选C,以便进一步研究,证实原有的假设。

封闭式模式的特征则可以用于验证科学假设,如果有科学家或者研究人员已有了某种假设,认为当前还没有任何关系的A与C具有某种可能的联系,则可以从A和C两个方向同时出发,找出相关的多个B,其中如果从A到B和从C到B的关系越多,B所表征的内容越相似,就证明A与C有关联的这一假设成立。

2.3 基于人的情报研究方法

信息技术的影响并没有使得情报研究忽视“人”在情报研究工作中的重要作用,基于人的情报研究方法将人特别是“专家”引入到情报研究工作中,依靠专家的知识与经验,挖掘专家的隐性知识,充分发挥和调动人(尤其是专家)在情报研究中的作用。

这类方法充分发挥人在情报研究中的主观能动性,无需建立繁琐的数学模型,操作简便直观,通过专家参与可以比较准确地反映他们对于情报研究对象的意见。这类方法常与其他类情报研究方法交叉使用,发挥各自的优势,其主要包括德尔菲法、交叉影响分析法、头脑风暴法、个别访谈法等。

其中,头脑风暴法、个别访谈法以定性方法为主,德尔菲法和交叉影响分析法的出现则将很多定性问题转化为定量处理,避免了过多地主观性判断。基于此,苏塞克斯大学科技政策研究中心对传统德尔菲法进行了改进,提出了大规模德尔菲法和市场德尔菲法。这两种方法最突出的特点在于,参与的专家不再仅仅局限于少数人群,而是吸引了来自政府、企业、高校、研究机构和社会各方面的大量专家。同时,所涉及的问题非常广泛,除技术本身的发展外,还要考虑技术可能带来的经济及社会影响[7]。

2.4 基于组织的情报研究方法

基于组织的情报研究方法又称竞争情报的方法,是某一或某些特定组织为应对复杂的竞争环境和多样的情报对象而在情报研究工作中使用的方法。它立足于某一或某些特定组织的情报的收集,待收集的竞争性情报可以揭示组织的情报特征,如财务数据、客户、产品、企业战略等,通过对这些信息进行整理与分析,把看似毫无意义的信息经过比较和重新组合,最终为组织决策提供支持,进而达到提升组织竞争优势的战略目标。

基于组织的情报研究方法包括宏观环境PEST分析法、技术经济分析法、产品生命周期分析法、核心竞争力分析法、顾客满意度分析法、企业战略组群分析法、财务分析方法、定标比超法、反求工程和SWOT分析法等。这类情报方法最初应用于企业组织,目前已经在各级政府、研究机构、医院、学校等各种类型的组织中被广泛应用,并且“组织”的含义还在不断延伸,已经把共同应对相同或相似问题或事件的组织都作为研究对象。基于这种变化,又涌现出一些新的方法。比如,世界最著名的咨询机构美国兰德公司就开发出一些基于组织的新的情报研究方法[8],下面简要列举部分方法。

●远景分析法。2001年,兰德公司成立了关注长期全球政策和未来人类环境的Pardee研究中心,该中心的目标是提高思考长期未来(从35年到甚至是更远的200年)事件的能力,开发新的分析当前政策选择对长期全球潜在影响的方法。经过几年的探索,该中心建立了一套远景分析方法体系框架,包括:德尔菲法、Hyper论坛、Long Bets、世界模型、环境监测、问题管理、突发问题分析、趋势外推、动态系统分析和计算机建模、模拟与博弈、交又影响分析、技术预见、技术影响评估、环境影响评估、社会影响评估、情境分析、科学假设、直觉预见、相关树、CERT/CPM分析。

●不确定性分析法。兰德公司已经开发了处理不确定问题的严格系统方法,包括使用计算机程序帮助规划在不确定未来更好工作的战略,而不是消除这一不确定性。研究人员使用一个已有模拟模型的简单版本来决定面对未来变化情境哪种战略最有效。

●情景模拟法。情景模拟法可以模拟每种能源的供应市场、转换部门和消费部门,包括宏观经济模块、国际模块、居民支出模块、民用/商业能源需求模块、工业能源需求模块、运输能源需求模块、电力市场模块、可再生能源模块、油气供应模块、天然气输送和分配模块、石油市场模块、煤炭市场模块。

2.5 基于认知的情报研究方法

基于认知的情报研究方法主要是将哲学方法、思维方法和一般科学方法引入到情报研究中,这些方法并不是提供具体的专业知识,而是重在从情报认知的角度促使情报研究人员对研究对象的认识从感性阶段提升到理性阶段,以高于任何学科的思维方式为情报研究人员提供新的思路,以便更好地开展具体的情报研究工作,提出具有价值的情报研究结果。比如,美国著名情报学家、哥本哈根皇家图书情报学院的赫约兰德(Hjorland)和阿尔布莱奇森(Albrechtsen)将领域分析的思想引入到情报学中,实际上就是新型的基于认知的情报研究方法。他们主要从认识论和社会认知的角度,强调以领域整体为关注点,将社会因素融入到对某一个主题领域的知识整理,最终是要解决如何对特殊领域知识进行分类的问题[9]。

3 情报研究方法发展趋势

通过上述分析总结如下三点:

●各类情报研究方法并不相互平行、完全独立。比如,基于数据的方法是各类研究方法处理大批量数据的重要工具;基于人的方法可以从定性的角度控制情报研究结果的质量;基于文献的方法和基于知识的方法都是以文献及其构件为主要数据源,并且基于知识的方法是以基于文献的方法为基础发展起来的,两者之间的差别在于基于知识的方法更侧重于提供知识层面的情报,两者之间的共性在于两种方法都会经常与基于数据的方法和基于人的方法联合使用;基于认知的方法则凌驾于其他几类方法之上,以高屋建瓴的思维指导情报研究人员更科学地开展情报研究工作。

●各类情报研究方法的应用领域侧重不同。各类情报研究方法的切入点不同,基于文献和基于知识的方法侧重于科技领域;基于组织的方法围绕商业领域;基于数据、基于人以及基于认知的方法则可以适用于各种领域的情报研究工作。

●同类情报研究方法之间并不相互取代,而是更好地继承和发展。科学的发展和技术的进步,并没有使得一些早期出现的情报研究方法被取代,这些方法依然活跃在情报研究工作中。并且,这些方法还借用计算机技术,在功能上不断被深化,进而可以更好地服务于情报研究工作。一些新兴的情报研究方法也在不断地探索中前进,并时刻以早期的情报研究方法的结果作为参照,不断改进新方法。

对于各类情报研究方法的分析与总结,可以从另一个侧面反映出情报研究方法的发展方向:①就情报研究数据而言,注重处理综合数据形态的情报研究方法。由于跨学科和交叉学科的不断涌现,未来的情报研究对象主要为综合数据形态。即除了文献信息外,还包括各种科研数据、社会经济数据、人文数据等,并且数据类型复杂。因此,有必要开展处理综合数据情报、类型复杂的情报研究方法,而不是只应用现有的面向单一数据形态的情报研究方法。②就情报研究内容而言,注重开发“核心”内容的情报研究方法。现有情报研究方法从定性和定量角度可以较成功地确定研究内容的宏观发展状态,而核心内容的确定则相对比较薄弱。这里的“核心”主要是指在研究内容中识别发挥决定性作用的信息或占据主流地位的信息,在事物发展过程中正是这些信息的存在才使得事物本身发生质的变化。比如,有关科学研究的卓越性评估如何进行就是情报研究方法需要考虑的问题。③就情报分析过程而言,注重固守和完善已有情报研究方法。情报研究方法并不应该一味追求多变与所谓的“先进”,事实上,在现有的情报研究工作中,很多传统经典的情报研究方法依然活跃当前工作中。同时,对于新开发的情报研究方法的适应性、可行性以及成熟度均需要很大时间成本来验证。因此,对于情报研究方法而言,应该以灵活的态度,注重改进和完善现有情报研究方法,有效整合相关方法,利用相对稳定的方法体系发挥情报研究方法的整体功能。

收稿日期:2008-11-03

修回日期:2008-11-24 本文起止页码:29-33

标签:;  ;  

信息研究方法的发展现状与趋势_文献分析法论文
下载Doc文档

猜你喜欢