文献计量法与内容分析法综合研究的方法论来源与依据,本文主要内容关键词为:方法论论文,计量法论文,分析法论文,文献论文,来源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 综合研究的方法来源
研究文献信息本身达到一定量时所反映出的规律及变化,透过信息来考察所表征事物的状态及变化,以及通过对信息量和内容的统计分析作出正确判断与决策,是文献计量法与内容分析法产生与应用的出发点。毫无疑问,这些也是文献计量法与内容分析法综合研究的目的。但是寻根溯源,两种方法综合研究的出发点是支撑“数据—信息—知识—智慧”(DIKW)转换的实现。因为一定量的信息所反映出的规律及变化,透过信息考察事物,这些都是将信息转换为知识所得到的;而通过信息的计量与内容的分析作出判断与决策,是将知识转换为智慧的结果。
1.1 数据—信息—知识—智慧链
关于数据、信息、知识、智慧的概念至今仍有争议,但是关于这几个概念之间是分层次而且有着清楚关联的认识,却取得了比较普遍的共识。来源于T.S.Eliot的“Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information”诗歌中的“数据—信息—知识—智慧”链[1],不仅为人们在网络信息环境中指引了有效利用资源的路径,而且为信息服务机构指明了充分开发资源的方向。
数据、信息、知识、智慧的转化是复杂的,关联多个方面,涉及许多环节,可从一维、二维不同角度来阐述它们之间的关系,如从对事物的理解(Understanding)、关于事物的上下文(情景)(Context)二维角度来阐明数据、信息、知识与智慧四者之间的关系,可以得到如图1所示的描述[2]。
图1 DIKW层次模型的一种表述
在图1中,数据(Data)是未加工的符号,脱离上下文它的存在是没有意义的,可以任何形式存在,可以有用也可以无用,但是数据可以被加工、挖掘。当数据与情景相连时,借助于调查、吸收等理解活动,通过分析数据间的关系并加工集成为信息,它隐含的意义就可以揭示出来。信息(Information)是通过关联连接手段被赋予了意义的数据,这种“意义”可以有用也可以无用。信息可被传递、相互转换,是明晰的、自治的和可计量的,信息也可以许多种状态存在,可以是定性的或定量的。当通过人类的加工、解释、集成创造、传输、分发等一系列的理解活动,零散的信息通过关联加工与分析并用于行动时形成关于整体的情景,信息转化为知识。知识(Knowledge)是由认知者内在化产生的,认知者通过他的理解和经验,借助解释、集成、交互等一系列理解操作活动,将有关联的信息和隐含在其头脑中的认知共同地组合在一起,形成的关于某个情景整体的认知。智慧(Wisdom)是推断的、不确定的、无概率的,智慧的形成需要将过去所有的知觉层次上的知识连接起来,透过认知者间的交互及自我反省而利用知识产生的。如果说数据、信息乃至知识是过去的、由经验而来的,那么智慧关心的是未来,是产生利于行动的新奇的认知,它含有暗示及滞后影响的意味[3-4]。
简言之,信息是对有关系的数据进行处理而得到的,它的有用性在于回答是“Who”,“What”,“Where”,“When”等问题;知识是数据、信息经应用转化而来的,在于回答“How”问题;智慧是对“Why”理解是否正确的估测[5]。
1.2 DIKW实现的支撑要素
在人类认知与行动中,数据、信息、知识转化的最终目的是形成具有创新性、并用于行动决策的智慧。这个转换,一方面始终离不开对数据、信息所表征的事件情景或者文本(文献)上下文的依赖;另一方面需要借助于理解的系列操作,如调查、吸收、操作、交互、反省等理解环节。此外,不可缺少组织机构、人、方法、技术的支持。从图书情报工作管理的角度来看,对应于理解的系列操作就是组织过程、分析过程、评价过程和决策过程,而这些过程有效的运转取决于方法与技术、人及相关的工作、组织机构、资源、设备与制度等要素。借鉴已有的研究成果[6],架构了DIKW实现的支撑要素图,如图2所示。
1.3 分析方法与技术在DIKW链中的作用
分析过程是DIKW链中承上启下的环节,从DIKW上一链来看,由数据到信息的组织过程主要实现的是数据的集结与序化,随着方法的成熟与技术的进步,组织环节相对比较简单,而分析过程实现的是大规模信息向知识的转化,需要经过比较、演绎、推理、综合、建模、解释等复杂活动,并与人的主体意识、特定需求结合,分析过程是一种高级的活动。没有一定的方法与技术的支持,也就是没有思维的工具与材料,人的思维是无法达到期望的高度的。从DIKW下一链来看,分析的结果直接影响着评价与决策的过程,尤其是当人无法直接处理与鉴别大规模的信息时,人对分析过程的依赖程度就会加强。所以,分析方法与技术的完善程度和科学与否,决定着分析结果的输出。
图2 支撑DIKW链实现的要素关联图
1.4 支撑DIKW链有机实现是文献计量法与内容分析法
综合研究的出发点依赖于文本(文献)产生的文献计量法与内容分析法等信息分析研究方法,一直试图对人类理解等操作行动给予支持。文献计量法和内容分析法都是专门的信息分析方法,在原有的研究中,人们常常单从分析过程来考虑建构各个分析方法及体系,而忽略分析过程与其他环节的相互作用。将支撑DIKW链实现为文献计量法与内容分析法综合研究的出发点,其目的是以支撑DIKW链的整体有效流动为根本,以数据、信息作为研究对象的来源,以产生智慧和行动方案作为研究的最高目标,方法体系的构造与流程设计要紧紧围绕着D-I-K-W转换而展开,以避免从某个层次或局部思考带来的顾此失彼。
2 综合研究的方法依据之一——信息哲学与DIKW转化
2.1 信息哲学的起源与理论体系
2002年,以牛津大学哲学家F.弗洛里迪(Floridi)在西方哲学界权威性期刊《元哲学》(Metaphilosophy)上发表的《什么是信息哲学》为标志,信息哲学作为一个独立的研究领域诞生了。弗洛里迪认为:信息哲学主要涉及两方面的研究,一是信息的本质的研究及其基本原理;二是信息理论和计算方法论对哲学问题的详细阐述和应用。信息哲学提供了不同于数据通信的定量理论——信息论的研究,从整体上看,它的任务不是要发展关于一种科学的统一理论,而是一个整合的理论体系,目的是分析、评价和解释信息的各种原理和概念、信息的动力学和利用,特别关注的是来自不同应用背景和与其他主要哲学概念,诸如存在、知识、意义等相关系统的问题。信息哲学不仅是一个新的领域,而且还提供了一种创新的方法论。信息哲学的兴起意味着一系列的转换,如从康德传统转向莱布尼茨—罗素传统(“普遍语言”和“符号逻辑”),从现实世界转向可能世界,从语形学转向语义学,从证明论转向模型论,从经典逻辑转向现代逻辑,从追求历时的同一性转向追求共时的相似性,从“发现的范围”转向“创新的范围”,等等。在哲学上,这种变化实际上就是从“形式的先验性”转向“实质的先验性”,也就是强调“信息转向”。信息哲学作为“引导性哲学”(Orientative Philosophy),而非“认知性哲学”(Cognitive Philosophy),将引领人们将探讨的兴趣从认知性哲学关注“什么”,转向“引导性哲学”关心“如何”上,更加关注如何利用信息改变这个世界。
2.2 信息哲学中的信息类型与信息的质
信息哲学的诞生与发展,不仅给哲学带来了一场全新的革命,而且为人类提供了全新的事物存在与演化的世界图景和思维方式。在信息哲学的理论中,信息是标志间接存在的哲学范畴,它是物质(直接存在)存在方式和状态的自身显示。信息是由自在信息(客观间接存在)、自为信息(信息的主体直观把握)、再生信息(信息的主体创造)构成的。自在信息的基本形式是信息场中信息的同化与异化,自为信息的基本形式是信息直观识辨和有感记忆储存,再生信息的基本形式是概象信息和符号信息。信息的质具有3个层次,信息第一性级的质是直接存在的一级客观显示,就是人们直接感知到的信息的内容;信息第二性级的质是直接存在的多级客观显示,是人们不能直接感知和简单把握的,需要类似翻译转换和挖掘分析等工作的支持;信息第三性级的质是由主观赋予目的性而产生的新内容,这个第三性级的质所揭示的信息的人为创造的关系,一旦通过人的劳动时间外化出来,就是对世界的改造[7]。
2.3 基于信息哲学的DIKW转化
从信息哲学的理论来看数据、信息向知识、智慧的转化,知识是由再生信息与人的主观意识结合的产物,知识和智慧是信息第三性级的质所揭示的结果。D-K-I-W的流动只有经过自在信息—自为信息—再生信息环节,才能在本质上实现信息的迁移。信息哲学中人的信息活动的层次递进关系清楚地表明:信息主体创造的基本形式,即概象信息和符号信息,必须经历主体约定信息关系的建立、判断、推理和逻辑推演等认识阶段。
信息主体创造活动产生的是再生信息,以概象信息和符号信息的形式存在。概象信息是形象思维的产物,是通过对记忆储存的信息重新分解与组合加工的结果,是对诸多同类认识对象共同本质特征的形象反映(类概象),或是不同类认识对象不同特征的硬性组合的形象反映(幻概象);符号信息是抽象思维的产物,当符号信息在量上达到一定程度,在质上显示不同符号之间的多方面关系时,人们就可能产生抽象思维。抽象思维是借助人类特有的语言和神经系统而对符号信息进行逻辑推演、加工改造的高级分析综合的过程,它可以使符号信息更加高度抽象。再生信息是由自为信息转变而来的,再向主体信息的社会实现转移,其中,再生是通过重新分解与组合加工也就是分析综合而实现的。在这个实现的过程中,除了人的大脑外,还需各种思维方式与思维工具。显然,数据、信息向知识的转化主要依赖于信息主体创造活动,主体约定信息关系的建立、判断、推理和逻辑推演等过程及方法,直接影响着信息向知识的转化。笔者以信息哲学中的“人的信息活动的层次递进建构”为基础,以图的形式简单来描述DIKW链中数据、信息、知识与信息哲学意义上信息之间的关系,见图3[7]。
图3 基于人的信息活动的数据、信息与知识的转化
2.4 分析综合作为文献计量法与内容分析法综合研究的核心方法将贯穿于始终
从信息加工与转换角度看,形象思维可以理解为主体运用表象、直感、想象等形式,对研究对象的有关形象信息(信息哲学中的概象信息),以及存储在大脑里的形象信息进行加工(分析、比较、整合、转化等),从而从形象上认识和把握研究对象的本质和规律。形象思维是对问题整体、概略和方向性的把握,人们常常借助定性分析来培养形象思维的能力。抽象思维凭借科学的抽象概念对事物的本质和客观世界发展的深远过程进行反映,使人们通过认识活动获得远远超出靠感觉器官直接感知的知识。科学的抽象是在概念中反映自然界或社会物质过程的内在本质的思想,它是在对事物的本质属性进行分析、综合、比较的基础上,抽取出事物的本质属性,撇开其非本质属性,使认识从感性的具体进入抽象的规定形成概念,使人能在认识客观事物规律的基础上预见事物和现象的发展趋势。人们常常重视利用定量分析来培育抽象思维能力。无论是形象思维还是抽象思维,分析、比较、综合、判断、推理等过程是必不可少的。
在传统的哲学观点上,人类认识信息的感知、判断、推理过程,认识信息的比较、分类、抽象、概括、归纳、演绎、类比、分析、综合的方法,都是相互独立且分别给予定义和分析的。但是从信息哲学的角度来看,在认识信息的活动中,分析综合贯穿于信息认识过程的始终,分析综合是认识过程的统一,是认识方法的统一。
分析就是将事物“分解成简单要素”分别加以研究的一种思维方法,它可以将认识对象的某些方面,因素、属性、联系、关系等分割、区别开来加以认识;综合就是“组合,结合,凑合在一起”,也就是说,把分解出的事物各组成部分、要素,在研究清楚之后再连接起来,以新的形象展示出来。综合的作用在于把个别上升为一般,把部分统一为整体,把片面概括为全面。分析和综合的关系是辩证的对立统一,它们以事物的整体和部分,一般和个别的关系为其根据。信息哲学将分析与综合统一,重新阐释并赋予分析综合新的意义,认为分析综合是人类精神活动统一的过程,是分解和组合、比较和分类、抽象和概括、归纳和演绎、类比等具体方法的统一,是求同判断、别异判断、归纳推理、演绎推理等逻辑规律的统一[7]。
文献计量法与内容分析法等作为辅助思维的工具,在人类的信息活动中主要支撑的就是信息主体创造活动。那么信息主体创造活动所需的认知与思维过程、方法与逻辑,就应该是两者综合研究的核心方法选择的依据。所以,将文献计量法与内容分析法在分析的基础上进行综合研究,来源于信息哲学思维的启迪。同时,将分析综合作为综合研究的核心方法之一,取决于信息哲学的方法论。
3 综合研究的方法依据之二——认知心理学与DIKW转化
3.1 认知心理学中的知识建构模型
认知心理学是20世纪50年代中期在西方兴起的一种心理学思潮,20世纪70年代成为西方心理学的一个主要研究方向。它研究人的高级心理过程,主要是认识过程,如注意、知觉、表象、记忆、思维和语言等。思维是高级的、整合的心理活动形式,人脑对信息的处理包括分析、抽象、综合、概括、对比等的具体过程,这些是认知思维的最基本过程。
根据认知心理学,知识表征和思维的关系就像数学、文字和语文之间的关系。知识是以符号的形式进行描述的,人的认知系统具有识别、编码、存储、检索和提取这些符号的功能,并以此来反映心理的运作过程。知识在大脑中的心理表征形式有概念、类别、特征、命题、脚本、图式、表象、心理模型、产生式规则等,知识总是分门别类地存储在人的头脑中,人类以不断进化的思维模型建构着知识,再经组合与创新的知识认识世界和改造世界。
Collins和Quillian提出语义记忆的层次网络模型,以解释知识在人脑中存储的主要结构。这个模型是认知心理学上第一个语义记忆模型,在这个模型中,语义记忆的基本单元是概念,每个概念具有一定的特征。在知识建构中,如果仅考虑语义关系时,不论是言语还是非言语信息,大都是以抽象命题形式进行编码,存储在人的长时记忆中。存于人脑中的命题及其相互之间的联系形成一种网络系统,这个网络系统由节点(Node)和链接(Links)组成,节点是以概念为基础的陈述性知识,而链接则代表概念之间的关系及概念特征之间的关系,通过链接,把上属与下属概念联系在一起,也把节点所包含的特征联系在一起,这种概念之间的关系称之为结构性知识。人们头脑中语义网络所表征的知识的各个要素相互联系、相互作用,形成了具有一定心理结构的网络。具有语义联系和语义相似性的节点连接起来,组成复杂的网络。节点之间连线的长短表明了概念之间的关系,连线越短,表明两个概念之间具有更多的相似性,节点之间的阈限也就越低。相反,节点之间的连线距离越长,概念之间的相似性程度越低,节点之间的阈限也就越高[8-9]。Collins和Loftus在考虑语义相似性后提出了激活扩散模型,该模型假定:当一个概念被加工或受到刺激,该概念节点就产生激活,然后激活沿该节点的各个连线,同时向四周扩散,先扩散到与之直接相连的节点,再扩散到其他节点。D.H.Jonassen等人将领域知识明确地划分为陈述性知识、结构化的知识和程序性知识3种类型。陈述性知识是事实真理的描述,它是以概念为基础的,依赖于工作记忆中的独立的微成分(微认知单元),无须要知道为什么;结构性知识是陈述性知识之间的关系;程序性知识是一种自动化认知的能力,也就是将若干基本的陈述性知识及其相互之间的关系,组合成一种过程性知识,而这种过程性知识在思维过程中激活是自动产生的,而不要追溯到最原始的陈述性或结构性成分,不需要进行更细致的推导。
在综合激活扩散模型和领域知识分类的基础上,Chan等人提出了可操纵的OCTR学习模型,即定位(Orientation:与原有知识发生关联),训练(Coaching:学徒式的学习),调整(Tuning:新知识与旧知识相互作用,形成新的图式或认知结构),自动化(Routinization:通过练习或将新的知识网络应用于实际环境中,形成一个自动化的微认知单元)。并构建了与OCTR对应的知识结构模型:连接(Connection:在原有认知结构和新知识之间建立起较弱的链接),扩散(Accretion:知识得到扩展,更多的弱链接建立),调整(Articulation:认知结构对建立起的弱链接进行选择,有一些链接被增强,有一些链接被删除),整合(Solidification:单元和链接得到加强,可形成自动化操作)。如图4所示。
图4 OCTR对应的知识建构的4个阶段
3.2 知识的关联及获取途径
从上述可知,人的知识结构是通过寻找知识之间的关联建立起来的。当知识关联置于领域知识中寻找的话,可从领域知识的构成中获取,如根据Jonassen划分的领域知识类型分辨陈述性知识、结构化知识和程序性知识,或者根据领域知识域来分辨,通常一个领域知识由核心域(Core Domain)、内在域(Internal-context-domain)和外在域(External-context-domain)3个方面构成。如医学的知识核心域包括病症、迹象、病诉和实验结果,内在域包括医疗的目标、假设、期望,外在域包括关系到可能的条件和环境的概念[10]。当知识关联无法完全置于领域知识中,或者不考虑领域知识构成,仅仅考察概念所表达的知识之间的关系,如等价关系、类属关系、结构关系、先后关系、因果关系、条件关系时,知识关联获得的途径有:特征提取、从属关系、因果关系、共现关系等[11],如表1所示。
3.3 在知识关联建立中信息向知识转化
根据OCTR认知模型,知识在建构过程中,经历了连接、扩散、调整与整合,使知识之间的关联程度不断得到确认。知识关联的建立是通过考察概念之间的关系实现的,在语义网络中,当两个节点之间通过其共有特征有越多的连线,则两个概念的联系越紧密,通过这两个概念建立起知识关联的程度也就越大。而概念的特征是由信息来表达的,也就是当概念之间有越多的共同信息时,由概念所表示的知识关联就越多,关于事物整体情景的描述就越清晰。所以,从大量信息中抽取表示零散知识的概念或词汇,通过关联建立就可以实现信息到知识的转化。图5表示的是大量信息特征—建立概念的关系—知识关联分布的示意图。
3.4 聚类与解释作为可操作的核心方法支撑文献计量法与内容分析法的综合研究
根据认知心理学理论,整合使单元和链接得到加强,概念之间联系越紧密,知识之间的关联就越强,知识结构就越能建立起来。知识关联的建立是体现思维活动的重要方面,支持事物关联建立的方法有归类、演绎、理解、推理、解释,以及多元统计学的聚类、映射、回归,等等。从知识关联获取的途径可知,共现是获得知识之间关联的重要途径。当共现的连线越多,由知识建构模型可知,共现的概念之间的关系越紧密。而在支持事物关联建立的方法中,聚类与解释是共现实现必需的工具。聚类是把一组个体按照相似性归成若干类别,即“物以类聚”。它的目的是使得属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。解释是分析阐明,如经过无数次的研究和实验,某种自然现象得到科学的解释。解释是说明含义、原因、理由等。共现的概念通过聚类技术使概念之间的连线得以建立,解释给聚类后的概念关系以合适的阐明。而经过聚类技术支持的共现结果,恰好显示出与知识建构模型相似的网络图形。见图6。
总之,在宏观上,以信息哲学为依据,为综合研究的核心方法确定方向和思路,分析综合方法将贯穿于文献计量法与内容分析法综合研究的始终;在微观上,以认知心理学为依据,为综合研究选择可操作的核心方法提供理论支持,聚类分析技术将是文献计量法与内容分析法综合研究的有力工具。