情报分析基本原理探析,本文主要内容关键词为:探析论文,基本原理论文,情报论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 情报分析的认识体系和认识论原则
情报分析是一种探求未知的理性创造活动,是社会发展到一定阶段人类自我认识的一种方式。情报分析的哲学基础在于认识论。这也是对情报分析这一社会活动进行整体认识的出发点。
1.1 情报分析的认识体系
情报分析的哲学基础是认识论。在哲学中,经典的划分是思维和物质,反映在认识体系中,可以建立关于思维的抽象体系和关于物质的物理体系。在社会高度信息化的今天,必须建立另一种认识体系——信息体系。
1.1.1 关于抽象体系:情报分析只涉及数学抽象。其基础是集合、公理和关系。
1.1.2 关于物理体系:这一体系由时间、空间和物质组成。其中,时间和空间是连续的,与单位和原点有关。物质是可数的,只与单位有关。
1.1.3 关于信息体系:这一体系建筑在物理体系之上。由信息、知识和智能组成。由认识的三个体系又引申出知识的三个层次:抽象体系中的集合、公理和关系一旦被认识即成为抽象知识;物理体系中的许多规律一旦被认识即成为物理知识;信息体系中,一切对人有关的法则、事件、数据等,一旦被认识即成为信息知识。
1.2 情报分析的认识论原则
虽然世界是个统一体,但人的观察却可以是多样的。科学视野中的世界和人文视野中的世界都有自己的内在构造。在科学的视野中,世界是客观的、有规律运动着的,科学所描绘的世界是日趋精确和细致的,也日趋抽象化和符号化,所以,科学的认识论原则取向于以物为尺度,其中贯穿的是客观性原则;在人文的视野中,人成为价值的取舍标准,即人文视野取向于以人为尺度,其中贯穿的是主体性原则,于是,世界不再只是按照“铁的规律”运作的机器,而是处处涌动着创造性、随意性和偶然性。情报分析的认识论原则必须在两种尺度之间进行选择。真正具有科学精神的认识论,通常都是唯物论;真正具有人文精神的认识论,通常都是能动主义。就情报分析的目标、对象和方法特征而言,“合情合理”的选择应该是两种尺度的交织与融通,它体现着主客体两极的相互作用与积极转化,体现着两种关照尺度的动态叠加,形成的是双视线立体交汇的世界图景。
逻辑实证主义对社会科学研究的影响无疑是巨大的,这种影响不可避免地波及到情报分析领域,表现为情报分析方法的实证化趋势。所谓“实证”,从方法论的意义上说,就是以准确性、精确性、确定性和可重复性为其基本内涵。这正好迎合了某些类型的情报分析课题的要求,如预测、评估等等。但是,追求科学并不一定要放弃人文主义,二者的结合,有时往往简单地表现为定量方法对定性方法的依赖。情报分析的对象往往包含着许多不确定因素,正是由于对象的复杂性和多变性,使研究者往往难以对对象进行充分的观察,在很多情况下,也不能随心所欲地改变或控制研究对象的状态,或者要求对同一对象作多次重复的观察。另外,在对研究对象的某一状态作出量化表达时,往往缺乏直接明了的方式,人们也许会按照一时之需而对相同的现象作出不同的数字表示,也可能对相同的数字表示给予不同的解释。所以,在现有的情报分析方法体系中,真正意义的实证方法数量极少。一些被称为拟定量的方法如内容分析法、层次分析法等更加具有活力。如果说情报分析的实证方法强调从多样性、特殊性走向统一性、一致性、简单性和必然性,那么,对人文科学方法的融合则要尽可能地兼顾独特性、意外性和复杂性。
2 情报分析的相似原理
世间万物丰富多变,但人们终究不断发现了事物间种种普遍规律,相似现象就是其中之一。所谓“相似”,就是各类事物间某些共性的客观存在。人类对相似现象的认识,早已超越了感性的认知状态,而升华为一种科学的方法论。相似原理的理论基础是关于相似的三个定律。相似原理对模型试验的指导作用是通过相似三定律实现的。
相似第一定律也叫正定律,用于描述相似现象的性质,决定着模型试验必须测量哪些量。它的全文是:对于相似的现象,其相似指标等于1,或其相似准则的数值相同。
相似第二定律也叫π定律,用于描述现象研究结果如何向同类现象推广,决定着模型试验研究中整顿试验结果的原则。它的全文是:设一物理系统有n个物理量,其中有K个物理量纲是相互独立的,则它们可表达成(n-k)个相似准则的函数关系。
相似第三定律也叫逆定律,用于描述现象实现相似的根据,决定着模型试验所应遵守的条件。它的全文是:对于同一类现象,如单值相似,且由单值量组成的相似准则在数值上相等,则现象相似。
由于分析对象的复杂性和不确定性,情报分析领域中按相似定律进行模型化研究尚有距离,但在许多情报分析方法中都有着相似原理的体现与应用。从相似原理出发来认识与归纳情报分析方法,以对情报分析方法体系产生新的认识,并由此探索新方法的开展空间,这显然是十分有意义的事情。
2.1 逻辑分类法中的相似原理
在按照事物属性的异同将事物划分为不同种类的时候,相似原理的体现是:求同求异。相似的两个不同的侧面既构成了聚类,又是分类的依据。
2.2 类比法中的相似原理
在预测研究中,搜集有关的信息与对象,以类比取得有用的、可借鉴的部分或数据是很重要的。
由于类比法是一种从特殊事件到特殊事件的推理方法。因此如果没有科学方法指导只能认为是一种原始的类比方法,称为简单共存类比。而如果移植一些其它现代方法,象通过因果、对称、协变关系等因素分析,则可使类比法由低级向高级发展。
2.2.1 因果类比:设A中属性a、b与c有关,则B中a′、b′必然与c′有因果关系。
2.2.2 对称类比:设A对象中a、b有对称关系,则如B对象中有a′,则必然可求得b′。
2.2.3 协变类比:如A对象中有f(a、b)=0的关系,则推理得到B对象中也可能有f(a′、b′)=0的关系。
上述类比法中,推理的依据是根据两个对象内部属性关系中已经确定的相互类似的性质,推出尚未确知的相互类似的性质。
2.3 内容分析法中的相似原理
内容分析法的特点是对大量样本进行特征识别,方法的操作对象是文献信息。
在内容分析中应用最为广泛的是词频分析技术和篇幅分析技术。当对所定义的词组或篇幅在样本中出现频次进行计数并作出分析和推断时,相似原理体现在:这些词组或篇幅所代表的文献在内容上具有相似性。当然,聚类并不是内容分析法的最终目的,在频数统计的基础上还需要对某一主题的词频变化或篇幅变动进行分析,或对某一时期内各主题的比例结构进行分析,由此发现事物发展的轨迹或变化趋势。
2.4 引文分析法中的相似原理
在引文分析法中,最能体现相似原理的是引文偶合聚类和同被引聚类。当两篇文献共同拥有一篇相同的引文和两篇文献同时被一篇文献所引用时,都不具有分析的意义,只有当引用与被引用超过一定规模而成类时,才是有意义的,这种状况又正好反映了不同文献之间的内在相似性。
2.5 聚类分析法中的相似原理
聚类分析法的基本思路是:把具有相似性的一些数据组合为类。相似原理已尽在其中。出于定量分析的目的,聚类判断准则是操作中的一个重要问题,一般是依据距离最小或相似最大的原则。距离和相似性是从两个不同的侧面反映同一个概念,因而具有不同的衡量尺度。就距离而言,其尺度与具体的定义有关,最典型的距离是欧几里德空间距离。就相似性而言,衡量的尺度是相似度,不同的场合所用到的各种具体的反映相似度的参数各不相同。
2.6 趋势外推法中的相似原理
趋势外推法多应用于经济分析活动中。当我们按照过去数据所表现的“趋势”在时间轴上“外推”时,是基于这样的经验;在经济发展的时间序列中,未来的趋势与过去的趋势具有相似性。考虑到在经济时序中可能包含的随机成分,应用这一方法时,必须事先假设:①影响和决定事物过去和现在的发展因素,在未来也基本保持不变;②事物的发展属于渐进变化,而不是结构性的突变。
2.7 相似系统的分析法
不同类型、不同层次的系统间可能存在一些不同数量的相似要素和相似特性。当两系统间存在相似要素和相似特性时,则两系统称相似系统,即一系统相似于另一系统。
对于任意两个系统,在比较其要素和特性时,相似的两个极端是相同和相异,而绝大多数情况是两系统间的异同处于中间状态,即系统间或多或少存在某些相似性,只是相似的程度有大小的差异。正是由于相似系统的普遍存在,从相似原理出发进行相似系统的分析研究,就具有实用意义。
系统相似性的动态分析主要包括两个方面:
①不同系统间的动态相似性;
②同一系统新与旧的相似性,其中包括发展过程中随时间变化的相似性。
运用相似系统动态分析原理,进行不同系统及其在发展过程中的动态特性变化分析,求出系统在任意时刻的相似度,通过计算不同时刻的相似度,进一步得到相似度的改变量,以便建立系统相似的状态函数。
相似系统的分析研究具有如下意义:
①由系统相似分析,可以得到不同系统间相似度及其变化趋势,以便研究不同系统之功能,判断系统演变方向及系统的结构与功能是否朝着更完善、更合理的状态发展。
②找出不同系统相似性的本质上的联系,以利于从理论上对一般规律的认识和总结。
③对于一种类型的系统特性不易研究时,可用替代系统来模拟。当然,模拟系统是否反映真实情况,则主要取决于相似系统的相似度大小。
3 情报分析的相关原理
情报分析的对象是社会系统,相关关系是一种普遍的存在。所谓相关关系,是指现象或概念之间确实存在着联系,但其联系是不严格固定的或数量关系是不完全确定的一种相互依存关系。这种相互依存、相互制约的关系是普遍的、客观存在的,它构成了事物的运动和发展。
相关关系的定性特征是:总体与部分之间、部分与部分之间存在某种关联。这种关联导致了事物的结构特征和整体特征,也体现了各部分的独立性和部分之间的相关性的辩证统一。
相关关系的定量特征是:相关关系的各方往往同时伴随出现;它们之间的变化也存在相应的大致的规律性,这种规律性一般在统计的意义上才能成立,即具备统计的规律性。
情报分析的对象本身所具有的相关关系是选择方法和建立模型的依据。相关关系表现于事物的不同方面,形成不同种类的相关关系,如性质相关、结构相关、数值相关和变量相关等。对分析方法的选择,既选择定性方法,也选择定量方法。
3.1 关联分析
对于处在普遍联系之中的某一特定层次上的一个对象而言,它的要素就是组成这个对象的基本构件。关联分析的实质是将研究对象逐一展开分细,明确其组成的基本要素,以及它们之间的相互联系。这实际上是对事物内部的从属相关关系和并列相关关系进行梳理。其定性操作的特征是逻辑相关推理。
3.2 相关分析
当研究对象中包含可观察的变量时,相关分析涉及质和量两个方面,因此相关分析实际上包括定性分析和定量分析两项内容。
定性相关分析包括,是否存在相关关系、正相关还是负相关、对称还是不对称、自变量和因变量(以及因果方向)、伪相关和中介相关等等。
定量相关分析的目的则是对相关关系的密切程度、相关方向和发展变化的规律作出数量上的认识,以便进行某种判断。对相关关系的密切程度的分析通过相关强度来确认。相关强度可以定义为在知道一个变量变化值时能够判断另一个变量变化值的准确程度。在定量相关分析中,最简单的模型是双变量线性相关,这是当两个变量的变化比率相同的情形,而非线性相关则是两个变量之间的变化率不同时的情形。当变量多于两个时,就构成多变量分析,多变量分析与双变量分析类似,不同的是,多变量分析是以一个以上的自变量来解释因变量。
3.3 回归分析
回归分析是根据具有相关关系的两个变量之间的数量变化关系,建立相关的数学表达式,进而对因变量施于推算或预测作业的过程。
当两个变量具有统计相关关系时,对应自变量X的每一个值x,因变量Y有许多可能的取值。为找出X和Y之间的定量关系,一个自然的想法是,取X=x[,0]时所有Y值的平均值(记作Y[,0])作为对应X=x[,0]时Y的代表值,亦即取
其中"(Y|X=x[,0])"表示在X=x[,0]条件下,Y的条件期望。一般说来,对于任何一个X的可能取值x,我们都可以相应取Y=E(Y|X=x),当x变化时,上式右边是x的函数,可以记为
上式就是因变量Y关于自变量X的回归方程,或称Y关于X的回归函数。Y对X的回归方程反映了在X取值变动时,Y平均状态的变化情况。
收稿日期:2000年6月19日