数字图书馆评估中人的认知因素研究,本文主要内容关键词为:中人论文,认知论文,数字图书馆论文,因素论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G250.76 文献标识码:A 文章编号:1007—7634(2006)02—0208—06
数字图书馆的认知科学研究已经引起了国外学者的关注。利泽(2001)[1] 等人在亚历山大数字地球图书馆(ADEPT)评估研究中提出了用户智力模型及其基于不同界面设计问题求解过程的认知分析,拉普(2003)[2] 等人认为数字图书馆研究应该考察人的认知处理,包括文本理解、记忆和空间认知的认知研究。最近,凌(2005)[3] 等人更明确指出,数字图书馆研究应该超越传统的检索和浏览,从人的认知活动层面进行分析。他认为,数字图书馆的认知模型有两个层面,最底层是战术认知支持层(提供用户请求检索和浏览的相关文献),最高层是战略认知支持层(不仅提供相关的文献而且直接提供用户认知问题的智能回答)。然而,这些研究或评估都没有涉及研究者或评估者自身,也就是数字图书馆评估研究的认知主体。
尽管数字图书馆的评估研究取得了一些进展,但目前仍不尽如人意[4]。不同的评估者,往往基于不同的数字图书馆概念、定义,采用不同的理论、方法,遵循不同的价值选择、取向,从而获得不同的评估效果。在实际的评估研究中,由于缺乏评估的元理论指导,我们难以对评估的各个环节做出正确的判断。面对全新的充满挑战的数字图书馆发展前景,如果只利用我们所掌握的传统图书馆评估知识,不了解、研究评估者本身的问题,就不可能很好地完成评估研究。数字图书馆建立、发展的理论与实践表明,它是一个复杂的“人工系统”(artificial system)[5]。不对这个复杂系统中人的认知因素进行研究,就无法建立科学的评估概念、理论和方法。本文从认知信息科学角度,对数字图书馆评估的认知前提、约束、过程、信息熵、模糊性和可靠性进行研究,以期建立数字图书馆评估的认知元理论。
1 评估主体的认知前提和约束特性分析
数字图书馆是一个由人(包括管理者和用户)、机器(包括硬件和软件)和资源组成的人工系统。在设计、实施、执行、建成、使用、维护、发展的每一阶段,为了确保系统工作的质量,必须进行及时、可信的系统评估和用户评估[6]。然而,无论选择哪一种评估形式,进行怎样的具体评估,都客观地存在着对评估者或评估的参与者具有一定影响的前提性认知约束。我们认为,数字图书馆评估的前提性认知是一个三维结构(见图1),它在很大程度上影响评估的过程、方法、内容和结果。
图1 数字图书馆评估的前提性认知三维结构
第一维是本体论维度,即物质实在的性质。它是一定历史时期,关于物质实在根本看法的整体模型。由于认知客体总是遵循客观规律, 不论是“自然系统”(natural system)还是“人工系统”, 世界总是在其不同时空点具体结构状态下形成的物质-能量-信息结构与分布,因而它所建构的是关于物质实在的本质、结构、组织、适应性和相互作用的总体因式。
对评估主体而言,本体论维度要求把数字图书馆看成是一个由人、机和资源构成的相互联系、相互依赖、相互制约、相互作用的事物与过程的整体。任何一个评估指标,都是数字图书馆系统的几种基本属性形成的一层一层完成其全方位整体功能的定性-定量反映。
第二维是认识论维度,即认知的原则。它是使用各种认识手段,认识对象世界所依据的基本方针。它所表现的是认知主体把一种基本属性要素纳入到整个理论、方法、目的系统中去的一般模式,也就是它们之间相互组合的特定方式。这一维度体现了认知主体的认知能力所达到的水平,划定了它在该认知阶段上的基本认识范围。
就数字图书馆评估主体而言,无论是系统评估,还是用户评估,它所依据的“理论”、运用的“方法”、寻求的“目的”是典型的前提性“认知三角形”(见图2)。这就是说,认识论维度的前提性知识是一个整体,它们对评估认识的作用是系统性的。
图2 评估主体的前提性认知三角形模型
第三维是价值论维度,即认知目的具体的选向。它表现一定目的的需求选择和利益取向,是认知主体同客体发生认知关系时的社会性中介。由于数字图书馆认知主体总是定位于一定的社会经济、政治关系之中,扮演着特定的社会角色,服从某一社会集团的特殊活动原则和目标原则,从而也就规定了他们在处理同客体关系时所可能采取的态度、立场、方针和视角。科学社会学家范·登·戴尔(W.Van Den Dale)曾把价值论称作“调整知识生产的规范”,认为这些规范直接制约着“对世界秩序性、对自然界不变规律等等的信念[7]。
对数字图书馆评估主体而言,价值论维度应该满足某种要求,包括以下最基本的认知目的选向:评估规范的选择,即评估的目标、框架、观点和标准的选择。例如,评估的标准是什么?选择评估标准的关键是什么?选择某个标准的目的是什么[8]?
数字图书馆评估认知的三维结构直接影响到评估的过程、内容和结果,而不是一般的认知约束。首先,从认知的产生来看,数字图书馆评估的认知不是逻辑推论性的,即不是从理论原理演绎推导出来。数字图书馆评估的认知是在整个文化结构中、在一定社会思潮背景中,通过社会文化群体的复杂交往关系和多种社会意识要素的相互作用而积淀起来的,它往往是以潜在的、“非意识的”方式进行。
其次,从认知的结构来看,数字图书馆评估的认知并不是严格的概念逻辑系统,不能进行公理化、形式化的建构。它的认知结构更多的是作为一种思维定势,表现为一些规范性的约束原则,但并不呈现要素形态。
最后,从认知的作用上来看,数字图书馆评估的认知并不具有直接的解释功能。它不能作为证明的前提和工具,正如它不是实例的总和一样。它的认知规定“能解释什么”和“不能解释什么”,但却并不对此提供严格的合理性论证,没有强制性或必然产生的认知结果。
正是由于数字图书馆评估的认知具有本体论、认识论和价值论的三维结构,才形成了对评估认知的产生、结构和作用带来影响的前提性认知约束(非强制性认知约束),从而才会出现各种各样的数字图书馆评估方法、理论及其实践。
2 数字图书馆评估的认知过程与信息熵
人类对事物可能的运动状态的认知过程,揭示了认知主体和认识对象以及把它们联系在一起的信息所构成的认知运动模型。对象(事物)运动的状态方式是一种本体论意义的信息,被主体所感知的该对象运动的状态和变化是一种认识论意义的信息。图3包括了数字图书馆评估的四个认知过程单元。
图3 数字图书馆评估的认知过程
感知评估:完成本体论意义的信息向认识论意义的信息的感知,形成认知意向的直观评估。
识别评估:对所感知的信息进行辨识、分类和选择,形成感知信息的理解评估。
分析评估:将识别出的信息与旧知识联系,形成适当形式的转换、升华、提炼、综合的判断评估。
再现评估:在信息分析的基础上获得关于对象运动的规律性认识(即再生更为本质的信息),建立针对客体对象的策略,形成适当方式表现出来的再生评估。
其中,感知评估、识别评估是最基本的基础性(认知)评估,分析评估、再现评估是建立在感知评估、识别评估之上的结论性(认知)评估。只有当上述所有过程单元都发挥正常作用时,主体才能从本体论意义的信息中提取认识论意义的全部信息,从而形成有关客体对象的正确评估,并在这个基础上再现出反映主体认知意志的信息,并通过它的反作用实现对客体对象的变革。
但是,在实际的评估研究中,评估主体可能是由从事数字图书馆工程设计、实施、执行和管理方面的专业人员组成的系统评估工作组,也可能是由学院、大学和公共图书馆参加的终端用户评估工作组,甚至大量的可能是那些对数字图书馆设计和评估感兴趣的参与者或志愿者。前两者的任务是从评估的角度提出和回答每一认知过程的各种问题,后者的任务只是接受调查回答感知评估、识别评估过程的部分问题。因此,我们必须深入地研究前提性评估和结论性评估的认知原理。
前面我们已经说过,评估的前提性认知是一个三维结构,它对评估的产生、结构和作用是一种特殊的认知约束,但不是必然产生的强制性的认知约束。这种认知特性可以用信息熵理论来说明。
人们通过感知评估和识别评估过程,获得了关于评估(事物)信息源的一定了解,减少了不确定性,即从这个信息源获得了信息。假定评估的事物x的概率为p(x),则该事物包含的不确定性,可以用该事物所包含的信息熵H(x)来表征:
H(x)=-logP(x)
当认知主体获得了评估事物x的全部信息(即得知哪一个认知状态实际出现)时,上述不确定性即信息熵H(x)就被完全消除了。这时,认知主体所获得的语法信息量I(x),就等于它所消除的不确定性数量:
H(x):I(x)=H(x)
信息熵具有对称性、非负性、扩展性、可加性、极值性、确定性、上凸性、递推性等特点[9—10]。为了叙述简捷,本文中约定事物△的个数或可能运动状态的数目记为N[,△]。
定义 假定评估事物x具有Nx个可能的认知状态的概率空间为:
认知主体通过各种认识过程获得任一信息源x[,i]的特征信号为y[,i],认知主体从y[,i]中获得的关于x[,i]信息量记为I(x[,i];y[,j]),称为交互信息量。如两个信息源X[,1]、X[,2],认知y[,1]和y[,2]的随机性大,信息源Y 的信息熵也大;而认知X[,1]和X[,2]随机性小,信息熵也小。
由于认知过程准确度的差异和各种干扰因素的影响,y[,i]不可能包含x[,i]的全部信息。则有:
I(x[,i];y[,j])=I(x[,i])-I(x[,i]│y[,j])=(-logP(x[,i] ))-(-log(P(x[,i]│y[,j]))
y[,j]代表的概率空间表示为:
认知主体从y中获取的平均交互信息量记为I(X;Y),获知y后仍然对信息源X的不确定度称为条件熵,记为H(X│Y)。并有以下结论:
I(X;γ)=H(X)-H(X│γ)
从认知的角度看,过于冗杂的信息源知识体系,容易掩盖评估问题的本质,增加了发现有用特征和规则的难度,使不确定的评估问题变得更加模糊,降低了评估的准确率和效率。从广义信息论意义上,称这一过程为认知领域的主观反作用。
3 数字图书馆评估的认知模糊性与可靠性分析
数字图书馆评估的认知信息主要是一种模糊性信息(当然,有些认知信息也具有确定性)。评估的原始信息实质上是一个信息全集,因为它既包含了未被认知的最原始信息,也包含了已被认知的信息。而且,认知信息全集具有高度模糊性,一些信息只有部分个体或具有相近认知能力的个体类(即人群群体,简称群体)能够通过意会思维了解和掌握,而这种只能意会的认知信息是模糊性最高的认知信息。当然,高度模糊性信息和一般模糊性信息经过认知信息处理后,具有转变为确定性知识的趋势,即变为具有低度模糊性信息的知识,或者变为具有确定性信息的知识[11]。整个认知信息处理过程正如钱学森所指出的是“从模糊到清楚”[12]。
对我们的研究而言,在感知评估、识别评估的认知过程单元,认知信息是一种原始的或初级的模糊性;在分析评估、再现评估的认知过程单元,认知信息经过反馈处理变成一种低度模糊性信息或具有确定性信息。认知信息的模糊处理至少有三个主要方面:模糊对象、模糊价值和模糊规则。
对于模糊对象来说,一个模糊对象是一个可能有几种成员的集合或类型。例如,数字图书馆的技术性能可以用系统的功能结构及其完善程度、安全性、互操作性等成员或类型来描述。如果知道了对象属于某一个集合,其成员值是1; 如果对象不属于一个集合,则成员值就是0。但是,对于所考虑的大部分模糊对象, 它的成员值将处在如“很好”、“好”、“一般”、“不好”、“很不好”即0和1之间。通常,在推理的过程中,成员值增加,表明模糊信息正在减少,即获得的确定性信息推理过程正在进行。如果我们要在两个不同类型的数字图书馆平台之间做出选择,我们将为每一种平台定义为一个类,每一类具有一个成员值。一开始,两个成员值均可以预设为0.5,表明在两种类型中存在一个潜在的相等关系。以后规则表明平台很可能是或不是一种类型或其他类型,就将调整成员值。最后进行过程推断,结论性(认知)评估的可取之处很可能是具有最高成员值的那种类型。
对于模糊规则来说,模糊规则是在任何给定的时间可以或不可以给予适用的规则。例如,一个专家可以说“通常,在一所重点大学应该采用一个数字图书馆平台”。 “通常”这个词代表一个模糊规则,因为在特殊场合中,规则可以是不适用的。把适用范围值设置在0和1之间以表示模糊规则的适用范围。其值为1表明规则总是适用的,而值为0表明规则不能应用。给每一规则联系一个特殊的加权系数,它可以是其他信息的一个函数,一个简单的模糊规则的过程就能够完成。如果一个“通常”规则适用,它可以赋予0.75的加权因数,而如果“很少”适用,它可以有一个0.1的加权因数。一般地讲,模糊规则的应用是直接的。依据规则评估获得每一类项目继承的成员值。根据规则加权因数修改这一成员值,然后用来调整一个对象的相关类型成员值。修改可以是放大的,依据规则取一个最大值或最小值,或某些其他函数。同样成员调整持有不同函数形式,这取决于规则和模拟情况。
对于模糊值来说,模糊值是一个受不确定因素支配的值。例如,“完善”是一个模糊值,因为它指的是数字图书馆的功能结构完善程度,但特定的功能结构完善程度并没有被准确地表明。模糊值的表示是有些困难的,因为通常准确的数字才能用于模糊信息的认知或计算。表示模糊值的准确方法将需要通过实验确定。可是,表示这样的值的最佳方法看来似乎是以一种成员为基础的。例如,对于一个特定功能的完善程度可以设计为一个特定的方面,其完善程度的等级可以是“很完善”、“不完善”、“很不完善”。在这种情况下,我们可以断定一个特定的方面有一个很不完善的成员值为0.1、不完善的为0.2、很完善的为0.9。这意味着几乎不考虑“完善”的,很少考虑“中等”的,且几乎总是考虑“很完善”的。
原则上,模糊对象和模糊值有许多共同点。主要的不同点是模糊值是对象的特性,而模糊对象是一个实际对象。这样,平台可以是一个模糊对象,而功能结构完善程度就是一个模糊值,因为功能结构是数字图书馆平台的一个属性。
一个模糊信息认知处理系统依据每一步认知做出推理、决策。并且,在推理早期做出的认知决策能够有效地修剪评估树以避免后续的规则评估失误。在模糊系统中,每一个适用的规则必须被评估,且它对认知决策过程的影响必须是加权的。仅仅在所有模糊规则已经被评估、所有模糊值被分类、且所有模糊对象成员值已经被评估的时候,才能做最终完成模糊信息认知处理。理论上这一过程是类似于允许评估专家组的每一个成员有他们的发言权,依据他们的声誉和经验赋予不同的成员加权值,然后采用最终的加权值。至于模糊信息认知处理中相应的模糊数学计算或模型不是本文的任务,读者可以参考其他文献[13—14]。
模糊信息认知处理在数字图书馆的评估中大量存在,评估者的主要任务就是消除认知信息的模糊性。消极的避免使用不确定性信息是不完整的处理方式,甚至是有害的,不可能圆满地完成评估研究。
然而,由于数字图书馆评估的认知过程的复杂性,任何信息认知处理方式都不可能是十全十美的。假定数字图书馆的评估研究已经完成,我们还必须进行一次认知过程的可靠性分析。数字图书馆评估的认知过程可靠性,主要通过主体的自为形式与客体的自在形式进行认知耦合。但是,由于认知主体的介入,其评估的观念实在与被认知的客观实在的差异可能被认知过程夸大,尤其是在分析评估和再现评估的过程单元。也就是说,评估的观念实在借助主体智能时放大或缩小了认知可靠性,并反作用于客观的数字图书馆评估对象。
种种评估实践表明,在人们的认知过程中存在大量的记载下来的误差或偏见[15],极大地影响了评估的认知可信性。人们往往低估或放弃前面的概率,使用概率范围中的末端和中间值,而不是全部范围内的值,并根据最初的评估来决定他们的评估结果。
当然,认知过程的误差或偏见并不局限于概率处理方面。一系列的实验表明,系统化的错误模式出现在许多看似简单的分析研究过程中。例如,逻辑推理表明如果“A包含B”是真,并且“非B”为真,那么“非A”必为真。然而,许多人且无论是非专业人士还是专家,在这个规则上经常犯错误。一方面是由于不会用倒置方式进行推理,另外也取决于A和B实际代表什么。换句话说,评估者是被认知内容影响的。这意味着评估过程的准确性,不能完全依赖评估工作组成员或参与者(实际上包括任何人)的判断[16],必须进行最终的可靠性分析。
在某些场合中,比如在两个数字图书馆的检索系统中,如果查全率或查准率基本相同,我们就判断不出哪个系统性能更好。目前,国内外通常引入概率中的方差的方法来考察系统的稳定性和可靠性[17—18]。这里,我们进一步提出一种基于方差的可靠性方法。
可靠性分析是检验数字图书馆评估结果一致性和可信度的基本指标。可靠性高的评估,表明评估结果很少受随机认知因素影响,评估能真实、可靠地反映出不同数字图书馆的真实水平。测量可靠性的方法很多,本文推荐采用克龙巴赫R 系数法(Cronbach):
式中,k代表评估项目总数,S[,x][2]代表全部评估项目总分的方差,S[,j][2] 代表第j子项目得分的方差。
可靠性是衡量一个评估研究质量高低的重要指标之一。可靠性不合要求的子项目是不能使用的,在编写数字图书馆评估项目研究报告时要特别重视评估子项目的可靠性分析。根据该计算方法的特点,评估子项目可靠性的评价标准为:R>0.9可靠性最好;R>0.85可靠性较好;R<0.7可靠性偏低。
4 结论
认知科学使人的思想、行为、心理等认知过程具体化和科学化,包括在这些领域中的数字图书馆评估研究应该怎样构建,如何理解认知信息过程,评估研究中各种认知因素及其认知主体和客体之间如何相互影响等问题,是一个非常复杂的研究课题。我们从评估主体的认知前提和约束特性分析、数字图书馆评估的认知过程与信息熵、数字图书馆评估的认知模糊性与可靠性分析等方面,尝试建立一种元科学的理论用以指导数字图书馆的评估研究,只是这项复杂课题中的某些方面,还有许多系统性的问题等待我们进行深入地科学研究。
收稿日期:2005—07—15
基金项目:四川省高等学校图书馆、情报与文献学规划项目(2003433)