情报学研究中的领域分析范式,本文主要内容关键词为:情报学论文,范式论文,领域论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言 情报学主要关注的内容是情报与情报之间的交流,不同学者对该现象从不同角度进行研究便会形成不同的范式或学派。张新华[1]依据理论基础、研究对象和范围、对相关学科的借鉴、研究方法和应用目标等标准将情报学划分为古典信息理论派、社会传播派、智能过程派、属性结构派、决策功能派和系统理论派6大流派。卢泰宏[2]根据情报学交流过程的不同方面,将情报学的规范划分为S规范(情报源)、T规范(情报传递)和U规范(情报利用)。将情报学研究划为客观范式、交流范式、行为范式和认知范式4个范式[3]。随着信息技术的发展和人类信息活动的逐渐深入和广泛,情报学中的基本范式也在发生变化,库恩[4]提出前学科(没有范式)、常规科学(建立范式)、科学革命(范式动摇)和新常规科学(建立新范式)的科学知识增长模式;运用历史分析的视角,将情报学的范式分为战前的社会事业机构范式,战后的认知观框架、物理范式、认知学派与其他范式[5];王芳[6]将情报学的主要范式归纳为物理范式或信息检索范式、认知范式、资源范式、管理范式、经济范式、过程范式和其他范式。 可见,传统认知模式着眼于个体的“心智模型”——社会中不同的人会有不同的范式,因此,这样的归纳方法缺乏普适性和一般性。立足于社会学视角,传统认识论自上而下将个体智慧作为社会文化的集成,试图从认识论的框架内解决该问题[7]。20世纪60年代初期,在心理学领域,研究人员将“信息需求、信息意识”等方法引入情报学。进入70年代,认知科学的研究领域也从心理学逐步延伸至人工智能、社会学、人类学等学科的综合性研究领域[8],这一延伸的同时也对情报学的研究产生了影响。20世纪90年代丹麦情报学家提出了“领域分析范式”,该范式立足于知识领域对信息交流与信息系统、信息需求与相关标准等内容进行审视[9]。 自20世纪90年代领域分析范式所代表的社会学与情报学结合开始,领域分析方法便受到越来越多情报学领域学者的关注,该范式在情报学理论与实践中也得以广泛应用。本文旨在对领域分析这一认知学派新范式的起源、构建方法以及在情报学中的应用现状进行阐释,揭示出当前领域分析范式在我国情报学应用研究中所存在的问题。 2 情报学传统认知范式与领域分析 2.1 情报学传统认知范式存在的缺陷 Ingwersen认为,认知观可以实现传统情报学中技术导向与用户导向的有机联系,因此可以将认知范式作为情报学中更为完整的研究范式。然而,情报学中的其他研究人员对此观点看法不一。20世纪90年代初,就有一些研究人员对情报学中的认知观进行了批评。Frohmann否定认知观的观点、方法和假设,他认为“将实践过程中的成果与信息处理、信息利用等所构成的复杂集合简化为一种心理描述,这种做法是一种精神论的方法”[10]。指出“认知范式的实质是将认识论方面的问题进行了心理学化,这种指导范式造成了通过研究个体来研究知识的弊端,因此不能从认识论的实质出发来对心理学问题进行审视”[11]。Cronin认为“人们的行为模式会承载着他们所隶属的知识文化的印记,这种现象存在着普遍性,并且过分强调个体的知识状况会造成人们对于社会关系以及社会结构认识的忽视”[12]。从上述学者的批评中不难看出,情报学中的认知观在理论方面的缺失造成了其研究完整性的不连贯[13]。可见,情报学中认知观其固有的缺陷直接导致其不能达到情报学理论范式这一高度。 2.2 情报学中的领域分析范式 领域分析这一情报学研究范式是在借鉴社会学的理论与方法,广泛吸收科学哲学、科学社会学、社会心理学等研究成果的基础上,从社会学的视角对情报学现象进行研究的一种新范式[14]。领域分析范式着重强调知识在特定信息资源领域的重要性[15],并认为单纯从信息组织的形式角度来掌握知识对于情报工作是不够的,这一观点与数字环境下形成的“重视形式而忽略内容”的观点截然相反。领域分析范式将不同认识论中的假设进行比较研究,注重信息组织当中主客观性问题的探讨[16]。领域分析范式在更高的元理论层次上对现有的各种知识组织方法从学科的底层进行揭示,从方法或系统最根本的知识前提假设出发,对方法的优劣进行评价。 丹麦情报学家与Albrechtsen在文献Toward a New Horizon in Information Science:Domain-Analysis中将领域分析的历史渊源、理论思想和方法进行了全面阐述,并首次提出了情报学中领域分析的概念[3],他们将知识领域(knowledge domain)视为社会分工下的思想或者讨论社群,以有机体的观点来看待知识领域,强调知识领域的结构组织与成长发展。[17]认为“可以从社会、认识论和本体论三个维度对特定领域进行认识,其中认识论和社会论对于领域认识更为重要,并且领域具有动态性,这样本体、认识以及社会之间的相互作用也在不断地发生着变化,因此,在对领域进行研究的时候应该将三者的复杂交互关系考虑在内”。Prieto[18,22]认为,“领域研究可以围绕某一特定问题的相关研究工作展开,也可以面向有关问题中所涉及的研究机构来展开,在实际分析工作中,关键在于找到划分领域的标准,而不是苛求如何精确地对不同领域进行界定这一问题”。Vickery[23]提出领域分析的主要目的在于产生专门的分类表(specified classification scheme),一个适用且恰当的专门分类表必须通过人工过程来产生,对精挑细选的文献样本内容进行分析以取得重要的相关词(专门术语),对这些相关词进行分组并提取出共同概念(类目),并将这些概念下所包含的相关词进行字词排序与定义,以形成分类表的雏形[19]。刘志辉等[20]认为,揭示研究领域的基本内容、社会构成要素、研究主题、各种元素之间的相互关联及变化是领域描述的主要目的。 可见,领域分析范式在其形成及发展过程中将情报学与科学哲学、认知社会学进行了有机融合,从而在理论层面具有高度抽象性,进而提升了在情报学中的地位,增强了在现代科学中的知识内涵。 3 情报学中领域分析范式的构建方法 图书情报学为了了解特殊主题领域中的专家需要哪些特殊的知识以及该如何对领域中的特殊知识进行分类,进而对领域分析的方法进行专门研究。认为图书情报学领域的问题在于一般的学科专家并非是图书情报学中的专家,而领域分析方法试图解决这些问题,提供学科专家对其领域非专业知识进行整理的方法。认为整理与提出的领域分析方法,可满足图书情报学对综合理论的需要。 3.1 文献指南或主题指引网站(literature guides or subject gateways) 文献指南是列出与描述信息资源相关的出版物,这些资源能帮助使用者更详细地了解本领域中的重要知识,从系统观点来看就是为了建立信息源架构。Bottle等[21]在文献中写道:“第一个独特的情报学文献类型可能是文献指南”。卜小蝶等[22]认为主题式资源引导网站的本质接近三次信息源(Tertiary Information Source),是可以指引使用者找到所需的一次与二次资源的资源,也就是对网络上分散的资源进行收集,包括文献资源、实物信息、网页和服务链接等,并对其进行详细的资源描述,以便为使用者提供可浏览及可获取的主题分类结构。 3.2 专门分类法和主题词表(special classifications and thesauri) 目前,大部分的分类研究都是针对一般的分类法进行的,针对特殊领域分类进行的研究较少,主要是因为研究人员在特殊领域分类方面的知识还相对缺乏,并且也会受到分类方法的限制。而主题词表的内容包括大部分领域中的专门字词,因此主题词表的方法也作为领域分析中的一种重要形式而存在[23]。主题词表通常是某个具体领域的词汇,对这些词汇进行编排的方法也可被视为是一种隐性的领域分析形式。主题词表的构建方法主要与分类法中的方面分析方法有关。自然语言处理(NLP)以及人工智能(AI)技术也会在主题词表的构建中进行使用[24]。Rees-Potter[25-26]基于“高被引文献为理论模型”这一假设,分别在1989年和1991年所著文献中对主题词表的半自动化构建和维护机制进行了研究。 3.3 针对索引和检索特性的研究(research on indexing and retrieving specialties) 索引制作的步骤包括判断文件档案的主题,并以索引词来表达这个主题,为的是能使用索引词来重复进行检索。索引制作大致可以分为两种方法:一种是以文件为中心的索引制作;另一种则是以知识领域为中心。Mai认为[27]“领域中心的索引制作能提供更广泛的分析范围,同时也能成为一份指南帮助索引制作者管理复杂的索引制作过程,但这种方法较为复杂必须对领域、使用者和索引制作者进行分析与了解”。在该领域成就较为卓越的学者是H.R.Tibbo[28-30],他对一般检索原则的缺陷进行了阐释,其观点与Garfield[31]基本一致。 3.4 用户的实证研究(empirical user studies) 这个方法假设的前提是:“情报领域的专业人员可以从使用者那里获得可供学习的信息”,但情报领域的人员通常情况下是应该对信息组织和搜索较为擅长的。因此,情报领域的专业人员不能期待从使用者那里获得与信息组织和搜索方面的知识,而在此过程中需要对使用者进行进一步的分析,从而了解到使用者需要什么,这样才能从使用者的需求出发实现一个好的领域分析。从领域分析的角度而言,美国心理协会1963—1969年、1969—1971年两个时间段以及Garvey和Griffith[32-34]的研究代表了用户实证研究行为的综合成果。其中以Griffith为代表的众多研究者对该交流领域的观点表现为:科学和学术在很大程度上构成了需要进行实证研究的社会系统。 3.5 文献计量学研究(bibliometrical studies) 文献计量学能展示单一文献的许多细节并能揭示文献之间的相互关联,这些关联可以体现研究者、研究范畴和研究方法等情况。文献计量学可以在领域分析当中的某些方面作为工具和方法进行使用。文献计量学比较多的应用于同被引分析的文献计量图谱或科学领域的可视化研究中。1998年White和McCain将其方法视为领域分析方法。Garfield[35-37]早期在文献计量分析领域当中的研究成果是该方法的雏形。文献计量方法可以将单个文献的许多具体、真实的关联进行展示。 3.6 历史研究(historical studies) 历史研究是一种广泛且深入的研究方法,这种方法可以对该领域的传统、典范、表达形式进行深入的揭示。在图书情报学科中,当涉及理解文献、组织、系统及信息时,历史观点及方法往往能提供更深入、连贯且生动的观点。计量学研究的先驱Derek J.de Solla Price其本人也是一位历史学家,出于这方面的考虑,人们经常从更多的角度将他的研究与其他计量学家的研究进行比较[17]。 3.7 文献和类型研究(document and genre studies) 随着全文检索系统、分段检索系统以及网络上的超文本系统的不断发展,不同学科会根据其需求的不同而产生不同类型的文献,例如与摄影相关的文献类型可能是以图书档案为主,而与电影相关的就往往会偏重动态影像资料。因此,文献和类型研究在图书情报学及相关领域中变得越来越重要[17]。然而,这些重要的概念需要以更为普遍的文献理论、文献的交流和功能理论,文献的因素、构成及其在信息检索中的潜在价值理论为基础。不同的学科或话语社群形成特殊的文献类型并对其特定的需求进行调整[38]。 3.8 认识论和批判研究(epistemological and critical studies) 所有的研究(与行为)都被不同的假设、背景和认识理论所支配,例如我们能将“背景知识”、“传统”、“范式”、“领域”等称为“框架概念”,在各自的框架概念中,我们建构我们所认识的社会与世界。认识论是知识的哲学研究,也是知识的理论或方法。认识论并不仅限于哲学学科,同时也受到科学家的影响,可将认识论视为收集科学经验的概括和诠释[39]。Hvari等[40]分别将范式、方法、方法论与技术进行了区分,形成了从一般到特殊的四个层次的等级关系。 3.9 术语研究、专用语言、话语研究(terminological studies、languages for special purposes、discourse studies) 语言和术语在图书情报学科中十分重要,因为它影响了思考方式、问题描述与检索行为,但是语言学学者对图书情报学方面进行研究的较少,因此两个学科的合作与联结是很少的[41]。图书情报学常使用词频分析,利用能够凸显与表达文献核心内容的关键词或主题词计算它们在研究领域中出现的频率次数高低,以确认该领域的研究重点与发展方向,由于文献的关键词或主题词是从文章的核心内容而来的,若某些关键词或主题词在该领域中重复出现,则这些反复出现的关键词或主题词所象征的研究主题就是该领域的研究重点[42]。也指出,术语研究在科学领域中较容易进行,因为科学领域的术语及命名规则通常是系统化与制式的规定,因此很少有争议发生,但是在社会科学中进行术语研究却较为困难,主要是因为社会科学的命名与术语过多,某些术语可能是由研究者自创的或是加以修改的。 3.10 科学交流中结构与机构的研究(studies of structures and institutions in scientific communication) 通过揭示知识生产者与知识使用者之间的关系可以展现学科中的某些联系,从而形成各种相关机构、服务和情报来源系统。等[43]以环状模型来表示知识的特殊领域,由其他领域引进信息,同时将情报引导至其他领域之中。其中一至三级文献的目录由科学、社会科学和人文科学所组成,以系统方法呈现出科学、专业中的特殊属性,在这种模型中所关注的不仅是单一种类的文件,机构和服务与其他文献、机构和服务之间的相关功能,而且还注重本领域需要实现的目标。 3.11 专业认知及人工智能的领域分析(domain analysis in professional cognition and artificial intelligence) 领域分析原本是系统发展和软件工程的方法之一,在计算机学科当中也是一种概念,其关注焦点是从领域中获取共同性与变化性以促进系统效能的过程。而人工智能和认知科学的领域有许多关于研究者、专家和一般人如何思考的研究,但这几乎是以系统观点为主,而忽视了领域中蕴含的历史和文化知识。Prieto-Diaz[44]认为20世纪80年代领域分析思想在计算机学科当中得以引用,并将领域分析视为一个过程。Champeaux等[45]将领域分析作为系统开发和软件工程的一种方法,领域分析注重对某一领域系统中的共性和差异性的捕捉,从而提高系统研发和维护的效率。 这11个图书情报学中的领域分析方法或许并非是最详尽的,但各个方法之间却能兼容并蓄并不互相排斥。认为这11个方法为相关研究调查提供了实证与理论层面的指导,从这11个方法中挑选适合的方法加以结合,可使情报学的研究做到理论与实证相结合,也可增强情报学的本质,更可整合出具有不同知识特性的领域分析方法,来对领域知识所表达的内容进行描绘与分析。 4 情报学中领域分析范式的应用 4.1 共词分析(co-word analysis) 共词分析常与重要词语、术语或短语的映射和可视化一同出现。其中,映射和聚类技术在很大程度上取决于网络计量学对相关结构的解析,包括对领域中重要主题、主题间关系以及不同时间段内所传播知识的识别[46]。其中,所呈现出领域中的关系的本质和结构可视为“计量图谱”或“科学地图”[47-48]。因此,映射和聚类技术在共词分析当中起到了相互补充的作用。 关于共词分析法的研究已在国外诸多领域有所应用,Lee[49]在2008年时通过对科学技术文本进行共词分析,发现其最新的研究趋势;Shibata等[50]对两个研究领域的共现网络进行了研究,他们把这两个网络分为若干个类簇来揭示其关注的热点问题。Ding[51]对学科间的合作情况以及研究人员的引用模式进行了研究,对最终结果采用异位模型方法(atopic model approach)实现了合作领域中不同研究人员异同研究兴趣的检验。目前,国内利用领域分析范式中共词分析方法进行研究的人员大多集中于图书情报学领域。邱均平等[52]通过对我国图书馆学、情报学相关研究论文中关键词的统计分析,利用共词分析原理得到了基于期刊论文中关键词级别的重点领域以及研究方向,实现了对当前研究重点的揭示、未来研究趋势的预测;曹志杰、冷伏海[53]提出了利用共词分析方法可以对文献中的隐性知识进行某种程度的揭示,给后续研究人员以启发。 20世纪70年代,共词分析方法与基于网络合作原理的作者、机构合作分析方法进行结合,虽然基于作者共词、机构共词以及网络共现方法提出的时间不长,但已经取得的重要成果。Racherla等[54]运用社会网络方法对旅游业文献中的合作网络结构进行了分析,根据时间的变化对旅游业关注问题的变化情况进行了动态分析,通过作者研究发现尽管旅游方面的研究者数量庞大复杂,几个核心群体中的研究者分布又十分的分散(有时候核心作者又作为网络中的节点),但采用基于网络共现的领域分析方法仍能将分布规律和群落进行很好的揭示;Liu等[55]在PageRank算法的基础上提出了加权作者合作的authorank算法,利用该算法实现了作者合作网络中的作者节点重要程度的赋值计算。 社会网络分析的思想和方法于20世纪80年代起被介绍到国内[56]。国内图书馆学、情报学界对于社会网络分析的应用始于包昌火等在2003年所发表的《人际网络分析》一文[57]。此后,晏尔伽等[58]利用社会网络方法,通过对图情领域作者现状的揭示,将作者合作网络进行了可视化展示,提出作者合作网络符合“小世界效应”,将图情领域的作者合作情况与其他学科作者合作情况进行比较分析后,对不同学科中作者合作的不同模式进行了总结;杨洪勇等[59]在期刊论文基础上,利用领域分析构建出作者合作“模体涌现模型”,并揭示出模体度分布以及节点连接强度分布的幂指数相同;李丽蓉等[60]在社会网络分析的启发下,提出“广度中心度”算法,对作者在不同子群体中的合作情况进行了有效揭示;耿志杰等[61-62]利用社会网络方法构建出了研究领域的关键词网络,并对关键词的同现关系进行了分析。 4.2 领域可视化(domain visualization) 近年来,信息可视化在文献计量学以及科学计量学中的重要性越发显著,该方法可以利用各种建模和可视化技术对传统研究科学领域的方法进行补充。和Albrechtsen在1995年便指出“在情报学中,领域可视化的成果与领域分析是密切相关的”。领域可视化强调“对学术交流领域最好的理解方法在于将知识领域作为思想或话语社群来进行研究”。领域中的知识组织、结构、合作模式、语言以及交流形式反应出这些社群中的客观研究成果以及他们在领域中所扮演的角色。可视化技术可在利用人类视觉感知系统的同时将数据以图形化的方式展示出来,从而实现数据快速直观地解释与分析。这种方法一方面可以辅助用户认识数据之间的联系,另一方面有助于挖掘隐藏在数据内部的有价值的信息[63]。常用的可视化软件主要有Bibexcel、Citespace、Histcite、Netdraw、Pajek、Piccolo、UCINET等。 近年来随着领域可视化技术的不断发展,更为复杂的方法,如基于文本内容以及基于文献引用等方法也融合到文献[64-66]以及期刊[67]信息可视化之中。张婷[68]绘制时间线及地形式图谱,分析并预测了科学传播的前沿研究趋势;许振亮等[69]将科学计量学的结果进行可视化,揭示出了国际生物科学与工程技术的知识图谱;侯剑华等[70]利用可视化软件CiteSpace实现了文献共引网络图谱的绘制,将谱图中的关键节点文献在领域演进过程中的重要作用进行了详细阐述。 4.3 信息检索(information search) 信息检索是情报学研究中的一大领域[71]。从用户认知观和认知模型的角度来对情报检索进行研究已有一些成果,如信息检索中对用户行为模式的研究,中介对于认知过程以及交互过程的影响研究等[72]。Kwan等[73]等通过对用户在进行检索过程中使用的检索问题这一行为研究来为具体领域的信息检索系统服务。Diane等[74]对1967—2006年40年中2791份期刊和会议论文集中的127篇论文中涉及交互信息检索评价的论文进行了系统综述,发现领域分析思想会影响用户的信息检索行为。还有少量研究对现实环境中的用户认知模式进行了研究[75],但在这些研究中很难找出针对一般和特定领域中的知识和检索策略相互作用的实质性论据。对于这种认知模式,大多存在于图情研究人员的直觉中:特定领域知识在情报检索过程中起重要作用[71]。 5 我国情报学对领域分析范式研究的不足 将国内外领域分析的研究现状进行系统分析后发现,该领域的研究具有如下特征:经历了几十年的发展后,共词分析方法其理论体系得到了不断完善、发展,并且该方法目前在众多学科的具体分析工作中,如研究重点、方向的寻找,研究主题分析,整体研究领域中研究主题的揭示等方面得以广泛应用;领域分析中的可视化研究成果可以形象、直观的向科研人员甚至是普通大众将研究分析结果进行展示,这便有效提高了人们对研究结果的接受度,降低了理解难度;将认知学派中的领域分析思想融入到用户行为检索研究中可以更好地揭示特定领域内用户的行为特点。 虽然目前国内外有不少关于研究领域分析的成果,但是在这些研究成果中仍发现不少问题: (1)在国内,研究人员在对领域分析的研究中重实践而轻理论。目前,国内研究人员的研究成果中关注的焦点主要体现在如何将共词分析作为一种方法在不同的研究领域进行实践应用,而对于领域分析理论本身的关注和完善的研究较为欠缺。 (2)领域分析研究维度较为单一。目前,研究人员在进行领域分析研究时,大多采用单一维度,如基于机构、关键词、作者等维度来进行研究,只有少数研究从几个维度对研究领域进行了分析。但是在这些研究中,作者所提出的几个维度也是没有关联、互相独立的,缺乏对维度与维度间关联关系的思考,如关键词与机构,机构与作者等更为复杂的揭示,并且目前大多数研究仅仅停留在对研究结果的可视化呈现层面,缺乏对不同维度间所体现的深层内容的充分揭示和探讨。 (3)在基于领域分析范式的用户交互检索的文献中很难找出对一般和特定领域的知识和检索策略之间的相互作用加以研究的实质性证据,而这些实质性的证据仅仅存在于大多数图书馆员和情报学家的直觉中。标签:情报学论文; 文献分析法论文; 用户研究论文; 相关性分析论文; 认知过程论文; 用户分析论文; 主题词论文; 文献论文; 系统论论文;