内容分析法应用于学科信息门户初探,本文主要内容关键词为:应用于论文,分析法论文,学科论文,内容论文,门户论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 内容分析法概况
1.1 发展历史
内容分析法(Content Analysis)是发源于新闻传播领域的一种方法,通过对传播内容进行客观、系统和定性与定量相结合的分析,有效描述传播内容特征和检验传播研究假设。其发展最早可以追溯到第二次世界大战期间,当时美国著名传播学家哈罗德·拉斯韦尔等人在美国国会图书馆组织了一项名为“战时通讯研究”的工作,以德国公开出版的报纸为研究对象,通过内容分析法获取重要的军政机密情报,取得重大成就。这项工作不仅显现出内容分析法的强大作用,而且总结出了一套内容分析法的工作模式,战后,内容分析法在传播领域得到更多研究,20世纪50年代,美国学者贝雷尔森(Bernard Berelson)发表著作《内容分析:传播研究的一种工具》,奠定了内容分析法的地位,其对内容分析法的定义也被广泛引用。目前,内容分析法已经被广泛运用到新闻传播、图书情报、政治军事决策、社会学和心理学等社会科学研究的各个领域。随着网络的发展,它开始成为网络信息组织、描述和利用的重要方法和研究热点。
1.2 定义
按照贝雷尔森的经典定义,内容分析法是一种对具有明确特定的传播内容进行的客观、系统和定量描述的研究技术[1]。在运用到图书情报领域时,内容分析法依然遵循客观、系统和定量原则,通过对各种类型文献信息的数据计量、比较、分析和推理,描述学科发展特点和趋势、发现学科空白实现学术创新、实现信息的有效组织和利用以及分析用户需求提供个性化服务。按照使用的方法模式不同,内容分析法可以分为:(1)解读式内容分析法,通过精读、理解并阐释文本内容来传达作者的意图;(2)实验室式内容分析法,主要是定量和定性内容分析相结合;(3)计算机辅助内容分析法,运用计算机来辅助数据搜集、编辑、整序和分析[2]。
1.3 特点
内容分析法的特点主要体现在四个方面:(1)定性、定量相结合。内容分析法首先要提出研究意图和假设,对分析单元和程序进行质的规定。以定性为基础,再采用统计、计量等定量方法和数字、图表等描述方法对信息内容进行揭示,最终还将回归到内容的解释和深化的定性层面。(2)客观性。内容分析法得以实现的前提在于文献的内容特征可以通过符号群(包括语词、图像、音频、视频和多媒体元素等,其中语词是最常用的符号群)来体现,而且同一符号群在同一文献中具有相同的意义[3]。人们是通过对符号群出现的频次、位置等外在客观信息的计量来了解文献的信息内容特征的,这就保证了内容分析的客观性,它不会因为实施者的不同而出现巨大差异。(3)系统性。这主要体现在样本选择和分析框架建构上。内容分析法一般是对一段时间的(通常是5年-10年)、连续稳定的、内容体例基本一致的大量文献信息进行分析,从时间跨度、数量要求、稳定程度等多方面对研究样本进行了限定。在分析单元和框架体系上要求尽可能全面反映样本的所有信息特征,具有互斥、完备、可信的特征。(4)统一性。内容分析强调统一的标准和规则,选择样本上必须按照统一的程序,保证每个项目接受分析的机会相同,而且所有的研究内容应以完全相同的方法进行处理,编码和分析过程必须一致,保证长时期分析效果的一致性。
2 学科信息门户概况
2.1 定义
学科信息门户(Subject Based Information Gateways,简称SBIGs)是用户访问某学科资源与服务的一个单一入口或通道。它是一种网络服务,用以完成本学科网络资源内容的高度组织集成和网络应用程序的聚集,并将这些资源与应用集成在一个可定制个性化的界面中来满足每个最终用户的需要。它还提供一个统一协作的学术交流环境。从用户角度来看,它是某学科用户访问该学科网络资源和服务的起始站点或称入口[4]。目前,国外都开展了各种学科信息门户项目,例如:欧洲的Desire项目、美国的Infomine项目、英国的RDN(Resource Discover Network)项目、SOSIG(Social Science Information Gaterway)项目等等,国内近年来开始发展的上海图书馆“数字图书馆”资源项目、中科院“国家科学数字图书馆(CSDL)”项目建立的数字图书馆中心门户和生命科学、化学、数学物理、资源环境和图书情报5个学科信息门户、武汉理工大学图书馆建立的“材料复合新技术信息门户”等。
2.2 特点
学科信息门户主要针对特定学科领域,服务对象基本上是专业研究人员。这一主要特征决定了学科信息门户建构的要求:(1)专业化,在资源选择上要选取学科研究中可靠的信息源,资源描述和组织上要依据专业词表和分类法,对门户要经常更新和专业测评;(2)集成化,将专业领域里所需要的各种信息资源,包括网站、图书情报系统、文摘索引、电子期刊、科技报告、学位与会议论文、研究机构、学术团体、教育机构、学术会议、工具书、专业服务系统以及与学科科研紧密相关的其他资源系统集成到一个网络平台上提供服务;(3)知识化,信息资源强调专而精,根据对知识内容及其关系来选择、描述和组织资源与服务;(4)智能化,要能提供符合专业领域的检索浏览方式及资源导航模式,并能在用户使用过程中提供智能化的服务帮助[5]。
2.3 研究内容
目前学科信息门户研究也主要围绕上述要求来开展,内容有:(1)信息资源的选择研究,包括对学科信息门户需要涵盖的资源广度和深度进行界定,制定选取标准、流程规范和搜寻控制策略;(2)信息资源的组织研究,包括资源的整合策略、资源的描述方式和深度、资源的组织方式、知识挖掘;(3)信息服务研究,包括异构数据库的统一平台检索研究、信息导航研究和个性化推送服务;(4)技术研究,对建构学科信息门户的各种智能技术研究。
3 内容分析法在学科信息门户构建中的应用
3.1 应用的必要性和可行性
(1)必要性。学科信息门户是一种在网上获取高质量信息资源的重要工具,面向专业研究人员,因此在信息资源选择、组织和服务上都要求具有较高的专业水平,在内容选择上不仅强调完备性,而且更强调一定的指导性,要能够反映学科热点和前沿,在信息服务上,要能够针对个人研究情况的转移提供个性化的服务。当前出现的各种资源选择和评价标准还主要停留在定性描述上,虽然具有一定的指导性,但因为缺少量的规定而在实际操作中难以避免人为差异,而且定性描述难以准确反映学科研究的中心内容,内容分析法结合定性与定量描述,能够科学地反映学科核心资源、基本资源和边缘资源,还能够分析出研究的热点和重点所在,保证资源组织内容全面、重心突出。在服务方面尤其是个性化服务方面,目前的发展还远未完善:信息导航还主要依据专家意见,不够客观;推送服务主要是依据用户提供的要求来进行自动检索和发送,用户潜在的信息需求无法满足,也无法跟上用户的动态研究状况。内容分析法的优势就是从公开资料中提取秘密信息,信息服务人员可以通过对用户使用习惯、查询内容等的深度分析,了解用户的使用偏好、研究内容,从而提供针对性的指导、资料推送等个性化的服务。
(2)可行性。首先,内容分析法与学科信息门户具有某些相同或相近的特征和要求。学科信息门户要求信息资源具有连续性、稳定性和系统性,在选择范围和质量以及组织方面要求统一性和标准化,在信息服务方面也特别强调内容挖掘和知识内涵。而连续性、系统性、标准化也正是内容分析法的实施要求,并且内容分析法就是要从数据的分析中提炼内容主题,能够满足学科信息门户建设的知识要求,还能够弥补现存资源标准定性多、定量少的缺点,使学科门户资源提供更加科学合理。其次,目前已经有部分研究者将内容分析与信息建设和服务结合分析,取得了一定成果,这些可以作为内容分析法运用于学科信息门户的基础。如李敏等人研究了基于内容分析的信息导航建设框架和技术[6],朱少强等研究了内容分析运用于文献群隐含信息的挖掘的理论和方法[7],毕达天研究了内容分析法在网络数字信息分析中的应用[8],缪其浩利用内容分析考察了国际图书馆学术前沿及其发展[9],张蕊、王曰芬等人研究了计算机辅助内容分析软件[10-11]等。这些研究表明内容分析法能够运用于学科信息门户的信息选择、导航和知识挖掘,并且具有实际的可操作性。
3.2 具体应用内容
(1)信息资源选择。严格的资源选择是学科信息门户专业性、知识性的重要保障,目前国内外对资源选择都制订了各种标准,例如SOSIG从内容、形式和选择过程确定筛选标准,包括有效性、权威性、准确性、全面性、唯一性、有组织和时效性[12]。但这些标准还局限在质的规定上,结合内容分析法可以达到量的限定。在进行全方位信息选择之前可以先选取消范围的文献资源进行内容分析,从而制订可量化的信息选择标准。仅以确定信息选择的相关性标准为例,首先,选取某些体系完备、发展稳定、信息含量大的主要信息源,对其中的文章或网页里出现的专业词汇进行切分和索引,并依据专业词表进行规范和合并,然后对索引词汇进行词频统计、语义分析和特征提取,从而确定学科研究的核心词汇、基本词汇和边缘词汇。反过来,这三种类型词汇在各个信息源中出现的频次可用于确定某一资源与门户建设目的的相关性。按照样本结果,可以订立便于计量和操作和全面资源搜寻标准和策略。
(2)信息资源描述和组织。
内容分析法在信息描述方面的应用主要体现在:第一,内容分析与数据挖掘、语义结构和知识发现技术相结合,能够从大量不完全的、模糊的外显信息中发掘其隐含的有用知识信息,这种隐含信息可能信息创造者自身也未意识到,这就使信息描述更加完备、深入。第二,内容分析法在创建分析类目时,要将意义相同、相近和相关的分析单元进行归类整合,因而分析类目可用于描述资源之间的参照关系,并建立符合网络资源特点的动态词表。
目前主流的资源组织方式是分类浏览和主题检索,这两种方式的缺点在于作为受控语言,需要依据分类法或主题词表,而分类法和主题词表更新往往滞后于动态的学科发展形势。如前所述,运用内容分析法能够反映学科的核心词汇、基本词汇和边缘词汇,体现学科发展的热点和重点,再通过分析单元的归类整合,可以形成学科研究词库。而且词库产生的分析结果能进行迅速、有效的更新,更新一次内容分析只需下载最近一段时间内的信息文本并用原来开发的编码程序执行分析,研究趋势、重点分析可以每年、每季甚至每周更新,即使发生突发情况,也能及时反映。每当加入一个新问题,内容分析也能延伸到之前研究开展的时期再次分析,不受时间限制[13]。可见,采用内容分析能够提供一种更加适应网络和学术研究特点的、半受控的知识元组织方式。
(3)信息服务。信息服务是学科信息门户价值实现的关键所在,是资源创建者和使用者之间沟通的重要环节,主要包括信息导航服务、检索服务和用户个性化服务等层面,运用内容分析法能够提高这三个层面服务的质量。
信息导航可以帮助用户迅速、准确地定位到所需信息,但目前的导航系统还多是基于语词的静态物理链接,要达到用户满意就必须在用户导航路径的选择上给予内容提示与知识指导。通过信息的内容分析,抽取信息资源的核心领域和相关领域的含量、质量及相似度,从而实现资源的动态聚类,根据查询目的不同从多角度切入导航路径,并且不断转入相关导航节点,优化导航过程[14]。在日常维护中,通过对用户查找和点击情况的内容分析加以不断调整导航项目和设计,满足用户要求。信息导航除了门户内信息的快速定位,还包括外部相关网站的合理链接。选择独立网站作为分析单元,对其规模、内容、访问人数、学科信息内容的发布和用户使用评价情况做内容分析,确立关联程度、内容质量和使用频率较高的网站进行外部链接导航。
由于内容分析提供了信息的半受控的知识元组织方式,相应地,这种知识元索引库可以作为知识元检索方式的基础。运用一定的智能技术,在信息选择和组织过程中构建索引数据库,库中的内容都是专业领域的知识单元,是最小的知识组分。当用户查找某个关键词时,通过知识组分的逻辑组配合运算,包含该关键词的信息源将被作为知识元索引结果被检索出来提供给用户。还可将用户的检索要求和对检索结果的选择情况进行分析和积累,作为备用索引库,不断完善学科信息门户检索的专业化和知识化。
个性化信息服务离不开对用户个人使用情况的跟踪分析,内容分析法的应用主要是对网络使用记录的挖掘。显在的用户信息包括用户注册信息、发表评论等,隐性的用户信息要通过Web服务器日志、Cookie记录、动态跟踪软件、网络调查等方式来获取[15]。分析显在和隐含的用户信息,可以提取有关的用户行为特征,对用户的资源使用行为、频度、关注内容、使用偏好进行了解,总结其信息利用特点和规律,从而提供个别化的使用帮助和个性化的推送服务。
3.3 实施步骤
内容分析法一般可以分为以下几个独立的阶段执行:
(1)提出研究问题,确定研究范围。在研究开始阶段就要明确表述研究目的,提出研究假设,并且依据研究主题划定研究范围,详细说明所分析内容的界限以便给出可操作的主题领域和时间段。
(2)抽取样本。样本选择的标准是符合研究目的、信息含量大、具有连续性、内容体例基本一致,简言之就是能从样本的性质中推断与总体性质有关的结论[16]。
(3)选择分析单元。即寻找内容分析所需考察的各项因素,这些因素要符合研究目的,且便于抽取操作。分析单元可以是数据库或网页中的特定语词、符号、主题、人物或者句子、段落乃至全文或网站,也可以是声音、视频信息或用户行为。
(4)建立类目体系。即确定分析单元的类目归属,有效的类目体系应保证所有的分析单元具有唯一的分类指归,各个类目界限明晰,并且分类标准一致,不同的编码者对分析单元的归属意见相同。
(5)内容编码和计量。将分析单元分配到类目系统中并对各个类目出现频次、空间数额等进行计量,这个过程可以采用计算机和相关软件来完成。
(6)解释与检验。通过数据的分析,进行合理的分析与阐释,并与研究假设相互印证,发现研究目的与结论之间的异同,得出对某一现象或理论的科学认识。分析结果还要通过信度和效度的进一步检验,信度包括对文献编码一致性、分类准确性和方法稳定性的检验,效度包括结论与事实的相符程度、理论研究结果的适用性检验[17]。
3.4 应用内容分析法的优势与不足
内容分析法运用于学科信息门户的优势是由它的性质决定的。作为一种通过信息记录的数量分析来间接研究资源和用户行为的科学方法,内容分析法具有客观性,方法的运用者不与研究对象发生直接联系,研究者的主观态度和偏好不会对分析的数量结果造成影响,而且分析过程是按照规定的程序、方法和选择评价规则来执行,分析结果表现为一系列的量化数据,这些都保证了内容分析的客观性和统一性,使分析者能够从模糊、虚假的显在信息中抽取真实信息和有用知识,并能较深刻、精确地反映资源的知识含量和用户的个性化需要。在一定程度上能够弥补目前学科信息门户信息资源选择、描述、组织和服务标准定性化、主观化(依据专家意见)带来的不确定、易变的缺点。
内容分析法应用于学科信息门户构建也存在不足:一方面体现在内容分析法系统性要求与网络资源分散性特点的冲突。内容分析法要求选取比较稳定、连续、体例基本一致的大量信息作为样本,而学科信息门户作为对资源的二次整合,既包括数据库等比较稳定的资源,也包括互联网上比较零散的、形式多样的易逝信息,后者难以达到内容分析的要求,但对于学科信息门户资源建设又是十分必要的。同样的问题还存在于对暂时的、分散的用户使用情况的分析过程中,因而如何对这些即时性的、零碎的信息进行可靠的内容分析成为需要关注的问题。另一方面表现在内容分析法评价判断的不确定性。内容分析法采用定性与定量相结合的方式,定量建立在定性基础之上,这就使得任何信息在被统计分析处理之前,必定要划分到一定的类目体系中,而任何类目体系都是高度人工选择性的,不可避免的主观判断却成为客观定量分析的前提,这是内容分析自身无法克服的矛盾。当然,目前已有学者提出了一些解决方法,引入概率论、数理统计方法、模糊数学方法、灰色系统理论方法、贝叶斯定理来尽量减少内容分析法的不确定性[18],达到最大化的科学性。
4 结语
内容分析法具有客观性、系统性、统一性、定性与定量相结合等特点,在实际运作中具有灵活性、易操作性,这些特点使它能够广泛地运用到学科信息门户资源建设和用户服务领域中,为信息资源选择、描述、组织和服务提供量化数据和规范基础,优化学科信息门户资源和服务质量。当然,内容分析法也还存在不足,需要结合其它方法和深入发展来加以完善。
收稿日期:2006-06-09