网络信息计量学概论及应用探讨,本文主要内容关键词为:计量学论文,概论论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 网络计量学的提出
传统的文献计量学是以科学文献及其数量为研究对象的,采用数学、统计学等的计量方法,探讨科学文献本身规律,提高文献情报管理科学性,通过文献规律的探讨,进而揭示科学技术的规律性。随着计算机网络技术的迅速发展,信息资源数字化、网络化的进程不断加快,网上数字信息的计量研究也成了摆在人们面前的一个新课题,这直接促成了网络信息计量学的诞生。
最早研究网络信息计量学的是伍德鲁夫(Woodruff)对网络文献特征的测度[1]。随后,1997年,阿曼德Almind 首先发表了《万维网上的情报计量分析:网络计量学方法门径》一文,
提出了用“Webmetrics”一词来描述将文献计量学方法应用于万维网(WWW)上的研究。认为网络信息计量学是以文献计量学为基础发展起来的,它是运用文献计量学、科学计量学以及信息技术对网络通信的有关问题所进行的研究。将传统文献计量方法使用在Web分析上,通常可统计任何方面, 诸如语言、单词、题名、主题词、关键词、词频、知识项、引文信息、著者、出版者、作者合作的能力和程度,还有对作者的引文分析,学科或数据库增长的测量,新概念、新定义的增长、信息的测量、信息措施的形式与特征。
2 网络信息计量学研究对象、研究方法及研究工具
2.1 网络信息计量学的研究对象
网络信息计量学是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个发展方向和重要的研究领域,具有广阔的应用前景。就现阶段的研究状况来看,其研究对象应该是十分广泛的,包括网络技术、网页中文献计量学方法,万维网的电子数据库分析及网络结构、电子数据库资源的产出量、主页、电子引文分析、电子媒介和资源研究、数字图书馆、虚拟图书馆、电子信息系统、域名分布。
2.2 网络信息资源计量学的研究方法
由于网络信息计量学被看成是文献计量学、科学计量学在网络上应用的一门学科,因而在文献计量学、科学计量学得到广泛应用的文献信息统计分析法、数学模型分析法、引文分析法、书目分析法、系统分析法等定量方法将在网络信息计量研究中得到广泛应用。同时,由于网络环境的特殊性,这些方法在应用过程中必将不断得到改进与发展,随着计算机网络的发展,给文献计量学、科学计量学的研究方法带来了新的活力。就引文分析而言,引文分析法就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者、核心期刊等各种分析对象的引用或被引用现象进行分析,以便揭示其数量特征和内在规律的一种文献计量方法。信息计量学中的引文分析法也可以在网络中得到应用。金岩[2]以50293个来源网站信息,274720个来源网页和3476618个引文网页信息为数据基础, 借用文献计量学的理论和方法,以域名分析到引文分析两个方面对网络信息资源进行定量分析。为网络信息计量学研究方法提供实际操作经验,并为信息用户进行信息检索提供具体实用价值的建议和定量性的指标。此外,我们还可以运用统计方法对数据加以分析。很多研究机构,如中国互联网实验室、中国网络研究与发展中心、中国互联网络信息中心、赛迪资讯顾问公司等就是通过对网站和服务器的数量、网络用户的特征(包括行为特征)及网络发展的增长率指标进行统计分析的。另外,在数据收集中,可采用网上联机调查和网下抽样调查等方法收集和分析用户的个人信息,如用户的男女比例、用户的年龄段及学历、用户的地域分布和行业分布、用户的职业、用户上网的行为及心理等等。
2.3 网络信息计量学的研究工具
网络信息计量分析作为一种定量分析方法,与传统的手工统计分析方法不同,她主要是利用计算机通过有关数据库或信息网络来获取文献信息的统计数据,并进行数据整理等工作,为以后的数据分析奠定基础。信息计量学研究要有一定规模的数据支持。国外,早在20世纪60年代初,美国就开始编制SCI,1999年,SCI收录了世界上重要的3600余种科技期刊,还出版发行光盘版(SCI)的扩展版(SCIE), 其收录的期刊增加到5600种左右,收录论文总数高达973286篇。 SCI的意义在于结实科学技术文献之间、作者之间的引证与被引证的相互关系,每一部分索引的内容都与文献相互引用密切相关。它的出版发行为信息计量学研究提供了一种多功能的工具,在一定程度上提供了引文分析所必需的大量数据,有效地推动了信息计量学和网络信息计量分析研究的全面展开。国内近几年来,在信息计量研究中进行了大胆探索,取得了较大进展,成功地研制了一些中文电子文献信息数据工具,如:《中国科技论文与引文数据库》、《中国科学引文数据库》(CSCD)、《中文社会科学引文索引》(CSSCI)等。特别是(CSSCI)数据库系统是南京大学与香港科技大学合作研制,并首次于2000年5月推出的, 也是国家教育部人文社会科学“九五”规划重大研究项目的主要成果。CSSCI 选录我国内地出版的人文社会科学重要期刊496种,来源文献6万余篇,被引文近28万篇[3]。在此基础上,采用文献计量学方法, 对一系列科学计量指标进行了全面的统计分析,获得了重要的结果。这些成果为我国文献计量学与科学计量学的全面发展和广泛应用,为网络信息计量学的研究提供了必要的大型的现代化工具,填补了国内重要空白,具有重要的科学理论价值和实际应用意义。
3 网络信息计量学的应用研究
网络信息计量学应用研究的内容非常丰富,既要探讨应用的方法和技术,又要不断开拓新的应用领域,还要解决具体的实际问题。与手工的文献统计分析相比,在基本条件具备的情况下,网络信息计量研究有着更加广泛的应用领域。它具有适用面广、数据量大、工作效率高等明显优势。因此,它不仅可在图书情报(数字图书馆)领域内具体应用,而且还可以应用于许多相关学科,如科学学、社会学、人才学、历史学等领域的研究中。例如:利用网络可以获取大量数据,对信息计量学的经验定律进行更高层次的检验、计算和推导,从而深化文献计量学的理论研究;通过网络文献信息统计分析或引文分析,可以评价文献质量,确定核心网站,评价人才,探讨科学发展规律,为指定科技政策和决策提供定量依据。笔者主要想探讨网络信息计量学在图书情报领域中的应用研究。
3.1 文献计量学的引文分析法在网络中的应用
Almind等人在Journal of Documentation上发表的文章《万维网上的情报计量学分析:网络计量学方法门径》中提出:“情报计量方法所使用的手段完全可以应用到万维网上,只不过是将万维网看作是引文网络,传统的引文由Web叶脉内所取代。 ”笔者认为信息计量学的引文分析法完全可以用于网络上。利用引文分析可以测定学科影响和重要性、研究科学结构,研究学科情报源分布、确定核心期刊、研究科学交流和信息传递规律、研究文献老化和信息利用规律、科学水平和人才的评价等。阿拉斯戴尔·史密斯(Alastair Smith)通过计算网站的被链接率来确定网站的网络影响因素[4]。 我们还可以对网站的点击率加以统计,确定出点击率较高的网站,我们就称其为“核心网站”。核心网站的确定,有利于用户快速查找和选择利用网络信息,引导科研方向,方便同行间的学术交流,扩大网站的知名度,从而推动网站的建设,增加网站的利用价值。例如,美国图书馆协会(ALA )下属的参考馆员与用户服务协会的参考部(MARS)自1999年起,利用恰当的评价体系评价了大量的万维网网站,并从中筛选出几十个最佳免费网站公之与众。其中包括:搜索引擎类网站(About.com
3.2 网络信息计量学在数字图书馆中的应用
数字图书馆是知识经济时代的产物,是传统图书馆寻求自身发展的有效途径。它具有数字化资源、网络化存取和分布式管理三大特征。对于数字图书而言,网络数据库和网络信息资源是不可缺少的,随着网络信息量的剧增较好地满足了人们的信息需求,同时又给数字图书馆的建设和管理带来了许多实际困难。为了解决这些困难,就必须加强对网络信息规律的研究,提高管理的效率。网络信息计量学无论从其研究对象与研究目的,还是从其研究方法与内容体系来看,都是适应这一要求,它能对数字图书馆的资源管理进行科学的指导,并提供定量依据,提高数字图书馆的管理水平。首先,数字图书馆应合理分配馆藏空间,进行动态馆藏的维护,网络信息计量学可以为此提供定量依据和科学方法。在探明各类型信息数量特征的基础上,分析其增长和老化规律,判断信息的价值和时效性,使有价值的信息更充分地发挥作用,使信息空间得到有效的利用。其次,数字图书馆在网络信息计量学的指导下,能够满足用户的信息需求,改变以馆藏为中心的旧模式,使计算机信息检索系统走向科学化、规范化,从而更方便用户查询。第三,通过对网站、数据库等信息组织机构进行定量分析评价,人们可确定出核心信息来源(核心网站)。数字图书馆获得这些信息资源,可以充分满足用户的需求。
网络信息计量学是新兴起的学科,目前国外的研究发展较快,已初具规模,而我国在这方面的研究尚处于萌芽阶段。随着信息资源数字化、网络化的日益普及和网络信息计量学的迅速发展,会有更多的学者投身于这一新兴领域的研究。