网络信息老化研究_文献回顾论文

网络信息老化研究_文献回顾论文

网络信息老化研究,本文主要内容关键词为:网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号 G350

在网络时代,信息数量激增,信息增长方式产生了极大的变化,网络信息老化问题也逐渐成为大家关注的热点,但目前有关网络信息老化的研究资料并不多见,国内最早的对网络信息老化问题的相关文献参见2004年的王宏鑫与邱均平的《关于网络信息老化研究的若干问题》一文[1]。以下部分我们在分析网络信息老化研究前提——网络时代的信息特点、网络信息老化起源、研究对象、测度指标、研究方法和应用等几个方面的基础上,从理论上提出了网络信息老化未来可能的发展方向。

1 网络信息老化研究前提——网络时代的信息特点

1.1 网络信息更新方式特点——可修改性

传统文献信息一经发表,其内容不会再发生改变,这是由纸质载体的属性所决定。而网络信息由于其载体的特殊属性,其内容可以随着时间、事物的发展变化而修改。这种修改包括网络信息内容改变和网页变化。

网络信息内容改变也就是所谓的网络信息资源更新现象。网络信息资源的更新是指网络信息资源在载体形态、数据组织方式、网址等外在特征不变的情况下,所含知识和情报在内容上的改变[2]。正是由于网络信息内容的可更新性,对网络信息进行的老化研究与文献信息会有所不同。如在对网络信息老化进行半衰期计算时,是对HTML文件的最后修改时间进行统计,而非文件的发布时间。网页变化主要是指根据需要对网页进行增加或删除。网页变化是网络信息自身生命周期发生改变的主要原因之一。

1.2 网络信息增长方式的特点

a.网络信息增长迅速。与传统文献信息的增长速度相比,网络信息的增长速度非常惊人。以我国为例,根据中国互联网中心的统计,2005年12月31日,全国网页总数达到了26亿个,2006年12月31日,全国网页总数达到了44.7亿个,字节数为122,305,737,000KB,到2007年12月31日,全国网页总数就达到了84.7亿个,增幅达到89.4%[13],字节数为198,348,224,198KB,增幅为62.2%。

b.UGC使信息更易发布,信息内容更加丰富。在网络信息老化研究中,网络信息的另外一个值得关注的特点就是“用户产生内容”(UGC)。这是在Web2.0时代非常流行的一个概念。Web2.0中,个人不是被动的而是作为主体参与到互联网的信息生产,个人在作为互联网的使用者之外,还同时成为了互联网内容的主动传播者、作者和生产者[3]。比如近两年很盛行的“博客”、上传视频和照片的各种网站,如土豆网,Youtube,Photobucket等等,就是典型的UGC产物。根据调查,在中国的2.1亿网民中,有接近2/3(65.7%)的网民或者在网上发过帖,或者给互联网上传过内容,即1.38亿网民都对互联网内容作出过或多或少的贡献。网络信息更易发布这一特点已经改变了信息的生产方式。任何人只要在相关的法律法规的规范下,都可以在网络上发表内容,这与传统的文献发表相比要更方便更容易。

在网络的环境下,信息的增长与更新方式都产生了极大的变化,而信息的老化和增长、更新有着紧密的联系。信息的老化和增长是同一事物的两个方面[2],而信息更新速度可以从一个侧面直接反映信息老化的程度。网络信息不同于文献信息的增长与更新方式必将为网络信息老化研究带来更多的新问题与挑战。

2 网络信息老化研究回顾

2.1 网络信息老化的起源

网络信息老化起源于文献信息老化。最早对文献老化进行研究的是戈斯内尔。他于20个世纪40年代就开始进行大学图书馆文献研究,其中已经涉及文献老化的研究。如他在1940年在《图书馆期刊》上发表的《学院图书馆图书》一文,及1941年在《大学与研究机构图书馆》上发表的《学院图书馆标准图书和期刊的价值和危险》。而后他在1943年的博士毕业论文《学院图书馆图书收集的老化率》被认为是文献老化研究的最早的代表性论文。并且“半衰期”的概念也在戈斯内尔1944年的论文中初步形成[5]。尽管在60年代,美国的R.E.Burton和R.W.kebler对“半衰期”的概念进行了一系列的研究,并对“半衰期”作为文献老化研究的指标产生质疑[6],提议用“中值年限(median age)”来替换“半衰期”概念。但毫无疑问,“半衰期”概念的提出,是文献老化研究的一个里程碑[4],至今它仍是文献老化研究中被学界一致认为的最重要的指标之一。1971年,普赖斯提出了“普赖斯指数”概念。1974年,Line M.B与Sandison.A发表题为《obsolescence and changes in the use of literature with time》,提出了共时与历时法对文献老化的测量效果。1985~1990年间,布莱尔(Burrell)、Goughlin,Tahue及Gelman分别对mixed-poisson模型进行了老化负指数规律影响的研究。近些年来,由于网络的发展,对文献老化的研究也部分地转移到网络信息老化的研究。

网络信息老化的概念是随着文献信息老化以及网络信息概念、网络信息计量学的发展而产生。因此,网络信息老化研究也借鉴了文献老化的诸多思路和方法。a.测度指标。网络信息老化测度的主要指标仍是半衰期、普赖斯指数,计算方法也与文献老化测度指标类似。b.概念的沿用。如链接分析的概念。文献老化的研究离不开引文分析[7],在网络信息老化研究中,链接分析沿用了引文分析的理论方法,以链接为主要研究对象对网络信息老化进行各种研究。

除了借鉴文献信息老化的诸多规律和指标外,网络信息老化也有了许多新的发展。由于网络链接的特殊性,产生了如链接衰减(Link decay)[8]、链接失败(linkrot)[9]等问题,这些都成为了网络信息老化,特别是网络信息半衰期研究的一个重点内容。随着信息网络化、数字化的发展,网络信息老化研究也向数字化方向有所发展。《多媒体和超媒体最新展望》杂志于2007年1月曾刊登一篇名为《AONS-An Obsolescence Detection and Notification Service for Web Archives and Digital Repositories》的文章,该篇文章介绍了一个为网络档案和数字知识库设计的自动老化监测和通知服务系统,该服务系统可以自动地监测到老化磁盘格式,并把这些“濒临危险”的数字对象转换成当前推荐的格式使他们可以长期保存并使用[10]。

2.2 网络信息老化研究对象

网络信息老化的主要研究对象是链接,并且模仿引文分析的概念提出了“链接分析”。链接分析自诞生之日起至今已有十余的年时间,尽管已有了蓬勃的发展,但受到重重置疑。目前,链接分析的研究内容主要是关于“引用分析”的理论方法在链接分析中的应用是否可靠和可行,并提出相应的修正方案。邱均平、李江等人曾对链接分析的工具和假设前提进行了实证研究,指出了各自存在的缺陷,提出了相应的修正方案,并对链接进行了“实质性链接”与“非实质性链接”的区分[11~12]。

目前在链接分析中,出现了一个新的研究问题:链接衰减(Link decay)[8]或链接失败(linkrot)[9]。链接衰减是在网络信息老化研究中新出现的问题,也是目前研究的热点。网络引用现在已经非常普遍了,但随之而来的一个问题就是:对于那些有网络引用的文章,在它们发表一段时间后,部分网络引用的链接就无法指向被引用的网络资源[8]。被引网络资源的链接失败主要由两个原因造成的:URL失效和资源访问需要订阅或注册[13]。前者现象主要是由于:文件丢失或无法找到;网站的重组;网关错误;域名解析问题等[14]。链接衰减的定义是:链接从活跃过渡到不可到达的时间跨度。链接衰减的主要测度指标是半衰期。链接衰减是目前比较关注的话题之一,因为读者如果不能通过链接找到某文献引用的原始资料,这不利于读者对该文献更深入的研究,也给网络信息老化和链接分析研究带来新的研究课题。笔者认为,链接衰减将会是网络信息老化的一个研究热点之一,围绕链接衰减我们可以做很多的实证研究与理论研究。

2.3 网络信息老化测量指标

网络信息老化的测度指标是从文献老化的测度指标借鉴而来。对于文献老化而言,半衰期和普赖斯指数,是最重要指标之一。这两个指标是各种类型的老化研究中必不可少的测度指标。文献老化指标的测度主要分为以下三种情况:a.文献老化测度指标:普赖斯指数、引用半衰期、被引半衰期。b.期刊老化测度指标:普赖斯指数、引用半衰期、被引半衰期、剩余有益指标。c.论文老化测度指标:被引半衰期、普赖斯指数。网络信息老化的测度指标在沿用了文献老化测度指标的同时也有了新的发展:a.网络信息自身生命周期测度指标[2]:静态半衰期、动态半衰期、生存期;b.网络信息价值周期测度指标:微观网络资源半衰期、宏观网络资源半衰期、普赖斯指数、链接衰减率。由此我们可以看出网络信息老化的测度指标具有如下特点:

借鉴性。网络信息老化的很多指标都是从文献老化研究中移植而来,如微观网络资源半衰期类似于文献老化的引用半衰期、宏观网络资源半衰期类似于被引用半衰期等。

修正性。由于网络信息的特殊性,必须增加或者修改某些指标的属性进行修正,其测度才更准确。其中包括:a.网络资源信息的可修改性产生了网络资源自身的生命周期问题。因此就有了静态半衰期、动态半衰期、生存期等自身生命周期的测度指标。b.链接衰减是网络信息老化研究中的特有问题。对链接衰减的测度是网络信息老化其他测度指标的前提,链接衰减率的测度是对链接分析的修正和补充。

可改进性。网络信息老化测度指标是以借鉴为主,修正为辅。链接与引文在结构、动机、假设前提等方面上存在较大差异[11],因此以链接为主要研究对象的网络信息老化的指标测度仍有较大的可改进空间。

2.4 网络信息老化研究方法

a.实证研究方法。在网络信息老化研究中,实证研究是非常必要和实用的手段。老化研究的应用性强,再加之对老化的测度对象类型比较多,网络时代的信息量巨大,对研究对象进行大量的观察、实验和调查,获取客观材料,从个别到一般,归纳出事物的本质属性和发展规律[15],实证研究是最适合的。这些属性决定了实证研究更多的用于老化研究中。

网络信息老化实证研究有一个比较显著的特点:对研究工具的依赖性较强。网络信息老化的研究内容广泛,并且与文献信息老化相比,网络信息老化的研究要面临更多的问题、视角和细节。网上信息数量巨大,增长迅猛,如果仍像传统文献老化研究一样采用手工方式进行信息计量统计,是根本行不通的。因此,网络信息老化在进行实证研究的过程中通常都要根据自己的研究内容来开发新的软件研究工具。Dion hoe-Lian Goh在2007年对网络信息老化中的链接衰减进行研究时独立开发了一个研究软件[8],该软件可以从已经下载好的期刊论文中自动的找到这些文章中网络链接引用,并将这些网络链接引用的URL及相关的属性保存到单独的文本文件中。在这篇研究论文的最后,作者又提出了以另外的分类方法对URL进行提取和分析。按照这个思路来研究,研究软件就需要重新开发或者至进行必要的修改和升级。可以这样说,没有合适的研究工具,网络信息老化研究就无从开始,合适的研究工具是网络信息老化研究的基础和保证。

b.理论研究。网络信息老化的理论研究还处于不成熟阶段。老化研究从1943年诞生之日起到现在有65年的时间,与一些经典学科相比,仍是一个年轻的研究领域,其理论体系还尚不完善,有些理论虽然已经提出,但尚需进一步研究。因此,老化问题的理论研究,特别是基础理论研究是十分必要的。基础理论研究的预测性、前瞻性、创新性及抽象性和批判性[16]都是老化研究所急需的。特别是在网络迅速发展的情况下,网络信息老化问题带来了更多的研究视角和领域,基础理论研究的作用更是不可忽视。老化问题的理论研究是其自身发展的动力之一。

2.5 网络信息老化的应用

王宏鑫和邱均平在《关于网络信息老化研究的若干问题》一文中将网络信息老化研究的应用主要概括为以下三个方面:a.评价同一学科各站点在学术界的影响程度;b.评价某站点在不同时期内发展程度的好坏;c.指导网络站点的信息更新,帮助科研人员在科研活动中获得最新的一手资料。

笔者认为网络信息老化的应用还体现在以下两个方面:a.评价整个国家的网络信息老化情况,进而评价某个国家的整体网络信息水平情况和影响程度;揭示国家的网络信息发展规律。在此应用研究中,是以某个国家或多个国家的所有网络信息资源为研究对象。在网络技术迅速发展的时代,网络信息的增长及老化情况往往与整个国家的信息资源建设水平相关联。b.指导研究者的网络信息引用行为。通过对网络信息老化中的链接失败的特有现象进行分析和统计,可以对研究者的网络信息引用行为起到指导作用[8]。

3 今后网络信息老化研究的主要任务

网络信息老化是文献信息老化在网络时代的新发展和新挑战。网络信息老化研究沿用了文献老化中大部分测量指标和规律,如半衰期概念、普赖斯指数等;但由于网络媒体的特殊属性,如网络信息内容的可修改性、网络信息数量的急剧增长及不同于文献信息内容的增长方式,给网络信息老化的研究带来许多新的挑战和研究热点。目前国内对网络信息老化的研究非常少,但在借鉴了文献老化、网络信息计量学等研究成果下,网络信息老化研究已具备了基本的架构。以下是笔者对网络信息老化未来发展方向的一些预测和展望:

由链接失败而产生的链接衰退问题研究。链接衰退是网络信息的特有现象,链接衰退率是考察网络信息链接到达指定信息源的有效程度指标。

网络信息资源本身的老化测度。网络信息资源本身老化的研究是段宇锋在《网络信息资源老化规律研究》一文中提出。由于网络信息的更新方式带来了网络信息资源本身的老化问题。对网络信息资源本身的老化测度是对网络信息老化研究的补充与丰富。目前国内还尚无对该测度的实证研究。测度指标的改进。

有关国家网络信息资源老化的实证与理论研究。将国家网络信息资源作为整体来进行老化研究是由当前的网络特点所决定。

标签:;  

网络信息老化研究_文献回顾论文
下载Doc文档

猜你喜欢