信息生命周期研究述评(Ⅰ)——价值视角,本文主要内容关键词为:述评论文,视角论文,生命周期论文,价值论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
“生命周期”这一概念源于生物学领域,指代了一个生物体从出生到成长、衰老直至死亡所经历的各个阶段和整个过程。随着这一概念的内涵逐步被引申和扩展,生命周期被广泛地应用于物理学、经济学、管理学等各个学科领域,并逐步演化为一种重要的研究理论。生命周期理论的适用对象十分广泛,结合生物体的三个重要特性——“新陈代谢、自我复制和突变性”,可以得出生命周期方法适用的对象应该具备三个重要的属性——“连续性、不可逆转性和迭代性”。生命是指事物从产生到消亡的整个过程,这个过程由各个不同的阶段组成。不同阶段之间不仅具备连续性,而且具备时间上的不可逆转性。完成一次生命进程后,会进入下一轮生命进程,两轮之间的更迭也就是迭代或循环。据此而论,信息也是存在生命周期的,无论是它以文献形式、网络形式、文件形式抑或其他形式存在。因为信息的价值会随着时间的推移而不断衰减,尽管不同主题、不同类型信息的生命周期具体表现形式各不相同,但是都可以映射到由需求、采集、组织、存储、利用和清理等环节构成的循环上。因此,信息的生命周期是指信息从生成到其价值完全失去的整个时间区间。而从实践层面,随着计算机信息技术的发展和网络的普及,信息资源数量的急剧膨胀、大量异构类型的信息并存以及多重内外部环境交织产生的复杂性,给信息的组织管理和利用带来了很大程度上的不便。因此十分有必要借助生命周期理论来从本质上探讨信息的自身变化规律,进而在遵循信息本质规律的基础上实施具有可持续性发展的信息管理活动。
1 信息生命周期的两种观点
生命周期方法论的理论基础是社会有机体论,即用生物有机体的观点看待社会组织。主要包括社会静力学和社会动力学,其中社会静力学家认为社会如同生命有机体,它揭示了人类社会的基本秩序;社会动力学则研究这一基本秩序在达到最终阶段前所经历的曲折历程。鉴于这两大学派的思想,结合已有的信息生命周期大量研究成果,笔者认为当前对信息生命周期的理解主要有两种方式:一是基于“价值视角”。科技文献以及其他类型的信息资源随着时间的推移,其中包含的信息内容将变得陈旧过时,能够提供的情报或决策支持等价值会不断减小,甚至完全丧失[1]。信息的价值随时间推移而不断变化的过程,如同生物体的成长和衰老过程。加之,波普尔提出的“第三世界”理论,许多学者认为信息自身就是具有生命的。如“成长期、发展期、衰退期”。二是基于“管理视角”。虽然通过价值来描述信息的生命周期无疑是最好的方式,但是由于这种方法的难实施性,目前还没有一个普适的模型能够应用到各种环境各种信息资源的管理当中。因此,为了简化信息生命周期这个问题,也有许多学者按照信息产品的加工业务流程,将信息的生命周期划分为几个阶段。如霍顿提出的经典的“信息生命周期六阶段模型”——“创建、采集、组织、开发、利用和清理”。
以上两种理解方式存在许多区别:其一,二者划分阶段的方法不一样。“价值视角”主要是通过或试图通过定量的方法根据一定的测度指标来客观地描述和模拟信息的生命演化进程,然后根据生命曲线来划分阶段,或者设定一些定量的识别指标来自动识别生命周期阶段;“管理视角”更多的是研究人员从管理角度出发,在跟踪一类信息产品实际加工的具体流程或者在现有梳理的业务流程上予以提炼,将信息的生命周期过程予以分解。其二,二者描述的信息生命起点不一样。“价值视角”是以信息产生以后为研究起点,如文献发表、专著出版等;而“管理视角”则涉及信息生成之后是如何被采集、组织、存储和利用的。换言之,“价值视角”由于是以价值测度为基础,因此是以价值产生为起点,而对于信息的生成组织和后期的清理阶段,因为很难用定量的方式来测度,就没有纳入到价值视角的研究范畴。其三,观点持有群体不同。持有“价值视角”的主要包括图情领域的研究学者、一线图书馆员等。图情领域的学者观察到大量类似的现象——“科技信息会随时间推移而老化,即信息价值会随时间推移而不断衰减”,因此一部分图情学者出于探求信息本质属性的目的,从信息价值变化角度研究信息的生命周期。也有大部分图情学者和处于图书馆一线工作的图书馆员,希望通过定量的方法来辅助他们进行期刊采购、期刊清理以及馆藏发展等决策,因此也青睐于“价值视角”的信息生命周期研究;而采用“管理视角”的主要包括图书馆管理者、信息工作和信息行业管理者等。这些领域面对着大量的信息资源、传统纸质和数字信息资源,使得他们需要一套能够贯穿信息“从加工到提供服务再到保存和清理”全过程的管理理论或管理工具来进行指导。这种需求下,信息生命周期管理就成了这些领域的关注热点,而绝大多数信息生命周期管理正是以“管理视角”的信息生命周期为基础的。
2 价值视角的信息生命周期
以“价值视角”为基础的信息生命周期,描述了信息的价值在产生之后随着时间推移而不断衰减的情况。鉴于信息生命周期与信息价值衰减密切相连,信息老化也就从某种意义上常常作为价值视角信息生命周期的代名词[2]。后文如无特殊说明,均可等同对待“信息老化”与“价值视角信息生命周期”这两个概念。本质上讲,现有的价值视角信息生命周期研究大多停留在对信息载体的考察,因此后文将按照载体形式——文献、网络和文件来分别论述基于价值视角的信息生命周期研究的现状。
2.1 文献信息的生命周期
文献信息生命周期研究的发展历程有着明显的时代背景。“文献信息生命周期”观点在重新受到关注之前,自身也经历了一个长期的研究低潮,可能是因为许多领域的信息存着明显的效用价值衰减现象,而使得文献的老化问题不值得上升到科学的层面来进行研究和深入分析。
(1)1950年以前
这个时期的代表人物是戈斯内尔(C.F.Gosnell),他第一个系统性地展开了文献信息生命周期的研究,而且创造性地提出了许多测度生命周期的指标。可以说,戈斯内尔开创了文献信息生命周期研究的时代。
“老化”这个概念最早出现于Gross等在1927年的研究中[3]。作者通过分析1926年《化学文献》期刊上的所有参考文献,发现其中一半的参考文献来自于过去的15年内。尽管Gross等首次提出了老化概念,而美国纽约大学的戈斯内尔却第一个系统化地展开了对文献生命周期问题的研究,并于1943年在其博士论文《大学图书馆藏书的老化率》中指出:“在知识的累积(表现为文献的累积)过程中,随着时间的推移,一切知识或其相应的载体会逐渐失去原有的价值,逐渐变得不再有用或不再可靠”[4]。随后1940-1944年期间,戈斯内尔连续发表了3篇研究图书馆藏书老化问题的研究论文,并创造性地提出了文献生命周期的幂指数模型,还提出将“半衰期”和“老化率”作为生命周期的测度指标[4~6]。
(2)20世纪50~70年代
在接下来的20年中,戈斯内尔的成果并没有得到广泛的关注和认同,而且很少出现价值视角生命周期相关的研究。正如Evans认为的,可能是足够多的经费和足够大的图书馆空间使得信息生命周期这一课题变得并没有多大吸引力和价值。然而,这个短短不足20年的时期,却涌现出了一批贡献卓越的先驱——贝尔纳(J.D.Bernal)、巴尔顿(R.E.Burton)、普赖斯(D.Price)、布鲁克斯(B.C.Brookes)等,他们的成就也奠定了信息生命周期后续至今的研究格局。
1958年,著名物理学家贝尔纳借用原子物理中半衰期的概念,为情报学家修正和发展了“半衰期”的概念,明确区分和精准定义了“真实半衰期”(true half-life)和“回溯半衰期”(back half-life)[7]。1959-1961年,基于其对文献生命周期更深入的理解和贝尔纳提出的“真实半衰期”的难实施性,美国的图书馆员巴尔顿对半衰期的概念加以了改进,他认为“半衰期”指示了当前活动文献中较新的一半是在多长时间内发表的,而且他们还进一步明确了“当前活动文献”就是指当前仍然被引用的文献[8]~[12]。1965年,美国著名文献计量学家普赖斯在对引文进行大量统计分析工作后提出了“最大引文年限”的问题,即文献发表后其被引用频次达到最高的年份[13]。而且,他还进一步在1971年提出一个衡量各个知识领域文献生命周期的定量指标,即后来著名的“普赖斯指数”[14,15]。1970年,布鲁克斯提出了经典的文献生命周期负指数模型,即在一个确切时间内,被引用的论文与它的发表年度呈负指数函数关系。不仅如此,他还定义了许多文献信息生命周期研究当中的重要概念,如效用、效用因子和年度老化因子等[16]。
(3)20世纪70~90年代
然而,到了20世纪70年代末,更确切的是80年代,图书馆面临紧缩的财政预算和库存危机,使得人们不得不重新重视对文献信息生命周期问题的研究,以便发现文献的利用规律,进而预测它们未来的使用趋势,从而为图书馆的馆藏发展计划,如订阅采购、清理等决策提供辅助。为此,Gosnell的经典文献在1978年得到大量的翻印。这个时期文献信息生命周期的研究可谓是百家争鸣、百花齐放,研究关注点主要分布在以下四块内容:
其一,集中在对文献信息生命周期重要问题的论述上。这部分的代表性成果包括几篇经典的综述(Seymour,1972;Line,1974;Gapen,1981),他们在全面回顾以往信息生命周期大量研究成果的基础上,针对以下重要问题进行了深入讨论:①不同测度方法,如历时观测法、共时观测法对文献生命周期的不同测度效果[17];②“效用衰减”与“价值老化”之间的本质区别;③引用、实际使用与效用价值之间的关联。其二,对文献信息生命周期模型的探索和重要测度指标的不断修正。自从“巴尔顿-凯普勒老化方程”、“负指数模型”、“半衰期”、“普赖斯指数”等模型和重要测度指标被提出以后,许多学者开始投入到模型完善和测度指标修正的研究。从这方面大量的研究成果来看,模型和测度指标的优化主要是在以下两对关系中寻找各自的平衡:“准确性与经济性”、“普适性与独特性”[18]。其三,也有许多学者关注老化机理的研究,他们试图挖掘出影响信息生命周期演进进程的相关因素[19~21]。综合所有已经被关注的影响因素,从本质上讲,这些影响因素可以概括为以下六大类:信息资源自身相关的因素,用户相关的因素,获取渠道相关的因素,来自其他资源的影响,用户对用户的影响以及研究设计环节的相关因素。其四,广大研究学者基于文献的引用数据、文献信息的被利用数据等,展开了大量的实证研究。而且随着研究的不断深入,研究粒度也逐步细化,从“科学领域——学科——出版物——期刊——文献”逐级深入。当前的研究已经深入到文献层面,同一期刊中不同类型文献,如综述、研究文献、书评,之间的老化速度有何区别。
(4)20世纪90年代末至今
20世纪90年代至今的现状是大多数图书馆内传统纸质资源都不再以指数速度增长,然而资源建设上的速度放缓,并没有抵消因为新馆预算缩减带来的馆藏空间紧缺的压力。加之,数字化信息资源的兴起,使得传统纸质馆藏的需求也呈现出逐步下降的趋势,导致越来越多的传统图书馆都慢慢接近了馆藏空间需求的临界点。因此,以传统图书馆和纸质文献资源为对象的信息老化研究在这个阶段呈现出持续降低的热度,更多信息老化研究领域的学者开始将关注点逐步转移到数字馆藏、数字图书馆以及网络信息资源等对象上。
这个阶段,数字图书馆无疑成了文献信息生命周期研究的热点。数字图书馆也面临着传统图书馆类似的馆藏管理的问题,涉及数字资源如数字期刊、期刊全文数据库、专利数据库等的选择和采购,数字资源面向读者的展示序列和方式,而且随着数字资源的膨胀,数字图书馆也同样面临着存储空间紧缺的难题,因此大量的学者开始以数字图书馆的使用数据以及数字文献的引文数据为基础,开展基于价值视角的数字文献信息生命周期研究。
当然,不仅只是研究对象的简单转移,这个阶段的研究也呈现出了新的特点。以往的文献信息生命周期研究往往只能依靠纯手工统计来完成,使得无论是样本量还是跨度时间都比较小,从某种程度上也限制了研究成果的普适性。而随着大量的传统纸质文献资源被数字化,加之自动化科研工具的便利,使得现在的价值视角信息生命周期研究能够面向更大的样本量和数据集展开,同时跨度时间也能够扩得更宽,进而使得当前的文献信息生命周期研究在宏观层面以及普适性上有了进一步突破。如Lariviere等在2008年以ISI数据为基础,就针对1900-2004年跨度100年的科技文献的信息生命周期问题进行了研究[22]。
2.2 网络信息的生命周期
近年来随着互联网的迅猛发展,网络信息表现出来的生命现象也引起了人们的普遍关注,因而对文献信息生命周期的研究越来越多地转向网络信息的生命周期研究。从某种程度上,可以认为网络信息与文献信息本质是一样,只是载体形式发生了变化。因此,网络信息生命周期研究继承和借鉴了文献信息生命周期的诸多思路,包括概念、测度指标和测度方法等[23]。当然,网络信息资源也表现出了许多特性,首先是研究对象层面,不是以期刊文献为主,而是以网页、网站为主要对象;其次,由于信息资源所处环境发生变化,用于研究的使用数据不再是引用数据,而是以链接数据为主;而且,由于网络链接的特殊性,出现了如链接衰减和链接失败[24]等问题,因此价值视角下的网络信息生命周期研究也被赋予了新的内涵[25,26]。根据具体研究对象的不同,网络信息生命周期研究主要可以分为两大类:
其中,第一类网络信息生命周期研究主要以网页或网站为研究对象。J.Bar-Ilan和B.C.Peritz于1999年最早运用文献计量学分析方法研究了特定主题的网络文档在一段时间内的动态性,他们选取与“信息计量学”主题相关的网页集合为对象,进行一项为期5年的历时研究,分别于1998、1999、2002和2003年对这些网页进行观测并寻找该主题相关的新网页。通过分析变化和消失的比例,就可以发现这个主题网页的变化规律[27~29]。J.L.Ortega,I.Aguillo和J.A.Prieto从NetCarta.com收录的网站中选取738个网站,于1997年和2004年分别进行纵向研究,指出网络内容的快速增长掩盖了其老化现象,网络信息的增长是以原有内容的消失为代价的[30]。Bar-Yossef等提出了一套行之有效的网络信息生命周期测度措施和算法,并将其应用到搜索引擎、网页维护者和个人用户[31]。
这类研究中最典型的代表是W.Koehler基于361个随机网页和343个随机网站在不同的时间跨度上,进行了一系列基于价值视角的网络信息生命周期研究[32~34]。Koehler在1999年的研究中观测了这批网页与网站在53周的变化情况,得出网络信息历时半衰期为1.6年,且进一步归纳了网络信息的衰减现象。作者指出,互联网具有“短暂记忆”的属性,即网络信息随着时间的推移消失或改变。在该研究中,作者用名为WebCrawler的工具在网络上获得随机URL为研究对象,并将网页的访问状态分为三类:一直可访问的网页;间断可访问网页;不可访问网页(URL已被删除)。随后在2002年,Koehler针对同样的研究样本在214周(从1996年12月到2001年2月)以来的变化情况,得出网络信息半衰期为2.0年。同时,作者也预测导航型网页可能比内容型网页更稳定。通过对该研究样本长达6年的跟踪研究后,Koehler在2004年的研究发现:①一个网页集老化后会逐渐趋于稳定;②不同的域名类型、学科和主题领域,网络资源半衰期不同;③导航型网页半衰期比内容型网页长。
第二类比较具有代表性的研究是对科技文献的网络引文进行半衰期的测度和链接衰减研究。这类研究首先选定一批科技文献网络引文为观测对象,进而历时跟踪并记录该集合中每个链接的可访问状态。然后统计得出,每个观测点上该集合中处于不可访问状态的链接所占的比例,即该观测点与初始点之间这段时间跨度期间链接的衰减比例。而当该衰减比例达到50%所经历的时间,或者说该观测点距离初始点的时间跨度,也就是这批网络引文的历时半衰期。以网络引文为对象的研究最早始于1996年Harter和Kim针对131种电子期刊中的网络引文展开的分析[35]。随着网络引文在学术论文中使用得越来越多,其可达性也引起了信息老化研究者的关注。
当前关于网络引文衰减规律的研究,主要集中在三个方面的内容:其一,总体上的指标测度,主要指“半衰期”、“链接衰减率”这两个指标。通过已有研究,可以发现“不同的学科,引用半衰期不同”这一科技文献信息生命周期规律在网络环境中是同样适用的。例如,法律学科网络引文的被引半衰期为1.4年[36],而计算机学科中的为4年[37],生物化与分子学中的为4.6年[38]。其二,通过实证研究,探寻影响网络引文历时半衰期的影响因素。主要方法是在某一分类标准下,对比研究不同类型的网络引文之间半衰期是否一致。当前的研究主要集中关注“域名类型”、“网页深度”、“内容分类”这几个影响因素。“域名类型”方面,研究发现链接衰减最快的是域名依次为edu,com和org的网络引文;“网页深度”影响因子,许多学者都发现半衰期与网页深度相关,一二级网页明显比四五级网页稳定,链接衰减率要低许多;“内容分类”影响因子,主要指该链接是期刊文献、网站首页、教育材料或是其他,由于此影响因子的实证探索需要更多的人工分类介入,因此还没有研究以此为切入点。当然,还有一些个别研究提及的影响因素[39,40],如国家域名(如.uk、.cn、.de等)、扩展名(如.shtml、.txt等)以及端口(如80、8080等)。由于这几个标识在许多URLs中使用并不规范,所以这方面的研究是否有效还有待进一步考察。其三,探讨链接失效或链接衰减的原因。当前研究主要通过两种方式来寻找原因:一部分研究通过链接失败返回的错误代码来归纳衰减原因,Spinellis发现最主要的错误原因是无法查找(HTTP代码404),占总数的60%。其次是域名无法解析(HTTP代码901),占到22%,随后是网络问题(HTTP代码504),占到8%。Sellitto以及Goh也分别做过这种研究[41,42]。另一种是将现实生活中可能出现的问题进行分类,归纳出来的原因有:①链接更改。问题可能出现在域名更改、网站结构更改或者网络协议更改等;②网络问题。比如网速、防火墙等原因造成的无法连接;③网络信息的可获得性问题。资源可能从自由获取变成了需要付费或者仅限于会员;④人为原因。例如当研究者更换居住地的时候可能更换个人主页,或者是该研究者以前常使用个人电脑作为服务器,现在则使用学校或研究机构的服务器。
2.3 文件信息的生命周期
20世纪90年代以来,随着数字化和网络技术的发展,文件系统所处的内外部环境发生了巨大变化。首先,传统的印刷版文件被越来越多的包括多媒体文件在内的数字化文档所取代;其次,信息化和办公自动化造成企业信息资源快速增长,给企业内部的文档管理带来了不小的挑战,使得企业和大型文件系统不知道应该依据何种标准来有效管理内部大量存在的数字化文档。应此需求,文件老化的概念于1994年由Dahin首次提出,作为改进网络文件缓存性能的方法。在一个文件缓存系统中,本地工作站会保留使用频率最高的文件以最小化网络阻塞网络信息流通量。而Smith和Seltzer也于1997年利用文件系统检验了信息生命周期问题。每当文件被使用,信息价值的衰减问题就会改变文件的迁移价值[43]。因此,一个文件若被经常使用,它就越不可能会被迁移;同样的道理,如果一个文件没有被使用过,迁移值也会被改变从而面临迁移。本质上而言,文件信息生命周期研究采用的思路正是价值视角的信息生命周期研究方法。
价值视角下文件信息的生命周期研究直接源于文档管理和数据存储的实践活动,因此在大量的研究当中,数据迁移算法无疑是重点和难点。数据迁移算法是根据数据的效用价值,如被利用频次等指标,自动计算其价值老化程度并进行存储位置迁移的算法。但是,需要指出的是,数据迁移算法早在文件信息生命周期概念被明确提出之前就已经在理论层面和小数据集应用上进行了大量研究。当然,20世纪90年代以来大文件系统、大数据集的广泛出现,也给传统数据迁移算法带来了适用性上的挑战,而计算机自动化技术也令数据迁移算法的检验和实现更加容易。因此,越来越多的研究人员再次投入到数据迁移算法的验证和进一步完善的工作当中。
当前已经存在大量得到不同程度应用的数据迁移算法,这些算法包括:“先进先出算法”(FIFO,First In First Out)是基于文件在系统中存在的时间长短来进行迁移的,先进入系统的文件将优先被转移;“最近利用最少算法”(LRU,the Least-Recently Used)主要考虑文件距离上次使用的时间跨度的长短,即首先将最长时间不被使用的文件迁移到第三方存储设备中;“文件大小决定算法”(Size-only),是一种只考虑文件大小的算法。该算法与先进先出算法有同样的问题,即文件过去被使用的方式与它现在是否选择被迁移无关;“空间时间算法”(Space-time algorithms),最早由Alan Smith在1981年提出。该算法考虑了文件的大小和距离上一次使用的时间间隔,实际上是结合了最近最少利用算法和只考虑文件大小算法。
很长一段时期内,空间时间算法被认为是最优的文件迁移算法,Strange就在1992年测试了该算法,发现该算法仍然有效。但是该算法仍然存在一个问题——没有考虑到文件的历史使用特征。为此,又出现了“文件老化算法”、“时间—效用价值算法”等更加复杂的算法,这些算法都是通过观测文件被利用的历史特征来预测未来的使用情况[44,45]。Tim Gibson等在1998年的研究中发现文件系统中50%~80%的文件可以被压缩或者迁移到更低层次的存储设备,而不会给用户带来明显的影响,在此基础上他们提出了一种文件效用价值预测算法,称为“文件老化算法”(Aging-algorithm)。该算法建立在“文件最后一次使用的时间”、“文件的大小”和“上一次计算出来的迁移值”这三个因素的基础上,通过对经常被访问的文件进行“奖励”,对长期闲置的文件进行“惩罚”,进而决定其存储等级。Ying Chen于2005年提出了“时间—效用价值算法”(Usage-overtime),这是一种基于特定信息被利用情况的信息价值定量测度方法。主要包括两个要素:“最近使用时间”和“信息效用价值的度量”(包括使用频率、访问间隔时间等其他因素)。Lars Arne Turczyk等在2007年的研究中认为文件的价值可以通过其过去的利用信息和未来的利用概率来计算,并提出了一种概率论计算方法。
数据迁移算法的不断完善也从一定程度上折射出了文件信息生命周期研究的发展趋势。首先,文件信息生命周期研究应该立足于当前的使用状态和使用特征,充分考虑一切可能影响文件信息生命周期的因素,并在此基础上提炼关键影响因素;其次,文件信息生命周期研究应该充分重视历史使用模式,信息生命周期的迭代性显示历史使用模式与当前和未来的使用模式之间存在一定的关联性;最重要的一点,文件老化研究应该着眼于未来,只有能够有效地预测文件未来使用情况的研究和模型才是真正有意义的。
3 价值视角信息生命周期研究的发展趋势
无论信息是依附于何种形式的载体而存在,从价值视角出发的信息生命周期研究目的在于通过定量的方式探寻信息的本质规律,进而在此基础上实施有效的信息生命周期管理。然而,从当前的研究来看,价值视角的信息生命周期研究要想完全融入信息生命周期管理的体系当中,还存在一些需要改进和完善的地方。主要集中在以下四个方面:信息效用价值的概念体系构建;研究对象的深化以及关注阶段的拓展;信息生命周期模型和测度指标的三大发展趋势;信息生命周期影响因素的系统化研究。
3.1 信息效用价值的概念体系
信息的生命周期本质上应该依据信息价值的变化得来,但是出于操作的方便性,以及用户为中心的理念,本文采用效用价值来体现信息的价值。笔者基于了这样的假设——“使用越多,效用价值越大,对于用户而言该信息的价值也就越大”。已有的大量研究中,信息的效用价值被解读为信息的被利用,如文献的被引用、数据的被下载等。实际上,不同的用户对信息的使用会有不同的方式——浏览、收藏、阅读、标引、下载、引用等,换言之,信息的效用价值存在多个侧面,那么到底何种使用方式或哪个侧面能够诠释信息的效用价值[25~39]。针对这种情况,笔者认为可以有两种处理办法:
其一,单一观,利用单一的使用行为来诠释信息的效用价值。当前的大多数信息老化研究正是基于这种思路——某一特定行为如“引用”能够在很大程度上代表信息的效用价值,这样的简化在节省操作成本的同时往往也能获得不错的效果。但是,在不同的研究和实践环境下,可能会因为过于片面而有失偏颇。因此需要论证某一特定行为能够在多大程度上代表该信息的效用价值。其二,整体观,综合考虑效用价值的各个侧面。这种观点建立的理解基础是,效用价值的每个侧面只能代表一部分用户对该信息的利用情况,只有综合考虑各个侧面才能完整地代表信息的效用价值。当然,结合信息所处的具体环境,不同的侧面对效用价值的贡献存在一定的差异性。因此需要区别对待不同侧面的情况,可以配以权重予以解决。正是因为信息效用价值在不同环境下的不同理解,以及存在多个侧面,使得信息生命周期的研究在效用价值这一切入点上就难以保持一致,因此有必要针对信息的效用价值构建一套通用标准的概念体系和通俗的理解。
3.2 研究对象和关注阶段
价值视角信息生命周期的研究对象需要进一步拓展和深化。当前的价值视角信息生命周期研究主要还是以文献信息为主要研究对象,随着数字化和网络的大力发展,信息生命周期研究应该把注意力转移到数字图书馆、网络信息资源以及企业信息资源上来,以适应实践指导的需要。进一步从对象角度来看,当前基于价值视角的信息生命周期研究,无论是文献信息生命周期、网络信息生命周期,还是文件信息生命周期研究,均是停留在载体层面,还没有深入到信息、甚至于知识层面。然而,研究的深入也存在诸多难点有待突破。相比而言,基于信息载体的使用变化是直观可见的,而信息的效用价值变化却是很难直接测度的。可能同一信息,在经历文献载体形式的生命演化进程以后,被数字化并转移到网上以网络载体的形式继续其生命进程。正因为此,信息效用价值的衰减是一个更加漫长的过程和更加复杂的事物。而知识,作为信息价值链上更高级的形态,其对象更加隐性,这进一步给研究对象的获取和定量研究带来了更大的挑战。
价值视角下的信息生命周期研究需要拓展其关注阶段的跨度。首先,尽管大多数研究包括本文在内,都称信息老化关注的是信息的整个生命周期过程。但是由于价值视角信息生命周期研究主要是从效用价值出发,因此实际上当前的价值视角信息生命周期主要还是集中在信息资源被用户利用的阶段,对于早期的信息产生阶段和后期的信息清理处置阶段并没有完整地涉及。而从信息生命周期管理的角度而言,对信息生命周期的理解还是应该贯穿到始末,因此这对价值视角信息生命周期的关注阶段提出了更广的要求。要求传统的信息老化关注阶段要进一步延伸到包括产生和清理等始末阶段在内的全生命周期阶段,这就需要引入新的研究方法和思想来整合当前的价值视角信息生命周期研究。其次,值得注意的是,信息生命周期有别于生物体生命周期的最大特点之一,就在于大多数信息的生命周期存在多个循环,而且下一个循环并非是上一个循环的简单重复。然而,效用价值生命周期或者当前的价值视角信息生命周期往往只是关注了单一生命周期过程,并没有考察信息生命周期存在多个循环的情况。也只有少数的研究提到信息的激活或者唤醒现象,并没有专门的研究来对原因和机制进行深入探索。
3.3 生命周期模型和测度指标
信息生命周期模型和测度指标的优化,需要朝以下三个目标发展:预测功能、情境性以及平衡性。其一,预测功能。已有的价值视角信息生命周期模型和测度指标,大多只是根据近期的使用情况来描述当前的静态特征。而实际上,信息生命周期模型和指标的研究意义就在于,能够具备预测功能,能够为未来的决策提供理论上的定量支持。因此,信息生命周期模型和测度指标需要能够描述特征的动态演化,进而通过这种变化趋势来预测该信息在未来的使用情况[30]。信息生命周期模型和测度指标应该充分重视历史使用模式,可以通过迭代模型,将上一次的使用模式特征纳入到下一次使用情况的评估预测当中;同时,也可以结合概率模型,通过大量群组信息的统计,来预测相类似的信息资源在未来某一时刻被利用的可能性。总之,信息生命周期模型和测度指标的研究,不仅仅要立足于当前,更需要的是具备预测信息未来效用价值的变化趋势,只有能够有效地预测信息资源未来使用情况的研究和模型才是真正有意义的。
其二,情境性。不同图书馆的读者和用户是有差异的,即便是针对同一图书馆的研究,由于其读者和用户并非固定不变,信息的老化模式和速度也存在不同。正是因为存在着诸多类似的种种差异性和变化性,最理想的研究状况是,每一类资源都按照其特有的方式被考虑,只有在通用模型的基础上结合信息资源所处的具体情境展开的研究才是真正具有实践指导意义的[26~28,31,32]。因此,当前的价值视角信息生命周期研究,研究粒度应该更加深入和精细化。除了从整体上测度某一学科或某一期刊的老化指标外,还应该深入到文献层面,针对不同学科领域不同期刊的不同类型文献展开研究,同时还需要针对不同类型的用户展开价值视角的信息生命周期研究。同样的道理,对于网络信息资源而言,还需要结合具体的使用环境,对更加细分的链接集合甚至于单个链接资源进行针对性的信息生命周期研究。同时,还需要结合具体的研究情境,提炼出新的测度指标和测度方法以解决特定问题。
其三,谋求“准确性”与“经济性”的平衡。信息生命周期模型和老化指标不仅应该客观地描述当前的静态特征,更应该反映未来的变化趋势。而对趋势的把握,就要求模型和指标在准确性上具备足够的保障,否则也就失去了预测的意义。与此同时,从实际操作层面而言,模型的构建和指标的测度还要考虑到操作的简易和便利性,即所谓的“经济性”。因此,信息生命周期模型的构建和指标的测度方面,需要兼顾到“准确性”与“经济性”这两个方面,既能够满足趋势描述上的精度,又能方便实际操作。
3.4 信息生命周期影响因素
信息生命周期影响因素的挖掘有待进一步的系统化研究。当前的价值视角信息生命周期研究,大多是探讨单一因素对信息的价值老化速度和生命演进模式的影响,如数字化、文献增长等单一因素对文献信息生命周期的影响[31,33~37]。因为不同学者关注的角度不同,因此提炼出了许多影响信息生命周期的因素。然而,很少有专门的研究针对这些因素之间的相互影响展开。实际上,如此多的影响因素之间存在着错综复杂的相互影响关联[38~43],如数字化一方面会造成数字文献的大量增长,另一方面也会使得获取通道的便捷,进而影响到信息的价值老化情况。又如,获取渠道的通畅与否,往往会影响到用户的心情,进而也会从这条路径对信息的生命演进产生影响。因此,针对已经提炼出来的诸多影响因素,有必要借助类似结构路径方程的方法系统化地探索它们相互之间的影响关系存在情况、关系方向以及影响力度等具体问题。
标签:组织生命周期理论论文; 文献回顾论文; 网络模型论文; 老化测试论文; 文献论文;