网络信息失败过程中的剩余价值度量_失效模式分析论文

网络信息失效过程中余留价值测度,本文主要内容关键词为:过程中论文,价值论文,网络论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

“生命周期”概念从自然科学扩展到社会科学,并逐渐演化成为一种重要的研究理论,近几十年被大量用在信息系统及信息管理中。同有机生命体一样,信息也表现出了一定的生命特征,尽管不同主题、不同类型的信息,在具体的表现形式上各不相同,但都可以映射到由需求、采集、组织、存储、利用和清理等环节构成的循环上,其生命周期指的是信息从生成到其价值完全失去的整个时间区间[1]。

由于信息价值体现和作用方式的特殊性和复杂性,目前学术界对于信息价值测度仍然没有达成共识,但基本认同“信息的价值会随着时间的推移而不断衰减,价值的流失即为失效”这一观点。从某种意义上讲,早期的信息老化研究也是为了测度信息价值,采用的测度指标主要是“半衰期”和“老化率”,关注的是信息的整个生命过程。但具体到信息生命周期的各个阶段,其价值变化是很难测度的,尤其是始终处在动态变化中的网络信息。值得注意的是,信息要想实现它的价值,必须首先引起人们的关注,而信息获得的注意力(或受关注度)随时间推移逐步降低,是信息失效的一个显在反映。

基于上述思想,本文在《Pareto/NBD模型在网络信息失效判别分析中的探索性研究》[2]一文所构建网络信息个体失效的Parete/NBD模型的基础上,依旧使用人民网强国论坛的数据作为实证对象,以马尔可夫链为理论指导建立了网络信息个体价值计量模型,以一种新的视角探索信息价值测度。

1 问题的提出

赫伯特·西蒙认为“信息消费的是信息接收者的注意力,信息越丰富,会导致注意力越匮乏。信息并不匮乏,匮乏的是我们处理信息的能力,我们有限的注意力是组织活动的主要瓶颈”[3],这种观点被IT业和管理界形象地描述为“注意力经济”。因此,注意力和信息有着非常密切的关系(见图1)。我们不具备、或者“稀缺”的不是信息,而是“完全信息”,在不完全信息向完全信息转化的过程中,需要付出人们的注意力,可以说,信息在没有获得人们注意之前可能具有潜在价值,但是有价值的信息必须获得人们的注意[4]。

信息价值和获得的注意力之间关系可以用以下公式描述[5]:

在引入期中,0<k1,信息的价值就是该信息在收集、处理、加工和发布时,网络业者为其付出的注意力;在成长期和成熟期中,k>1,信息发布一段时间后,引起了人们的注意,价值增加了;在衰退期中,0<k1,信息淡出人们的关注后,随着时间的推移,即使该信息还存在潜在价值没有发挥出来,也没有人注意它,价值增长缓慢;在失效期中,k0,信息得不到人们的注意,已经处于失效状态。

对于网络信息而言,其获得的注意力主要反映在用户对网络信息的利用行为上,主要有点击、浏览、评论、收藏和分享等。为了突出研究的重点和简化模型,选用用户评论行为进行分析,并给出命题2:用户对网络信息的评论(Comments,C)越多,该网络信息的价值(Network Information Value,NIV)也就越大,即有

NIV∝C或NIV=k(t)C

显然,在这种计量方式下,网络信息的失效应当在观测期内出现。但对于绝大多数网络信息,当第一次获得关注的时间点处于观测期内相对较晚的时间段时,失效点不一定在观测期出现,即该网络信息何时进入失效期是未知的。因此,对于这种截尾数据,如何计量其价值,特别是余留价值,需要引入新的方法和模型。

2 方法与模型

2.1 Pareto/NBD模型的相关结论

2.1.1 参数估计

实际上,对失效的判断通常是以一定时间内不再获得评论为依据的,因此,在验证期(T,T+t]内(如图2),研究发生至少一次评论的概率与P(active)值的相关性,可检验P(active)作为失效判据的效果。

统计结果如表1所示,通过相关性分析,可以认为P(active)能较好地描述和预测网络信息的失效规律。验证期中,网络信息个体在活跃度区间(0,0.1],仍然出现被评论情况的个体信息如表2所示。

需要指出的是,对于在较早时间点已经失效而在后面的时间点出现第二次生命周期的帖子信息,研究中将其视为“信息唤醒”(information awakening)[6],这里只考察第一个失效点之前的生命周期过程,例如表3中ID为9405、9476和10164的帖子。因此,在对余留价值测度的过程中,其寿命预测仅计算一个生命周期时间。

2.2 马尔可夫链的引入

2.2.1 马尔可夫链的基本理论

网络信息不断被评论或逐渐不被评论的过程间接导致了其生命状态序列的形成。用户对网络信息的评论行为,只与网络信息现在所处的状态有关,而与之前的状态无关,这显然具备了马尔可夫性(无后效性),为引入马尔可夫过程来计量截尾数据类型的信息价值提供了可能。

当网络信息个体未获得评论时,就会依次进入下一个测算阶段;一旦获得评论,便返回第1个测算阶段;在最后第n+1个测算阶段中,因为距离最后一次获得评论的时间太长,所以认为该网络信息个体已经失效,其不会再次获得评论的概率为100%。

2.3 余留价值的测度模型

2.3.1 研究对象

通过对数据样本进行生存时长的计算与统计(如表4),可以发现,寿命在6小时以内的帖子占到了总量的56.10%,约78%的帖子其寿命小于24小时(1天),仅有11.40%帖子的寿命超过72小时(3天)。由此表明:强国论坛帖子信息的生存时长均较短,但也有少部分帖子具有极强的生命力。这从一个侧面反映了网络信息所蕴含的价值呈现出不平衡性,符合二八定律。因此,在本文实证研究中,选择的网络信息个体作为余留价值测度的对象。

2.3.2模型构建

按照网络信息在一个生命周期内获得评论的模式(如图3),根据马尔可夫过程的转移概率矩阵理论,得到网络信息个体获得评论的单步转移概率矩阵。

3 实证研究

3.1 数据分析

本次实证数据为文献2中抽取的1000条数据样本,在观测截止时刻的参数估计为:r=1.4165,α=21.7950,s=1.0100,β=22.4711, LL=-24663,因此,网络信息个体在活跃的情况下平均每个小时获得评论的概率为r/α=0.0650,即每4个小时获得评论的概率为0.26,故以每4个小时为一个测算阶段,即T*=4。

在由评论次数所体现的信息价值过程中,价值关系系数k取决于所处于的生命周期阶段,在所处阶段不明确的情况下,不妨取k=1,于是价值矩阵为:

值得注意的是,Pareto/NBD模型最先运用在市场营销中,且大多数学者的研究结果认为可以确定以P(active)=0.6为客户从“活跃”到“不活跃”的一个临界值。对于网络信息而言,出于在一个完整生命周期内测度余留价值的目的,将阈值点设为 (active)=0.06,尽可能勾勒一个完整生命周期内的“信息—用户”的活动过程。在实际运用中,阈值点的设置还可以起到细分客户群体,分类管理,以及失效预警作用,这在齐佳音等[10]对神州数码公司的实证研究中可以体现出来。而类似地,对网络信息,也可以据此进行管理,将高价值的信息提取出来,并进行失效预警管理,因此,对失效判别的阈值点设置需要因地制宜。

4 结语

网络信息资源管理中有三个无法回避的客观问题:信息的爆炸式增长,用户注意力的稀缺,存储成本的不断攀升。长期以来,网络信息管理者很多情况下是根据这三者的历史信息,通过经验式判断来分析信息个体在未来时间的被利用情况。这是网络信息资源管理领域中的一个热点,也是一个难点。

本文通过基于Pareto/NBD模型得到的网络信息失效判据,对信息个体进行寿命预测,并根据马尔可夫链的理论构造了网络信息获得评论的马尔可夫模式,在取得用户评论数据的前提下,利用MATLAB程序可以非常方便地计算网络信息个体的余留价值。显然,这种量化分析会使得网络业者清楚地看到,用户对哪类信息和什么信息最感兴趣,区分出重要信息和次要信息,从而为网络信息资源的开发利用提供一定的参考依据。

需要说明的是,本文的测度模型对“信息—用户”的互动过程进行了大幅简化,只考虑了评论行为,如何将点击、浏览、收藏、分享等其他用户行为加入到模型中是需要进一步考虑的。在研究对象上,互动更为典型的微博可能更加适用于该测度模型。

标签:;  ;  ;  

网络信息失败过程中的剩余价值度量_失效模式分析论文
下载Doc文档

猜你喜欢