基于网络中心的社区经济模式中标签与用户交互研究_桥接模式论文

基于网络中心性的Folksonomy模式中标签与用户互动关系研究,本文主要内容关键词为:互动关系论文,心性论文,模式论文,标签论文,用户论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 引言

      知识组织中早期的形式结构主义思想认为,人文因素纷乱无序且难以把握,因此大多数知识组织研究聚焦于剥离了人文因素的客观知识自身关联关系的揭示。然而这种知识客观性浓郁的组织视角正在随着Web2.0应用模式的普及和网络结构主义的崛起而逐步被新的知识组织模式所取代。Folksonomy[1]知识组织模式自诞生以来对传统知识组织体系结构提出了巨大的挑战,社群用户的群体意识在Web2.0环境下知识组织体系结构中的作用得以彰显,使得人们不得不对知识关联及其背后的动力机制重新审视。随着Folksonomy知识组织模式在互联网上的迅速蔓延,相关的研究工作也在知识组织研究领域中持续升温,人们也开始反思,在知识关联关系演化的过程中,人与知识的互动是否会对领域知识的结构关系产生影响。

      事实上,Folksonomy在带给人们极大的感知易用性的同时,也同时显露出Weinberger D[2]所说的极致的“乱”。毕竟由于语言和思维在人类文明中的不可替代性,知识组织中的人文因素也随着语言和思维的运用渗入了知识关联的血脉,融入了知识的组织结构。人文因素从多个层面上滋养着、浸润着知识的组织体系结构,使知识组织成为Shirky C[3]说的重于结果的过程。

      本研究采用复杂网络的理论与技术,基于Folksonomy知识组织模式中标签与用户的隶属关系构建“标签-用户”2-模网络,采用网络中心性分析方法从核心凝聚性、桥接控制性、关联紧密性3个方面对标签与用户的相互影响关系进行分析与研究,以期从标签与用户相互影响的互动关系分析中,对知识与认知互促互扰规律的揭示做出有益的尝试。

      2 研究现状及相关工作

      Popper K[4]在阐明“世界3”(客观知识世界)的实在性和自主性的同时,也承认“世界3”是人类活动的产物,并强调只有“世界2”(主观认识世界)才能对“世界1”(客观物质世界)和“世界3”产生干预。在后期的研究工作中限于定量研究方法的匮乏,大多数研究工作难以对客观知识与主观认知的互动关系做出定量分析和研究。近年来引入图书情报学研究领域的复杂网络(Complex Network)[5]理论将网络节点理解为“行动者”(Actor),为从人文因素的视角展开知识组织相关研究提供了新的契机。华盛顿州立大学的Sarker S等[6]将复杂网络分析应用于知识群落中的核心知识及社群中的知识领袖识别研究,并采用复杂网络分析中的“结构/关联”方法,通过对网络中节点关系的分析,揭示了处于网络中心位置的核心知识以及知识领袖的成因。Abbasi A等[7]则采用复杂网络分析技术构建了研究者合作网络,并基于合作网络借助回归分析对核心作者进行了识别。

      在具体针对Folksonomy知识组织模式的研究中,Uddin M N等[8]提出在Folksonomy知识组织模式中,建立标签之间的语义关系时,不仅要考虑标签、资源、用户三者之间的关系,更要考虑三者之间的动态关联。伦敦城市大学的拉弗蒂Rafferty P等[9]从“专家-作者-用户”的不同层面进行了比较研究,基于多个角度提出了Folksonomy对其他知识组织体系具有弥补、完善、促进等功能。PetersI等[10]认为,在网络环境中沿着标签路径,用户和资源之间建立了一种动态连接关系。其中,标签是用户根据自己的喜好、特点为资源添加的记号,用于形象地反映资源的基本属性,代表用户的一种主观认知偏好。在此基础上实现的资源的分类、聚集以及共享等知识组织活动都带有鲜明的人文主义色彩。Zhitomirsky-Geffet等[11]则通过对多用户在同一资源上的协作标注行为的分析,提出了基于多用户不同视角的标签(概念)关联方法和总体框架。伊利诺伊大学图书馆和信息科学研究生院的Mathes A[12]进一步指出,标签是一种由用户产生的元数据,与特定的元数据不同,它具有很强的主观性和动态性。相同的标签被赋予不同的资源,表明用户对资源的使用具有某种共性基础上的动态性与变化性。标签通过自身的特性,把不同的资源归类,方便用户针对具有共同特征的信息资源的检索行为。Russell T[13]出,通过上下文权威标注方法,利用用户在标签社区中使用标签的权威度,可以发现和定义认知权威性,动态查找出某一领域的权威专家及发现专业人士经常涉足的领域知识。Mas M D[14]则基于用户的标签建议构建“社群驱动网络”人机交互模式,展示了Folksonomy中的人文因素影响下的知识概念间的关联关系。

      在国内的相关研究中,张艳桃等[15]通过标签来表征用户的兴趣,定义了标注行为一致程度、用户资源共享程度和好友间兴趣相似度概念,使用用户对资源的标注行为一致程度来建立用户兴趣模型。通过统计实验发现:Folksonomy知识组织模式中好友间兴趣相似度高,但用户资源共享程度却较低,因此,将好友间兴趣相似度引入用户间兴趣相似度的计算公式中,将新的用户间兴趣相似度计算方法用于子群发现,其结果验证了用户间兴趣相似性度量方法是有效的。滕广青等[16]通过1-模网络与2-模网络的结合分析,提出了标签中的核心-边缘结构,并发现主观认知能够影响社群的知识结构,而知识结构又能形塑人们的认知偏好。

      综上所述,在Folksonomy知识组织相关研究中,已经有越来越多的学者开始关注人文因素带来的影响。虽然只有少数研究工作将标签与用户相结合建立混合网络[17],但是附加了人文因素的知识组织研究范式已经初露端倪。与传统的Folksonomy知识组织模式研究相比,人文因素影响下的研究视角不仅着眼于全力捕捉知识网络及其背后的知识关联模式,更关注周边的、跨模态的连接关系对系统自我组织、自我驱动的生态动力机制的影响。正如Weinberger D[2]所说:我们组织世界的方式不但反映了世界,也反映了我们的兴趣、我们的激情、我们的需求和我们的梦想。有鉴于此,本研究在Folksonomy知识组织模式中选取一个特定知识领域,采用2-模网络分析方法,将标签与用户在同一个网络中呈现,并借助网络中心性分析技术,对标签与用户的互动关系进行剖析与揭示。

      3 “标签-用户”2-模网络构建

      3.1 数据采集与预处理

      本研究以Bibsonomy.org网站的标签和用户数据为原始数据源,以“semanticweb”为限定的知识领域,获得被“semanticweb”标签标注的网页书签2876个、文献1003篇。根据Bibsonomy提供的FolkRank算法,在检索结果中选取主题领域内最权威、最活跃的前20名用户作为本研究的用户数据。在此基础上,分别对20个用户的标签使用情况进行检索,获得每个用户高频使用的前20个标签。然后对所获得的全部标签数据进行清洗,首先去除只有单一用户使用的标签;其次去除与本知识领域无关的标签;最后对同义、近义标签进行合并,最终在20个用户的所有高频标签中共获得有效标签30个,作为本研究的正式标签数据集。以某一用户是否使用某高频标签数据为行,以某一标签是否被某用户高频使用数据为列,构建规模为20×30的“标签-用户”二值隶属关系矩阵,如图1所示。

      

      图1中“标签-用户”二值隶属关系矩阵由“0”和“1”两种数值构成。第一行第一列值为“1”,表明用户“jan.zemanek”高频使用标签“semanticweb”,或者说标签“semanticweb”被用户“jan.zemanek”高频使用。同理,第二行第三列值为“0”,则表明用户“dolefulrabbit”并不高频使用标签“java”,或者说标签“java”不是用户“dolefulrabbit”的高频标签。

      3.2 “标签-用户”2-模网络构建

      基于图1中“标签-用户”二值隶属关系矩阵构建“标签-用户”2-模网络,分别以矩形和圆形代表2-模网络中标签和用户两类节点的形状,以标签与用户之间的隶属关系作为网络中的连线,构建的“标签-用户”2-模网络,如图2所示。

      图2“标签-用户”2-模网络采用MDS布局,每一个用户节点都与标签节点之间以连线连通,每一个标签节点都与用户节点之间以连线连通,即2-模网络呈现了标签与用户之间的相互关联关系。正如《信息简史》的作者Gleick J[18]所指出的,在知识组织体系中“秩序是主观的,因人而异”。研究中将基于这种相互对应的关联关系对标签与用户之间的互动进行揭示。

      4 基于网络中心性的标签与用户互动关系分析

      复杂网络分析的代表人物Freeman L C[19]关于网络中心性的研究表明,网络的中心性能够呈现和揭示节点在网络中的核心凝聚程度、桥接控制程度和关联紧密程度。本研究将分别采用点度中心性、中介中心性和紧密中心性三类中心性指标对标签与用户的互动关系进行分析。

      4.1 核心凝聚关系分析

      点度中心性是基于网络中与目标节点直接相连的节点数量反映目标节点在网络中的核心程度,即某一节点的点度中心度越高,则该节点在网络中的核心凝聚程度越高。图2所示的2-模网络中,标签节点的点度中心度分布状况如下页图3所示。

      

      下页图3中,可以清晰地获得点度中心度较高的标签节点。标签“semanticweb”、“web2.0”、“blog”、“ontology”等点度中心度依次降低,即标签的核心程度依次降低。结合图2中的2-模网络可以发现,标签“semanticweb”与18个用户存在关联关系,也就是说标签“semanticweb”被18位用户高频使用。同理,标签“web2.0”、“blog”、“ontology”分别被10位、9位、8位用户高频使用,这一现象说明,被越多的用户高频使用的标签,其核心程度越高。另一方面,结合图2可以发现标签“applications”、“collaborative”、“w3c”、“linux”、“sparql”均为网络中点度中心度最低的标签,这些标签都只被2位用户高频使用,即被越少的用户高频使用的标签,其核心程度越低。此外,获得2-模网络中用户节点的点度中心度分布状况如图4所示。

      

      

      

      图4展示了该知识领域中20位活跃用户的点度中心度分布,用户“dolefulrabbit”、“ablvienna”、“brightbyte”等点度中心度依次降低,直到点度中心度最低的用户。结合图2中的2-模网络可以发现,“dolefulrabbit”、“ablvienna”、“brightbyte”等用户依次分别与16个、14个、13个标签存在关联关系,即分别高频使用16个、14个、13个标签。显然,使用越多标签的用户,其核心程度越高,即标签和用户的核心程度分别和与其关联的用户和标签数量相关。

      进一步对图2、图3、图4中的信息综合考查还可以发现,图3中标签“social”的点度中心度远小于标签“ontology”,但是在图2所示的2-模网络中标签“social”的位置却更趋近于领域(网络)的核心区域。通过对二者的关联用户的比较分析发现,标签“social”是用户“dolefulrabbit”的高频标签,而用户“dolefulrabbit”则是所有用户中点度中心度最高的用户,在用户“dolefulrabbit”处于领域(网络)核心位置的同时也将标签“social”向核心区域拉近,就如同Pagerank[20]算法一样,决定网站权威性的因素既包括链接数量,也包括链接网站的权威程度。同样,图4中用户“georgemacgregor”的点度中心度远小于用户“hel”,但是在图2中用户“georgemacgregor”更靠近领域(网络)的核心区域。这两个用户各自的前3个高频标签一致(标签“semanticweb”、“web2.0”、“blog”的点度中心度处于前三名),但是用户“georgemacgregor”的第4个高频标签“ontology”(点度中心度排第4名)却与用户“hel”无直接关联,用户“georgemacgregor”相对于用户“hel”而言更靠近领域(网络)的核心位置。因此,标签或用户在网络中位置的中心程度不仅取决于与其关联用户或标签数量,同时也受到与那些用户或标签的核心程度的影响。

      4.2 桥接控制关系分析

      中介中心性是基于节点对网络路径的中介连接程度反映节点对资源的桥接控制程度。如果一个节点处于许多其他节点相互连接的最短路径(捷径)上,则该节点具有较高的中介中心性。但是“标签-用户”2-模网络与传统的1-模知识网络不同,标签节点总是位于用户节点的最短路径上,用户节点也同样总是位于标签节点的捷径上。标签节点的中介中心度直接受与其关联的用户节点影响,而用户节点的中介中心度直接受与其关联的标签节点的影响。图2所示的2-模网络中标签节点的中介中心度分布状况如图5所示。由于实验数据的采集由标签“semanticweb”限定知识领域,因此在图5中标签“semanticweb”具有远高出其他标签的中介中心度,即“semanticweb”是绝大多数用户的高频标签,处于众多用户节点的中间位置。对于领域中的用户而言,标签“semanticweb”处于许多用户相互连接的最短路径之上(被许多用户共同高频使用),拥有该知识领域中绝对的桥接控制能力,而其余标签则仅有较低的中介中心度,仅处于少量用户间的最短路径之上。同理,获得2-模网络中用户节点的中介中心度分布状况如图6所示。

      

      图6中,用户节点中介中心度分布参差不齐具有较大离散性,几个具有较高中介中心度的用户处于多条标签之间的最短路径之上,将更多的标签(知识)连接起来。用户之间中介中心性差别较大,部分用户具有较高的中介中心度,但没有出现类似图5中标签“semanticweb”那样极端绝对的桥接控制能力。

      总体上讲,在2-模网络中标签节点的桥接控制能力由该标签在用户中所处的中间连接位置决定;而用户节点的桥接控制能力由该用户在标签中所处的中间连接位置决定。对比图5与图6中节点中介中心度分布情况可以发现,除去代表知识领域范围的标签“semanticweb”,大多数标签在用户中的中介程度较低;而部分用户在标签间的中介程度较高。特定知识领域中两个标签(知识)可能分别代表或处于不同的子领域中,但可以通过用户的主观能动性发挥桥接控制作用在两个子领域之间建立起关联关系。因此,大多数标签对不同用户之间的桥接控制水平普遍相对偏低,而部分用户对不同标签具有较高的桥接控制能力,能够将不同的知识关联起来。从这一点上讲,在标签与用户的互动关系中,用户对标签(知识)的桥接控制能力要优于标签对用户的桥接控制能力。另一方面,图5中标签“ontology”与标签“social”相比处于更多的用户捷径的中间位置,拥有更高的中介中心度和桥接控制能力。但在图2所示的2-模网络中,标签“ontology”比标签“social”更加远离核心区域的现象则进一步说明,由于2-模网络中标签的中介中心度需要考察高频使用该标签的用户,而标签“social”连接的用户“dolefulrabbit”(中介中心度最高)则不与标签“ontology”关联,则标签“social”相比标签“ontology”更趋近于网络的中心位置,即标签在网络中位置的中心程度也会受到其所处路径两端用户的中介中心性的影响,反之亦然。

      4.3 关联紧密关系分析

      紧密中心性反映某一节点与网络中其他节点的距离远近,如果一个节点与网络中所有其他节点的距离都很短,则该节点具有较高的紧密中心性。对于“标签-用户”2-模网络来说,考察标签(用户)节点的紧密中心度必须要兼顾该标签(用户)所属的用户(标签)到其他标签(用户)和用户(标签)的距离。图2所示的2-模网络中标签节点的紧密中心度分布状况如图7所示。

      

      在图7中,各个标签节点的紧密中心度相对较高,标签“semanticweb”的紧密中心性最高,而且即使在图3和图5中表现出较低点度中心性和中介中心性的标签也具有相对高的紧密中心性。此外,标签的紧密中心性整体上分布比较均衡(0.527-0.951),没有拉开较大的差距,也就是说“标签-用户”2-模网络中,一个标签节点与其他标签节点和用户节点之间的距离都比较接近。由2-模网络的紧密中心性原理[21]可知,某一标签节点可以通过用户节点与其他标签节点建立联系,进而可以再通过这些标签节点与更多的用户节点建立联系,即“标签-用户”2-模网络中标签节点的紧密中心度不但与标签间距离相关,也与标签到用户的距离相关。因此,尽管在核心凝聚性和桥接控制性方面不同标签之间存在较大程度上的差异,但是在关联紧密性方面由于其兼顾了标签与用户两类节点的距离关系,使得其分布特征相对均衡。同理,获得2-模网络中用户节点的紧密中心度分布状况如下页图8所示。

      下页图8中的用户节点紧密中心度普遍较高,表现出与标签紧密中心性相似的特征,无论图4和图6中用户的点度中心性和中介中心性存在多大的差异,图8中用户的紧密中心性在整体上分布情况也是相对均衡的(0.523-0.708),甚至相对于图7中标签节点紧密中心度分布略显更加均衡。这一现象说明,基于用户协作标注的Folksonomy知识组织模式中,标签与用户的关联紧密性并没有像核心凝聚性和桥接控制性那样的显著差异。这一现象反映出无论是标签节点还是用户节点的紧密中心性都要同时受到两类节点的影响,而且同时兼顾两类节点的距离关系使得节点之间的差距不再显著。另一方面,用户的关联紧密性相比标签的关联紧密性更加均衡的现象也说明,具有主观人文色彩的用户认知活动对于知识关联的建立与揭示具有不可忽视的重要促进作用。综合来看,尽管在点度中心性与中介中心性方面各个标签之间各个用户之间都存在一定的差异,但是在紧密中心性方面这种差异性显然在缩小。在范围相对明确的特定知识领域中,相同研究方向或近似兴趣偏好的用户间能够通过各种交流缩小用户与领域内各个标签(知识)间的距离,同样这种研究者或兴趣者之间的交流又反过来促使标签(知识)与用户之间的距离在一定程度上缩短。

      

      5 结论与讨论

      本研究采用复杂网络分析技术,基于标签与用户的隶属关系构建“标签-用户”2-模网络。从点度中心性、中介中心性和紧密中心性3个方面对Folksonomy模式中特定领域的标签与用户之间的互动关系进行了分析,基于分析结果初步可以得出如下结论:

      (1)Folksonomy模式中特定知识领域内,标签与用户的核心凝聚程度同时受到连接数量和连接质量两方面的影响。在连接数量方面,如果某标签属于众多用户的高频标签,受到领域内多数用户的簇拥,则其在领域内处于较高的核心地位。另一方面,与较多核心用户(与更多标签关联)连接的标签其位置更趋近于网络的中心区域。这一发现等同于两个知识同时各受到10位用户的推荐,但是其中一个知识的推荐者在学科内具有更高的威望,则该知识在领域内的位置会更靠近权威区域,这一规律同样适用于领域中用户的位置关系。

      (2)Folksonomy模式中特定知识领域内,标签(用户)的桥接控制能力与其在用户(标签)中所处的中间连接位置相关,并且用户对领域内知识资源的桥接控制能力高于标签对用户资源的控制能力。早年Popper K[4]在阐明“世界3”(客观知识世界)的实在性和自主性的同时,就强调了只有“世界2”(主观认识世界)才能对“世界1”(客观物质世界)和“世界3”(客观知识世界)产生干预。因此,即便是在特定知识领域内,当涉及不同知识的关联问题时,人的主观能动作用在知识关联关系的桥接上得以凸显,即人类的认知是知识关联背后的一股关键动力。

      (3)Folksonomy模式中特定知识领域内,标签节点与用户节点的关联紧密程度比较均衡,且用户节点的紧密程度相比标签节点的紧密程度更显均衡。这一规律在反映特定领域内标签与用户高度交融的同时,也说明用户的主观能动性,能够驱动相同研究方向或近似兴趣偏好的用户间通过各种学术交流缩小用户与领域内各个标签(知识)间的距离。同时,具备主观特征的学术交流也反过来促使客观知识(标签)与用户之间的距离缩短,提升领域知识与认知之间的紧密性。

      对Folksonomy模式中标签与用户的互动关系展开研究,一般包括2-模网络分析和1-模网络分析两种方法。前者的分析基础是“标签-用户”2-模网络,关注的重点在于网络中两类节点(标签与用户)相互之间的互促互扰关系,而不是单纯考察单一类型的节点(标签或者用户)内部的相互关系。后者是将“标签-用户”2-模网络分解为2个1-模网络,即标签网络和用户网络,然后分别对2个1-模网络内的标签节点或者用户节点进行分析。因此本研究采取的2-模网络分析方法在反映两类节点之间的相互关系方面,相比1-模网络分析方法具有更大的优势。此外,2-模网络中的中心性指标与1-模网络中的中心性指标有很大的区别,二者之间的比较如表1所示。

      

      从表1中不同类型网络的中心性指标影响因素比较情况可以看到,1-模网络的中心性指标只受到本类节点的影响。由于1-模网络中只含有1类节点,因此1-模网中标签节点的中心性只与标签节点相关,与用户节点无关,反之亦然。而2-模网络的中心性指标都要受到对应类节点的影响,甚至受到两类节点共同的影响,即2-模网络中标签(用户)节点的中心性必然受到用户(标签)节点的影响,甚至受到两类节点的共同影响。因此,在对标签与用户两种因素之间的互动关系进行研究时,2-模网络分析方法显然具有更大的优势。加之本文使用的网络中心性指标涵盖了核心凝聚程度、桥接控制程度、关联紧密程度3个方面的互动关系,因此能够比较有效地对研究目标进行揭示。在数据采集与检测方面,研究中使用的数据来自于Folksonomy模式中标签与用户的客观真实数据,不会产生量表问卷测量中的信度和效度误差。研究所用数据的客观性和真实性为分析结果的信度与效度提供了保障。

      6 结语

      本研究采用网络的点度中心性、中介中心性、紧密中心性3种分析方法,对基于Folksonomy知识组织模式构建的“标签-用户”2-模网络,从核心凝聚性、桥接控制性、关联紧密性3个方面进行了分析,并根据分析结果对标签与用户的互动关系进行了较细致的研究。研究工作中也存在一些尚不完善之处,研究中所选择的学科领域只是一个特定的知识领域,规模更庞大或更细粒度的领域尚没有全面考查。未来的研究中将进一步采集更多规模差异的学科领域的数据资料,对不同规模知识领域中Folksonomy模式下标签与用户的互动关系及其规律进行深入探索和研究。

标签:;  ;  ;  ;  ;  ;  ;  

基于网络中心的社区经济模式中标签与用户交互研究_桥接模式论文
下载Doc文档

猜你喜欢