开放式协作生产内容的可信性评估研究,本文主要内容关键词为:可信性论文,开放式论文,内容论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
虚拟社群协作内容生产是Web2.0的重要特征,而目前国内的开放式协作网站虽然从内容、数量上看发展很快,但也随之产生信息质量低下、重复泛滥、版权意识缺失等诸多问题。维基等新工具的出现让内容发布变得容易和大众化,但是如何在Web上识别有用和可信赖的信息却变得越来越尖锐[1]。目前国内学术界鲜有针对开放百科内容的可信性研究。而像维基百科、百度百科这样的开放百科都有着巨大的网络流量以及庞大的用户群,其对网络信息质量有着不可低估的影响。当这些开放百科日益成为网络用户信息查寻与知识分享的重要来源时,对开放百科内容的可信性评估就显得十分必要。
1 网络信息可信度研究概述
开放式协作内容的可信性源自网络信息可信度或Web信息可信度。对可信性的关注也源自互联网和数字技术使信息生产与传播的成本降低,权威性不再成为互联网上内容提供的预设条件,因此,Web环境下的可信性问题就凸显出来。
这一领域的多数研究认为,可信性应定义为一个感知变量,而不是一个对信息或信源质量的客观测量[2]。换句话说,可信性不是信息或信源的特性,而是一个由信息接收者做出判断的特性。它会受到信息或其信源客观特性的影响。可信性感知因信源类型以及评估发生的背景不同而不同。例如从Web获取的新闻和参考类信息被认为要比娱乐或商业信息可信[3-4]。类似研究也表明网络用户对政府、媒体信息的可信度评价显著高于普通网民发布的信息,且网络新闻之可信度要显著高于论坛信息和即时通信信息[5]。
网络信息可信度的影响因素以及可信性评估是这一领域的重要内容。例如Web可信度被认为是以下变量的函数[3]:(1)网站及其主办方(包括网站类型、设计、信源属性);(2)消息或内容因素(信息卷入度、说服意图);(3)用户特征(怀疑倾向、查证行为、网络经验和网络依赖)。Fogg[6]和Rieh[7]的研究有着相似的结论,即信息本身(例如信息组织、详细程度等)和来源(如商业倾向)共同作用于网络用户的可信性评估。Chesney从编辑、内容、网站三个角度对维基百科的可信性进行了调研,发现阅读同样的词条后,专家们比外行更认为这些词条可信[8]。对网上信息的可信度评价会影响消费者对网络信息的使用[9]。例如在交易型社区中,信息详尽度、发帖者级别和社区透明度会影响消费者对网络评论信息的可信性感知[10]。
本文在现有网络信息可信度的研究基础上,针对开放式协作生产内容(以下简称开放内容)的可信性展开研究,旨在通过调研、探寻用户对开放内容的可信性评估受哪些因素的影响,以及用户参与协作生产的程度是否会影响用户的可信评估意识和行为。
2 研究设计与数据采集
本研究采用调查法,目的是探寻什么因素影响用户对开放百科内容的可信性评估,以及用户参与协作内容生产的程度是否会影响其对开放内容的可信评估意识与行为。具体而言,通过调研探寻以下问题:用户个体特征(如性别、网络使用经验和网络依赖性)对开放内容可信评估意识的影响;用户参与协作生产的程度(如开放百科访问频率、编辑频率)对开放内容可信评估意识与能力的影响;用户对开放内容的可信评估标准或可信判断依据。
根据需要,在设计问卷时着重用户的信息:(1)网络使用经验;(2)网络依赖程度;(3)对开放百科网站的访问频率;(4)对开放百科内容的编辑频率;(5)对开放百科内容的可信评估意识;(6)对开放百科内容的可信评估依据。其中,前5个变量采用李克特(Likert)5点尺度进行测量,最后一个变量为开放式问题。
为了考察用户参与协作程度对开放内容可信评估意识和行为的影响,本次调研分为两组进行。预估第一组调研对象参与协作的程度会明显低于第二组。问卷发布在专业调查网站上(http://www.sojump.com),以问卷邀请的方式招募调查对象。
(1)第一组调研对象为一般网络用户,主要是笔者所在学校的大学生。时间为2011.4.6-2011.5.23。共收集问卷81份,有效问卷78份。最后一个开放式问题由于个别答卷者的理解偏差,在单独题项分析时不予考虑,但在其他题项中可以并入统计分析。问卷主要从性别、网络经验、网络依赖、开放式协作网站的访问频率、开放内容的编辑频率、开放内容的可信评估意识、可信判断依据几个方面采集数据。
(2)第二组调研对象为开放式协作社区用户,主要从开放百科的活跃用户中抽取并发出问卷邀请。调查时间为2011.4.10-2011.5.3。共收集问卷49份,有效问卷48份。问卷题项基本同第一组问卷。笔者选择了中文维基百科、百度百科这两个目前全球最有影响力的中文开放百科社区。具体发放问卷邀请的方法为:①对于中文维基百科,首先从“活跃用户列表”中(发出邀请时共有5 696名活跃用户)随机选取调查对象,采用在其讨论页留言的方式发出问卷邀请,总计发出留言邀请96份。随机选取即是采用按首字母分页选取的方式,即从A到Z依次分页抽取,每页随机抽取2~5个,选取时也配合使用人工筛选标准,依据是最近30天内的编辑次数以及有无建立用户页。笔者主要选取那些近期编辑次数超过50次以上,同时建有用户页的社区成员。编辑次数多意味着该用户近期非常活跃,更有可能是社群的核心成员,也更能保证调研对象的准确性;同时,用户近期的活跃还可以提高问卷发出的回收率。而建立用户页的社区成员更加关注其他成员的讨论和留言,因此也可以保证发出邀请的调查对象能够及时看到笔者的留言,以提高问卷的回收率。②对于百度百科,首先选取“上周贡献榜”中排名前100位的活跃用户为调研对象,通过发送“站内消息”的方式发出问卷邀请,合计发出问卷邀请85份。以上两个开放百科社区发出的问卷邀请合计181份,实际答卷49份,回收率27%。
根据填写网络问卷用户的IP地址(见表1),在收集的第二组样本中,来自台湾地区的协作社区用户占了较大比重(31.25%),根据答卷者来源的链接地址分析可知,这些用户主要活跃在中文维基百科。此外,来源链接数据也表明有70%以上的答卷者来自中文维基社区,只有不到30%来自百度百科社区。由此也可见,中文维基社区用户的利他性倾向显著高于百度百科社区用户。
3 数据统计分析
3.1 统计结果对比的定性分析
文中只显示了两组受试者访问过的开放百科网站统计结果(见图1),限于篇幅省略了其他数据结果对比图。
(1)第一组用户对网络的依赖程度普遍表现一般。对开放式协作网站的访问频率中等偏上(多为“偶尔访问”及“时常访问”),调查对象几乎都访问过至少一个以上的开放百科站点,但是编辑频率中等偏下(大多数自述为“很少编辑”甚至“从未编辑过”);普通网络用户对开放式协作内容的可信评估意识居于中等(即“偶尔判断”)。问卷的最后一个题项是开放式问题“您在评价开放式协作内容的可信程度时,常用的判断依据有”,要求用户根据自己的实际情况填写可信度的评价标准或判断依据。从答卷情况看,普遍偏向于对开放内容的外围依据和线索,如网站权威性(含网站规模、访问量、排名等)、他人的评价,还有依靠经验、直觉、常识和现有知识,此外还有少数采用比对、查证方法,以及看时效性和内容来源、出处、引用源。
(2)第二组调查对象在网络使用经验上与第一组差别不大,但在网络依赖程度、开放式协作网站访问频率、编辑频率、可信评估经验几个方面有显著差异,程度明显高于第一组。在性别特征上,第二组受试者由于是在协作社区中随机抽选的活跃用户,因而这一数据结果较能反映协作成员的实际情况,即参与协作内容生产的用户中,男性居大多数(95.8%),而女性比例很小(4.2%)。
(3)在访问过的开放式协作网站中,被选频率排在前4位的网站,两组调查结果一致,分别是中文维基、百度百科、英文维基和互动百科。这也符合实际情况。英文维基百科是世界上最大的百科全书,另外三个都是目前最有影响的中文百科全书。此外,也因为调查对象主要来自中文维基社区和百度百科社区。
3.2 两组样本数据的差异分析
两组样本数据的差异,主要源于对开放式协作生产活动的参与程度。这里用户对协作网站的访问频率和编辑频率两个变量来衡量两组用户的参与度。以下数据统计分析中重点考察两组数据的均值比较、方差分析,以判断出两组样本数据在各个变量上是否存在显著性差异。表2列出了两个小组各变量的描述性统计特征。
两组样本数据的Levene方差同质性检验显示(见表3):在网络经验、网络依赖两个变量上的方差齐性未通过检验,即方差存在显著差异;而两组受试者在开放内容访问频率、开放内容编辑频率和开放内容可信评估意识方面的样本方差没有显著差异。根据方差齐性检验结果,进一步对两组数据进行独立样本T检验(见表4)。在显著性水平为0.05时,两组各变量均值的双尾t检验结果均有显著差异;而在显著性水平为0.001时,只有网络经验一项两组数据没有显著差异。其均值差异的95%置信区间上、下限都小于0,可以认为第一组均值明显比第二组均值小[11]。统计分析结果进一步验证了原先的分组调研预估水平,即第一组受试者对开放式协作的平均参与度显著小于第二组受试者的平均参与水平。
3.3 变量间的相关分析
以下相关分析是将两组样本数据作为统一数据源。为了探寻用户参与协作的程度与其他变量尤其是可信评估意识之间的关联性,以下对网络经验、网络依赖、访问频率、编辑频率和可信评估意识5个变量两两之间进行Pearson相关性检验。表5列出了变量间的Pearson相关系数、显著性水平、样本数。由表中数据可知,每组变量之间均呈现显著正相关。其中,相关系数最大的是编辑频率与访问频率之间(0.563),其次是编辑频率与可信评估意识之间(0.539)。可以认为,用户对开放式协作内容的编辑频率越丰富或编辑频率越高,则用户对开放内容的可信性评估意识越高,外在表现为用户的可信性评估行为就越多。
4 开放式问题的答卷内容分析
本次调研的重点在最后一个开放式题项“您在判断开放式协作内容的可信程度时,常用的判断依据有”。它可以深入考察用户对开放内容的可信性评估行为和能力。对其分析主要采用扎根理论的定性方法,重在资料蕴含信息的细致丰富程度,而非样本数量的大小。根据用户对开放内容可信度评估依据的答卷情况,在删除无效文本之后,第一组共收集有效答卷内容66份,第二组46份。无效文本包括无意义的文字、未正确理解题意的答卷结果。第一组最后一个题项的有效答卷率66/78=84.6%,第二组最后一个题项的有效答卷率46/48=95.8%,明显第二组的答卷较好。采用扎根理论的定性归纳方法,将所有有效用户答卷内容进行提炼、归并和编码。内容归并和编码表如表6所示。其中结构性因素是笔者经过内容分析加以提炼后的因素,编码是为了方便对答卷内容进行定量统计和特征分析。答卷文本中含义模糊不清的未予归类和参与统计。譬如填写“权威性”,指向不明,可能指网站权威性,也可能是作者权威性。
基于表6中的编码,对每份答卷进行内容标引,最后统计各个结构性因素的出现频次和百分比,汇总成表7,同时将两个小组结果的频率分布绘制成图2。从频率分布对比图中可以清晰地看出,第一组的可信评估依据结果较为分散,而第二组的结果非常集中。
第一组普通用户不仅对开放内容的可信评估意识较弱,而且在评估能力和行为的自我报告式陈述中也比较感性,意见分散,缺乏统一、清晰认识。如依靠经验和直觉来判断,或者依赖他人评价和网站权威性。由于百科知识的相对稳定性特点,第二组用户几乎没有强调内容的时效性,而在第一组结果中却占有一定比例(11.7%)。“实用性”也是仅在第一组结果中出现而第二组中没有的一个因素。这也是第一组用户对开放内容可信性的认识模糊所致。尽管如此,还是有一定比例的普通用户把“查证行为”和“参考源”线索作为开放内容的可信性评估依据。第二组协作社区用户的答卷结果高度集中于V(查证行为)和R(参考源)两个因素,较少依赖或几乎不依赖网站权威性、直觉、时效性和实用性等因素。此外,第二组还出现了第一组中没有的“社区因素”,例如对社区开放性程度和社区管理者严格程度的判断。
对于开放式协作经验丰富和参与度高的用户(具体表现为对开放百科的访问频率和编辑频率较高),可信性评估意识普遍较高,且可信性评估行为更趋向于理性,也更接近于专家学者对用户Web信息评估能力的要求和推荐技巧。对于普通网络信息用户,Meola[12]推荐了两种评估技巧,多信源相同信息的比对和进一步的证实。而结构性因素中的V(比对、查证)正是Meola推荐的第一种技巧,此外另一个因素R(参考源)体现了进一步证实的技巧。
5 开放内容的可信度评估模型
基于以上调研结果,本文试图构建面向开放式协作生产内容的可信度评估模型,具体见图3。该模型中的前三个结构性因素主要来自开放式答卷的扎根理论分析结果,而用户个体特征因素则借鉴了现有Web信息可信度研究的相关成果[2-10]。鉴于开放式协作网站的内容生产者(作者)主要是社区用户,而非传统Web1.0环境下的网站主办方,因而在该模型中舍去了传统的“媒介可信度”感知因素,取而代之以“社区可信度”感知因素。
(1)社区可信度感知因素
①感知社区开放度:对协作社群开放程度的认知。包括用户对社区规则、活动目标、社群自组织程度等的感知。
②社区管理者信任:用户对社区管理者的信任程度。如对社区管理者身份、管理者声誉、管理能力等的认同程度。
(2)内容生产者可信度感知因素
若将一个内容生产单元看作一个整体,则内容生产者指整个内容单元的协作社群,例如在线百科的一个词条就是一个内容生产单元。由于网络虚拟身份、匿名性和动态可变性特点,使得人们无法依据其在传统社会中积累的信任知识来评估一个网络虚拟主体的可信度。但是协作经验、基于反馈的声誉系统依然可以帮助人们对评估对象进行合理有效的可信评估。但是在开放式协作环境下,缺乏这种显性的信任管理和评估机制。虽然社区会通过投票、讨论方式推举社区管理员以及评选优良词条、特色词条,但是无论是优秀词条数量,还是社区管理员的数量,都只占所有词条以及整个社区用户的很小比例。例如优良词条在中文维基百科中仅占总量的0.2%[13],微乎其微,大量的词条仍然处于可信状态模糊的境地,人们缺乏显性的可信判断依据。在虚拟社区环境下,只能通过与内容生产者、协作社群有关的外围线索来判断。本研究归纳出以下两个主要线索:
①协作者数量。这是协作社群的群体特征。根据Linus法则“眼球足够、漏洞全无”,即协作成员数量越多,可信度越高。
②协作者声誉。这是协作成员的个体特征,如成员的社区级别、经验、产出量、产出品质。当成员数量庞大时,每个个体对整体的影响就很小,因此可以忽略个体特征。但是当参与协作的成员数量较小时,个体的影响就不可忽视。
(3)内容线索的可信度感知
基于内容线索的可信度感知因素有:
①参考源。指引用源、内容出处、参考文献或参考资料的数量、权威性。
②可查证性。指外部链接的有效性,以及是否有相同内容的多信源可以比对。
(4)用户个体特征
①信息卷入度。与用户实际生活、学习、工作等相关程度的衡量。信息卷入度与用户对信息审查的动机和能力有关,用户对高卷入度信息的可信评估更倾向于采用启发式方法[3],并且有研究发现卷入度与网络信息可信度呈现显著正相关[4]。
②社区参与度。用户参与社区建设、内容生产的程度。在传统网络信息可信度研究中,经常采用的变量是“网络经验”和“网络依赖”。本次调研中,这两个变量与“访问频率”和“编辑频率”显著正相关(见表5)。因此将这两个变量归并到“社区参与度”中,这一概念也更能体现新一代网络的社区特点。
③怀疑倾向,或者信任倾向(测量方向相反)。衡量用户对开放内容的信任态度。
④查证倾向。衡量用户对开放内容及其参考源的比对、检查、验证行为的意图。