用户参与大数据众包活动的意愿和影响因素探究,本文主要内容关键词为:意愿论文,因素论文,数据论文,用户论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
人、机、物三元世界的高度融合引发了数据规模的爆炸式增长和数据模式的高度复杂化,世界已进入网络化的大数据(Big Data)时代[1]。大数据时代,数据已成为企业资产的一部分,将决定企业的核心竞争力,成为各行各业高度关注的焦点。然而,大数据的复杂性和数据利用的时效性,给企业开发和利用大数据带来了巨大的挑战:除了要在硬件上扩容、技术上升级,更为严峻的是严重缺乏具备大数据分析技能的专业人才。众包提供了一条“用人而不养人”的智力利用模式,使得大数据和众包紧密联系在一起。Lionbridge副总裁Martha Crow在接受《信息周刊》电话采访时说道“当我们想到大数据的时候,我们就想到众包。”而英特尔大数据科学与技术中心(ISTC)更是预言,众包将成为一种流行的方式[2]。然而,任何一个新生事物的最初推广都会遭遇到一些障碍。目前参与众包活动的主要智力资源是学生和部分专业人士,严重制约了众包模式的广度和深度,因此,如何从外部吸引人才的参与,使他们参与到大数据分析与创新过程,是促进大数据众包模式持续深入展开的重要课题。
2 相关研究回顾
众包是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式,外包给非特定的大众网络的做法[3]。目前在用户参与众包活动的意愿和影响因素方面,国内外学者提出了不同的观点,概括起来可以分为两大类:内在激励机制和外部激励机制。
(1)内在激励机制。内部激励支持者认为,追求成长、锻炼自己、获得认可、自我实现等来自于工作任务本身的刺激,是用户参与众包活动的主要动力,并且也是用户持续参与行为的重要动因。如Brabham等自2008年起对大众参与Istockphoto和Threadless众包社区的动机进行了一系列的研究,发现有机会学习新的技能、社区的趣味性、认知感和构建社交网络是重要的动机[4-5]。Leimeister等发现激励大众参与的动机主要包括学习知识、技能、社会因素和自我营销动机[6]。Zhang Ping认为大众参与众包活动的内在动机源泉和需求来源于心理、认知、情感和社会层面,在设计激励机制的时候,首先要重视参与者精神层面上的需要,让参与者从内心深处感受到被尊重、被需要、被信任[7]。
(2)外部激励机制。外部激励是指通过支付一定的报酬,如外筹、奖金及其他额外补贴,吸引用户参与到众包活动之中。如2007年Karim Lakhani和Jill A.Panetta两位学者对解决科学难题的众包网站Innocentive上的用户参与进行了研究,研究结果显示金钱奖励是吸引用户参与的最重要的因素[8]。Piotr对13个众包网站进行调查,结果表明要想公众参与其中,必须给出相应的酬劳[9]。Dominic DiPalantino和Milan Vojnovic发现当有奖励的时候,用户参与率会呈现对数级的提高[10]。以上这些学者的研究结果都表明奖励对于参与者的激励与吸引具有很大的影响。
综上所述,以上研究更侧重于从心理动因和外部刺激等方面对大众参与众包活动的意愿和影响因素进行分析,但从技术含量、任务平台以及任务难度等方面来看,大数据众包任务的复杂程度要远大于其他众包任务,其他方面的促成因素如众包任务的说明、规程等对众包任务的成败也至关重要。因此,本文认为要探索用户参与大数据众包活动的意愿和影响因素,首要的任务是构建用户参与大数据活动影响因素的整体理论框架,用来说明各种因素对众包活动成败的影响机制。然后通过进一步分析吸引用户参与大数据众包活动的意愿和影响因素模型,对个体动机、技术驱动和促成条件等因素提出假设,并进行论证。
基于此,本文在大量访谈调研的基础上,运用社会认知理论、技术接受模型、动机理论抽象出符合大数据众包活动的理论构架,并在此基础上,提炼出用户参与大数据众包活动的意愿和影响因素模型。然后,结合大数据分析的实际,对影响用户参与大数据众包活动的意愿和影响因素提出假设;再采用基于PLS的结构方程模型进行验证。本研究试图完善当前用户参与众包活动的影响因素方法的不足,其研究结果可以为促进用户参与大数据众包活动提供理论支持。
3 研究模型与理论假设
3.1 理论基础
动机理论(Motivation Theory,即MT)认为,人们的某个行为都是出于一定的动机。用户参与大数据众包活动同样是受到刺激而产生参与的意愿,这种刺激可能最初来自于外部,如金钱或物质奖励,也可能来自于内部,如享受乐趣、能力提高以及自我肯定等。动机理论能够较为直接地从心理学和行为学角度研究信息用户行为的态度、行为意向和实际行为,因此当前的研究大多是从该角度展开。本文认为动机理论在分析用户参与大数据众包的意愿和影响因素时,同样起着重要的作用,并将之归纳为“个人动机”维度,包括表示自信程度的自我效能、有效的外部奖励以及内部最深层次的沉浸感三个变量。
为了直接揭示用户在参与大数据众包活动的内在驱动机理,有必要从社会认知理论和技术接受模型角度予以进一步的阐释。社会认知理论(Social Cognitive Theory,简称SCT)强调个体行为、主体认知和社区环境三者是动态交互影响的,个体所处的社会认知环境将影响个体作出何种决定、采取何种行为[11]。大数据众包作为一种群策群力的活动,不仅要求参与者有良好的技术能力,还要具有较强的社会属性,如要求参与众包的用户对于自我的心理、个性、品质有良好的认知和自信。因此,对于用户参与大数据众包活动的意愿和影响因素研究需要考虑社会认知方面的因素。
技术接受模型(Technology Acceptance Model,简称TAM)是由美国学者Davis在理性行为理论研究基础上提出来的[12]。他最初是在信息系统和计算机技术领域提出且用于解释和预测人们对信息技术的接受程度,包括两个主要的决定因素:感知有用性(perceived usefulness)和感知易用性(perceived ease of use)。本文将TAM模型用于解释和预测用户参与大数据众包活动的接受程度,类似地,认为用户参与大数据众包活动有两个决定因素:(1)感知有用性,即表示参与大数据众包活动后用户绩效的提升度,如用户乐趣满足感、用户能力的提高程度等;(2)感知易用性,即表示用户参与大数据众包活动的容易程度。
这三个理论从个体的心理维度真正揭示其心理诱因,为分析用户参与大数据众包活动的主要影响因素提供了有力的理论框架。
3.2 研究模型与假设
本文对于用户参与大数据众包活动的影响因素分成3个维度,分别是:个体动机、技术驱动和促成因素,用户参与大数据众包活动的行为模型如图1所示。
在个体动机维度中,表示自信程度的自我效能、有效的外部奖励以及内部最深层次的沉浸感,都会在一定程度上影响用户的参与行为。同时,包括感知娱乐性、虚拟社区感在内的一般内在动机对沉浸感的产生有一定的影响。本文将自我效能定义为用户完成活动的自信程度;外部奖励是指奖赏参与众包活动的用户;沉浸感是指用户愿意持续参与众包活动的程度。感知娱乐性是用户感受到的愉悦性和趣味性的程度;虚拟社区感是指用户在活动中的主观感受的程度。基于此,本文提出如下假设:
H1a:感知娱乐性对沉浸感的形成产生正向的影响。
H1b:虚拟社区感对沉浸感的形成产生正向的影响。
H4:外部奖励对用户参与行为产生正向的影响。
H5:沉浸感对用户参与行为产生正向的影响。
H6:自我效能对用户参与行为产生正向的影响。
在技术驱动维度中,感知有用性、感知易用性是两个主要影响因素。TAM在不同学科、不同领域的研究结果表明有用性和易用性对行为意向都存在积极影响。同时,这两个影响因子对自我效能都有一定的影响。本文将感知有用性定义为用户认为众包活动能给予其各种相关利益的程度;将感知易用性定义为用户认为参与众包活动的容易程度。基于此,本文提出如下假设:
H2a:感知有用性对自我效能产生正向的影响。
H2b:感知有用性对用户参与行为产生正向的影响。
H3a:感知易用性对自我效能产生正向的影响。
H3b:感知易用性对用户参与行为产生正向的影响。
在促成因素维度中,众包活动属性和众包规程是其重要的因素。本文将众包规程定义为众包平台制定
的一些规则章程,众包活动属性是发包方为该活动特意设置的一些激励因素。公平透明的众包规程可以吸引更多的参与者,良好的众包活动属性可以激励更多用户参与。基于此,本文提出如下假设:
H7:众包规程对用户参与行为产生正向的影响。
H8:众包活动属性对用户参与行为产生正向的影响。
4 研究方法
4.1 量表设计
为了验证实证模型中所提出的假设,本文综合了大量国内外文献已用过的量表,再根据本文研究的目的加以修改作为问卷调查的工具,以此来保证问卷的信度和效度。例如借鉴了Davis的关于TAM中感知有用性和感知易用性的量表[12];Venkatesh等[13]学者的绩效期望、努力期望和促进条件方面的量表;Brabham[4-5]关于内外部动机方面的量表;Hsu C L等[14]关于信任的经典量表;Choi和Kim[15]关于虚拟社区感的量表;Novak等[16]关于沉浸感的量表。在设计好问题后,先后将问卷送请5位长期参与众包的资深用户和一些来自不同专业的大学生进行审阅,并咨询用户们对问卷的意见,根据访谈结果,对各指标问题进行了修饰和完善,以尽量保证问题测量的有效性,最终得到一个含有27个问题选项的量表,每个指标采用李科特5点量表,从1(非常不同意)到5(非常同意),如表1所示。
4.2 数据收集
本文的研究目的是为了了解影响用户参与大数据众包活动的主要动因及其影响因素,因此,本文的研究对象既包括线上的用户,也包括线下的用户。线上用户主要是指一些参与众包活动的在线用户,例如,猪八戒网、任务中国等众包平台的参与者;线下用户是指现场采访的人,并且围绕本文的主题进行深度访谈。
为了提高数据的有效性,笔者对调查对象做了一些限制(这一限制主要是针对现场访谈的人),要求用户至少对众包活动有所了解,最好是参加过相关的众包活动,甚至是大数据众包活动(比如数据录入、清除和验证;数据标记、数据规范、情感分析等)。本文通过访谈现场、在线留言、QQ即时通讯软件和邮件的方式发送问卷并采用方便抽样的方法。通过猪八戒网收回线上用户的有效问卷86份,现场收回有效问卷106份(现场总共发放250份),最终有效问卷数为192份。在样本中,用户年龄在18~25岁之间的占了84.4%,大学本科学历占了82.3%,这说明我们的调查对象绝大部分是“数字原住民”,且具备较好的学习能力和知识素养。53.1%的用户都中过标,说明样本的典型性较强。
5 数据分析
5.1 信度与效度检验
本文采用结构方程模型(SEM)对实证模型中的假设进行检验,分析软件分别为SPSS13.0和PLS-Graph3.O。在检验实证模型前,首先利用验证性因子分析(CFA)去测度本研究中的27个题项的信度和效度。李克特量表通常利用内部数据一致性(Cronbach a)值和组合信度(Composite Reliability)系数对量表进行信度检验。通常来说,当Cronbach a系数大于0.7,表明因子具有较好的可靠性;当CR系数大于0.7时,表明因子的指标信度较好[17],如表2所示。
从表2可以看出,本文所研究的变量基本上满足上述两个条件,这表明问卷是可靠的,具有相当程度的内部一致性。同时我们也注意到有4个变量的Cronbach a系数在0.60~0.70之间,信度不是特别好,但这属于可以接受的范围(总量表的Cronbach a值是0.896)。
本文采用平均变异萃取量(Average Variance Extracted,AVE)来检验模型的收敛效度和区别效度。一般认为,当各因子的AVE值都大于0.5(即AVE的平方根大于0.707)时,表明该模型的收敛效度较好;当AVE的平方根值均大于该因子与其他因子间的相关系数时,则表明该模型的区别效度较好[17],如表3所示。
从表3中可以看出,位于对角线上的AVE的平方根值均大于0.707(表2中也可以看出AVE值均大于0.5),且因子之间的相关系数均小于AVE的平方根值。因此,问卷具有较好的效度。
5.2 研究结果分析
本文运用PLS-Graph 3.0软件来计算实证模型中的各条路径系数和回归方差,结果如下页图2所示。本文的11个假设除了H1a、H3b、H5、H8之外,其余都得到支持。大部分路径系数均在p<0.05和p<0.01的水平上显著,并且本文的用户参与行为被前因变量解释达到40.1%,总体来说,本研究模型达到了较高的解释力。
在个体动机维度中,外部奖励对用户参与行为产生正向的影响。这与国外学者Lakhani和Panetta、Brabham、Piotr、Dipalartino和Vojnovic对外部激励的研究结论基本一致。其中众包活动的外部奖励既可以是物质奖励,也可以是精神奖励。同时可以是实体的,如实实在在的金钱;也可以是虚拟的,如众包平台中的虚拟货币和积分等级。除了金钱收入外,成功的众包活动还可以提升声望,带来荣誉。此外,自我效能也有正向影响,用户的自信程度对于用户参与的影响也不容小觑,这与国外学者Bandura和国内学者朱庆华、赵宇翔对自我效能的研究结论是类似的。同时,我们也发现沉浸感对于用户参与行为的影响并不显著。这与Novak[16]、陈怡安[18]和仲秋雁[19]等的研究结论相悖,这可能跟以下两个方面有关:(1)笔者所调查的对象生活在网络全球化时代,每天都在接触各式各样的新事物,不可能单单专注于某个众包活动,以致内心深处无法真正沉浸其中,因此无法让用户持续参与。(2)大同小异且数量众多的众包活动缺乏足够强大的吸引力,没有特色,致使用户无法全身心的参与。所以,沉浸感这个影响因素对用户的激励不是特别大。此外,感知娱乐性对沉浸感的影响特别不显著,但虚拟社区感对沉浸感有较大的影响,这虽然与Van Der Heijden[20]对享乐信息系统的研究结论相反,但这恰恰表明了众包活动带来的一些乐趣、娱乐无法使用户真正产生沉浸,用户可能更多需要的是有内涵的、有意义的内容。
在技术驱动维度中,感知有用性对用户参与行为有积极的影响,这表明了在众包活动中潜在的巨大价值对于用户参与行为有显著关系。但是,我们也注意到感知易用性对用户参与行为并不显著,然而,假设H3b在以国外众包社区为背景的研究中基本得到了验证,究其原因,有以下三个方面:(1)本文调查对象大部分都是数字原住民,出生在互联网时代,对网络系统操作相当了解,因此,众包活动的整个流程是否容易,是否需要很大精力对其没有显著影响。(2)某些用户实际上并不会考虑或者不能很好地衡量参与这个众包活动是否是容易的,是否会花费自己大量的时间和精力。(3)用户考虑更多的是能否从众包活动中获益,因此,不管该众包活动是否容易,只要对用户有益处,都不会影响其积极参与。所以,感知易用这个因素对于用户来说并不是有那么强的吸引力。此外,感知有用性和感知易用性对自我效能都有正向影响,这说明用更少的时间和精力带来更大的价值能激发用户的自信程度。
在促成因素维度中,众包规程对用户参与行为有积极影响,这表明用户希望所参与的众包活动是互惠、公平的。这也间接反映出用户更注重众包活动的内在质量。在如今的数据时代,众包活动处于高速发展期,一味追求数量,而忽略了其内在环境的建设。众包活动属性对用户参与行为的影响并不显著,原因如下:(1)发包方不了解或不重视对众包活动的属性设置,对其没有进行过研究。(2)有些已经设置好的属性并不能较好的平衡用户与发包方之间的利益。所以,一些众包活动的属性无法改变用户行为。
6 结语
大数据与众包紧密联系而形成的大数据众包这个相当独特的形式,为探索解决大数据环境下面临的人才困境、成本困境以及创新困境提供了一条新的思路,值得我们深入研究。基于本文的调查研究,我们对大数据众包活动有如下一些建议:(1)众包活动应该有自己的特色,内容充实丰富且具有一定的意义,不仅仅只是供用户消遣和享乐,要让用户觉得该活动是有实质性内涵的,能沉浸于其中,增强其忠诚度。此外,外部奖励是激励用户参与的重要外部动机,因此发包方在制定众包活动奖金时,应综合考虑,进行一定的调查和评估,最终得出一个合理的价位,从而促使用户积极参与。(2)众包活动更应该注重价值性建设,明确成功参与众包活动会给用户带来的收益,以此来激励用户参与和提升用户的自信。此外,参与众包活动的用户基本上都是具有某一方面才能,而且具有强烈的学习欲望,众包平台不仅可以与一些企业的人力资源部合作,使得该平台上的优秀用户优先得到推荐,增加就业机会;而且要在平台上专门制定一个知识分享区域,供用户学习参考,提升技能。(3)众包活动的建设要从数量转向内在质量,注重活动的内部环境,竭力保护用户的智力资本和权益不受侵犯,要让用户深信该众包活动是值得信赖的。此外,有必要根据众包活动的目标对活动属性采取针对性的配置措施。另外,本文在理论研究基础上构建的实证模型可能存在不足和缺陷,需要更多的探索和实践。笔者将继续深入研究,以求进一步完善结构模型,探索能激励更多用户参与大数据众包活动的有效模式。