大数据方法与传播学研究方法
陈 艳
(浙江越秀外国语学院,浙江 绍兴312000)
[摘 要] 随着当前大数据发展趋势的不断加快,对传播学的研究产生了重要的影响,传播学研究的主要方法逐步由以抽样调查为主的传统方式向综合利用大数据参与的新方法转变。将重点展示数据挖掘技术在传播学研究领域内的应用案例,并将之与传统研究方法进行比较,对二者在研究目的、研究手段、研究过程及其逻辑等方面进行区别,从而说明大数据处理信息方式对传播学在方法论上的积极影响。
[关 键 词] 大数据方法;传播学;影响研究
一、大数据时代的特征
现如今,大数据这个说法已经在各个行业领域中得到了广泛运用,并且还被承载于各种类型的概念中,包括海量数据、实时数据、社交媒体分析以及下一代数据管理能力等。对大数据的概念也存在着多种多样的说法,当前业界比较认可的是由IBM公司提出的大数据4V特性,即数量(Volume)、多样性(Variety)、速度(Velocity)和真实性(Veracity)。但是这种对特性的解读也使无论业界还是学界都把不同的数据往里嵌套,这样的局面使大数据成为一个空洞的名词,对开展科学研究并没有实质性的扩展和推动作用。笔者认为大数据不仅需要从数据量上考量,更需要从数据结构上进行区分。数据大是一个相对概念,一般意义上,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。传统意义中的仅几个服务器存储的数据库是不能称其为“大数据”的。总之,大数据并不是这个星球上所有数据的统称,也不是把传统业务进行简单的数据化录入而形成的。它在达到一定的数据规模之上还需要呈现出非结构化的特征。
二、大数据背景下传播学研究方式的转变
(一)传统抽样随机样本转变为大数据方法下的全体数据
在新闻传播学领域,针对一般受访者测量其认知、态度与行为选择时,传统的研究方法以随机抽样或固定样本为主,具体通过深度访谈、问卷调查、实验法等方式。随着社交媒体深入人们的生活,人们表现自我的方式更为个性化、多元化,展现的渠道也日益多样化。在此背景下,研究人员可以通过在网络上对研究对象的“电子踪迹”进行搜索、采集、分析、发掘和利用,即可获得足以反馈其心理动向与行为举止的海量数据,这就是将大数据方法引入传播学研究领域的重要表现。并且,大数据研究方法可以轻松捕捉与处理一些传统抽样方法无法采集的细节信息。
该书出版后,学术界评价很好,我在这本书的前言中讲到这是我们系列研究的第一本,当时还想一本本往下写,与出版社签的合同是出版三本,第二本是“形式化与非形式化”,第三本是实证与非实证,提纲都拟好了,但是由于主要成员纷纷调动工作,有的当领导了,有的改行了,我自己也从哲学研究所调到社会学研究所工作,研究领域改变了,新的研究任务压下来了,“三卷本”的写作计划就只好搁下了,实在是很遗憾的。我到社会学所工作以后,还曾经另外组织写作组,以期继续履行与出版社的合同,实现我心头的夙愿,却终因知识结构不同,原来的写作计划难以实现,实为平生一大遗憾。
(二)传统方法与大数据方式在研究目的上的区别
在传播学研究领域,过去常用的抽样调查方法是以追求因果关系为第一研究目标的。这种因果关系的成立,必须首先满足由因及果的时间顺序关系,结果随原因的变化而变化的共变关系,因果二者之外无其他影响变量的非虚假关系。相较于此,大数据方法之下,研究人员首先着眼的是研究因素的相关性,如电影票房与网络搜索数量之间不存在逻辑上的因果联系,但是存在着一定的相关性。因此,传播学的传统研究方法可以描述事情的状况,也可以表述传播理论,但应用数据发掘与分析技术的方法则可以更多倾向于对事件发展的预测,在现代商业市场之中具备更高的实际价值与利用潜力。而在理论研究领域,大数据方法也能够解释一些长期未有定论或进展的话题。
到目前为止,油菜种植者似乎通过混合种植有效控制了杂草,但科学家同时还在寻找其他可能性。“再混合(ReMIX)”是欧洲13个国家之间一项500万欧元的新合作科研项目,杰弗罗伊和其他项目参与者正在研究如何优化混合间种技术,对其好处进行测评,并消除混合种植中的一些障碍。
(三)大数据方法放弃了追求处理信息的精确性
与传统处理方法后能够保证并追求数据的精确性不同,大数据方法处理现代数字信息时往往需要降低或放弃这种精确度。传统抽样调查之中,可供搜集研究的样本往往有限,研究人员在客观条件下需保证样本数据的精确度,其中采用一些能够减少错误产生概率的方法,对数据进行整理和补充,都是具备可操作性的。但是这种清理数据的方式,在大数据方法之下无法实行,首要原因就是样本数量庞大,人工复查不现实,其次就是大数据方法搜罗的信息无法保证标准完全一致,最重要的是,当今市场交易中,数据量的庞大在商业领域上能够创造的价值远高于传统调查之中的一点精确性,才能为应用数据挖掘与分析技术提供可能性。
三、大数据下传播学研究的代表性问题
首先,政府在宏观层面的战略部署能够促进一国文化产业的蓬勃发展,甚至成为一国经济的主要支撑点。以拥有相似文化底蕴的文化大国韩国为例,1998年韩政府出台“文化立国”战略,随后又紧跟着出台了一系列政策,使韩国影视文化行业迸发活力。时至今日,韩国影视剧出口值屡获新高,文化产业成为国民经济的支柱产业,真正做到了“文化强国”、“文化立国”。其次,国家文化企业实力强大离不开有力的文化监管。如今很多文化企业存在偷税漏税、抄袭、恶意竞争等问题,影视文化行业需要政府对法律的完善和对违法行为的严厉处罚,只有保证文化氛围的文明和谐才能更好地进行文化产业体制改革。
大数据时代下对传播学所产生的最根本的影响在于数据生产方式的变革。人们无意识的网络搜索行为习惯成为主要的数据来源。其中无意识的网络行为并不是说人们对自己的行为完全不知晓,而是指这种网络行为的初始目的不是为了给相关的企业或者是研究机构留下记录。延伸到传播学领域,指的是针对客户信息数据的搜集不再依靠传统的问卷调查以及电话访问等方式,让受访者明确获知自己填写的答案将会被运用到数据分析中。并且传统的数据收集方式下样本的总量是有限的,无法实现全面的覆盖。而在大数据时代下所适用的研究方法则是借助开放式的平台,引导受诊者主动填写相关的资料与信息并且加以记录。以自媒体所进行的新闻生产为例,绝大多数的新闻信息来源都是个体在生产,并且将其发送到微博和微信公众号上,其中微博与微信公众号就是这种开放式的平台,上面的信息内容都是由用户主动地进行资料与信息不断地填充。因此对传播学研究而言,需要借助这种形式的平台来搜集相关的数据,不仅可以与现有的开放式平台进行合作,同时还可以自行搭建平台。
最后,大数据分析存在明显重技术轻理论的现象。基于大数据的传播学研究对理论的关注严重不足,明显存在重数据轻理论、重相关轻因果、重挖掘轻阐释、重软件轻开发的“四重四轻”现象。目前基于大数据来研传播现象的主要研究者是传播学者和计算机学者,前者虽对传统受众理论比较熟悉,但多忽视了理论验证或建构,只专注于用新颖的数据挖掘技术,后者往往对数据挖掘较熟悉,但缺乏传播学理论,难以对人类的传播规律进行深入的因果阐释。目前,大数据在传播学中的应用也多以实践应用为主,这种重技术轻理论的传播研究在受众至上的传播业界或许有一定的商业价值,但对传播学学术研究则不可取。传播学研究的最主要目的是发现人类传播行为的规律,增加这方面的知识,一个有理论价值的传播研究,也一定是有应用价值的,反之,仅做实践应用而缺乏理论视角的传播研究难以产生理论贡献。
首先,大数据对信息分析的主要依据下的网民行为无法代表全体受众的行为。根据相关的调查数据现实,截至2018年,我国的网民总数达到了12.76亿,但是网络使用普及率则仅为57.9%,从该数据可以看出我国还有将近一半的人群不能上网,这些人自然也就被大数据分析排除在外。
其次,关键性的问题在于网民与非网民之间在结构性上还存在着明显的差异。如农村地区的网民与城镇地区的网民分布严重不均衡,由于受到经济、文化、网络等诸多因素的影响,农村偏远地区的人们还无法方便地使用网络,并且我国的网民还呈现出明显的年轻化特征。
四、大数据中传播学研究的方法和路径
(一)数据采集方式变革
试验结果表明:新品种科河699和大民3307在正常栽培条件下,产量高于常规品种先玉335。抗病性和适应性强,产量高,适宜于民勤县种植,建议今后在民勤县沙漠灌溉区大面积推广种植。
(二)抽样方法的前景
大数据会提高抽样研究的准确性,但是抽样方式会发生改变。在传统的抽样研究中,会假设一个全样本,然后进行抽样设计,但在实际操作过程中,往往会受限于数据易得性,而使研究样本的代表性和信度受到质疑。而在大数据环境中,首先,我们需要厘清大数据本身已经是数据的前端采集结果,这是大数据的本质,而它就是一个全样本。抽样的时候,其实是对数据后端的一次再处理。也就是说,大数据本身是伴随着分析处理方法的开发而诞生的,如mapreduce等,运用这些方法直接分析数据的准确性最高,但是需要传播学者进行计算机相关知识的学习,或者跨学科间学者进行合作。只有在无法使用大数据分析工具的情况下,传播学者才会使用抽样分析方法。抽样方法的改变指的是样本来源的改变。原本的样本是在现实生活中采集,而大数据下的样本是在大数据里面进行抽样,这样一方面使数据可得性大大提高,按照科学抽样方式设计的可执行度高;另一方面,由于操作层面中的数据易得性也能促进抽样方法的发展和更新,使抽样方法更准确。
(三)非结构化数据的结构化分析
如前文分析,传播学者对大数据的运用是对数据后端的再运用,那么这个再次的运用分析,就是把数据的“大”往“小”的分析,也是把“非结构化”的数据进行“结构化”的分析。换言之,就是要从这些看似杂乱无章的数据中寻找到有价值的关系链和运用前景。不同于自然科学数据的特点,社会科学的数据不仅非结构化数据多,而且实时性强,大量数据都是随机动态产生,根据网络数据做经济形势、安全形势、社会群体事件的预测却成为可能。传播学者不是要获取更多的数据,而是要首先得到大数据,然后做去冗分类、去粗取精,科学合理地二次抽样采集数据,进一步进行数据挖掘。
(四)可视化分析:数据艺术家的诞生
伴随着大量数据分析处理后的结果需要展示给客户或普通受众,那么普通的图表已经无法展示大数据的数据处理结果,只有可视化的结果才可以被接受。但是单就可视化的方法来看,它的展现程度也不尽相同。好的可视化展示应该是通过清晰美观的图示,能让人理解数据的真正含义或者它的真实面貌。而这对科学传播和视觉传播的学者来说,都是一个可探索的领域。能美观地、有趣地、便于理解地展示和分享有关计算的数据和故事,是未来数据艺术家的努力方向。
五、结语
大数据技术给整个新闻传播领域带来了革命性的变化,尤其是深刻地改变了传统的传播学研究方法和理念。但如同任何新事物一样,基于大数据的传播研究并非一帆风顺,在实际中是一把“双刃剑”,基于大数据的传播研究面临新的技术、伦理、理论等挑战,同传统的传播学研究一样,基于大数据的传播研究只是一种工具和手段,只有趋利避害,充分利用新技术拓展研究的领域和问题,发展新媒体环境下的传播研究理论,才能充分发挥大数据在传播学研究中的价值。
参考文献:
[1]倪宁,金韶.大数据时代的精准广告及其传播策略:基于场域理论视角[J].现代传播(中国传媒大学学报),2015(2).
[2]杨雅.大数据分析与可视化技术:新闻传播的新范式:“大数据与新闻传播创新”研讨会综述[J].国际新闻界,2016(3).
[3]刘义昆.大数据时代的数据新闻生产:现状、影响与反思[J].现代传播(中国传媒大学学报),2015(11).
[4]胥琳佳.大数据对于传播学研究内容和方法的影响:基于社交媒体和移动互联网的思考[J].中国出版,2015(18).
[中图分类号] G206
[文献标志码] A
[文章编号] 2096-0603(2019)18-0134-02
◎编辑 陈鲜艳
标签:大数据方法论文; 传播学论文; 影响研究论文; 浙江越秀外国语学院论文;