数据新闻:“讲一个好故事”?数据新闻对传统新闻的继承与变革_数据新闻论文

数据新闻:“讲一个好故事”?——数据新闻对传统新闻的继承与变革,本文主要内容关键词为:新闻论文,数据论文,传统论文,故事论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       DOI:10.3785/j.issn.1008~942X.CN33~6000/C.2014.07.211

       [本刊网址·在线杂志]http://www.journals.zju.edu.cn/soc

       [在线优先出版日期]2015-11-05

       [网络连续型出版物号]CN33~6000/C

       一、研究缘起

       在媒介生产研究中已为学者所揭示的是,所有的传播媒介都试图发展出一种样式或结构来展示讯息,同时也会发展出样式考量用以组织和构建讯息,与样式不匹配的信息会被剔除[1]202~203。一定样式的长期、模式化使用会逐渐成为惯例,即新闻常规①。样式常规在积极意义上能够赋予新闻工作者以一套既定观念和程序来快速认识、分类、理解和呈现新闻事件,确保新闻组织生产和运作的有序与稳定,但正如一切定式化了的事物一样,样式常规在处理信息、呈现信息上会凸显一部分要素并遮蔽一部分要素,从而影响到新闻文本及新闻接受。这种影响即如Schudson在评价20世纪美国新闻学的常规时指出的,媒体的威力不仅在于(甚至并非主要在于)其宣称的某些事情属实的威力,还在于其提供这种宣言的表现形式的威力[2]98。新闻与现实世界的关系不仅在于内容,还在于形式,即在于世界如何被融入约定俗成的叙事常规之中。

       Bucher对媒体组织的社会过程与权力的经验性研究指出,常规是一个协商过程,具体情境决定了何种常规得以形成[3]。就当下媒体生产情境而言,值得关注的是大数据技术在新闻领域逐渐扩大的应用。在互联网基础上,大数据使早期新闻生产的分支精确新闻、计算机辅助报道有了更大的舞台,并且催生数据新闻实践兴起,不仅为诸多新的新闻生产主体如非政府组织、企业、教育科研机构等所推动,还渗入到传统媒体的新闻实践中,为《卫报》、《纽约时报》、BBC等诸多精英媒体所倡导,且越来越被主流媒体采纳,成为新闻生产的新疆域。

       针对此行业变化,研究者对数据新闻实践及其影响的探讨主要可以分为两类立场。一类表现出一种技术乐观主义,认为数据成为新闻的富矿[4]7,带来传播方式方法的改善[5]22,新闻业正在发生深刻变革[6]12;数据改变的不仅是新闻业,甚至还将使新闻和其他行业的界限消失,整个世界都将受到数据的影响[7],数据新闻就是未来[8]。另一类认为数据新闻并非什么新事物,其早期实践可追溯至19世纪,虽然数据处理技术已今非昔比,但与早期数据新闻在报道动机上是相同的[9],依然是人类的附属品[10]22。如同美国学者甘斯在20世纪60至70年代对两档新闻节目和两份新闻杂志进行田野调查和相关研究后所指出的,电子媒介与印刷媒介之间尽管存在区别,即各自青睐的新闻故事的特征有些不同,如后者看重能否转化成戏剧化叙事、生动的记述以及具有感染力的静态图片,而前者青睐戏剧性、令人激动的影像,但两者之间的相似性更具决定性意义,都是“由以大同小异的方式看待美国的那一群新闻从业者选择与生产出来的”[1]4。并且即使到了21世纪,“‘决定什么是新闻’的过程和进入期间的种种考量,以及新闻判断背后的价值与假设,都与当初大同小异”[1]再版前言,10。就信息组织与呈现样式而言,将新闻定义为故事是传统新闻生产常规之一,则延续甘斯的思路,可以追问,数据新闻是依然在讲述传统价值和假设下的故事,还是带来深刻变革并且形成了新的结构或样式?如果是后者,这种新样式体现出何种特征?蕴含着何种价值观及潜在意义?

       对此,本文尝试回归到数据新闻生产实践,以新闻工作者的经验性论述与对应新闻报道文本为研究材料来加以探析。因为新闻常规会在新闻传播者的认知及其所建构的文本中体现出来,这些经验性论述对于数据新闻而言是一种“具有制度性的谈论方式,同时规范及强化行为者的实践行动”[11]35,与其他力量一起形塑了新闻如何报道以及新闻作品的呈现样态,并且逐渐在日常采编流程、业务培训、薪酬体系等规训手段下变成生产常规,使新闻生产变得稳定一致。借助这些经验性论述的文本分析,可以洞悉数据新闻生产者对新闻故事的理解,以及如何在日常实践中将事件转化为故事。

       二、研究材料与方法

       (一)研究材料

       本文将《数据新闻手册》(The Data Journalism Handbook)作为主要分析材料。该书是全球第一本数据新闻制作指南,源于2011年在伦敦举行的MozFest(Mozilla Festival)大会中的48小时工作坊,后来在欧洲新闻学中心和开放知识基金会的倡导下,由国际数据新闻倡导者合作完成。其作者包括《华盛顿邮报》、《卫报》、《金融时报》、《纽约时报》、BBC、独立新闻机构ProPublica、德国Zeit在线以及澳大利亚、阿根廷、芬兰等国媒体的诸多数据新闻先行者、倡导者与资深专家,通过网络协作方式编写而成,并且基于“知识共享协议”(CC BY-SA 3.0)发布。因而,这本书并非如同一般的著作往往成为个人理念的体现,而是如同该书在介绍中所描述的,很多人参与到本书撰写中,尽可能地想让不同的声音和观点在书中反映,以产生更大影响,“希望整个阅读过程就像是一段宝贵又有价值的对话”,关于什么是数据新闻,为什么它很重要,如何去做数据新闻[12]前言。

       该书涉及的内容主要包括数据新闻的定义、重要性、新闻编辑室、经典案例、具体操作程序等。研究者感兴趣的是这些内容由来自不同国家新闻编辑室的工作者撰写,且在方式上主要是结合数据新闻室及其从业者所参与的数据新闻实践和经典案例来论述。这些经典案例有许多在全球数据新闻奖中被提到,而且已经可以看到的是,该书目前已在数据新闻业界和学界被当作范例来引用与论述②,对一个正在兴起和形成的领域而言,能起到库恩所言的范式作用[13]。这些经典作品的生产者对如何制作数据新闻的论述往往成为被效仿的经验准则,对新闻工作者产生了社会化影响,而论述本身也蕴含且折射出当下数据新闻实践的理念与趋势。

       针对要探讨的问题,本文将该书“新闻编辑室的运作”与“案例解析”两部分作为研究文本。前者覆盖了世界范围内11个编辑室工作者代表对数据新闻生产的论述,后者主要涉及18个经典案例的生产过程剖析。本文将每一个案例或对应编辑室的文本作为研究子文本(具体信息见表1)。“案例解析”中18个案例覆盖范围较为宽泛,从一天内完成的数据新闻应用到历时9个月的深度调查,生产主体包括了公民记者、媒体组织、政府、非政府组织、研究机构等。“案例解析”与“新闻编辑室的运作”中新闻从业者的经验论述一样,不仅有诸多数据新闻案例文本,也讲述了国际各大主流媒体如何运营数据新闻,蕴含了其数据新闻的生产理念。虽然研究文本仅为该书之相应章节,但基于前文已论及的该书之编撰理念及内容结构特点,这些文本对反映当下已有的数据新闻实践而言仍具有一定的代表性。

      

       (二)研究方法

       对研究材料的研究方法结合了语料库方法和文本分析。主要采用的语料库技术包括词频统计与语境关键词即KWIC(Key Word In Context)索引查询。词是文献中承载信息、知识概念的最小单位。词的出现频率显示出该词在一定文本中的突出程度,词频越高越能体现该文本的内容,通过词频统计可以发现一定语言材料的词汇规律。语境关键词索引是语料库分析的另一个重要工具,可用于了解关键词的使用语境、典型搭配及语义特征等。通过统计核心词词频及其文本语境、搭配、词丛等信息,可以判别数据新闻主题论述中涉及哪些基本词项、其关注焦点以及知识结构等。

       语料库分析已为诸多媒介内容与话语分析研究所采用③,它将自然语言要素数据化,对大规模语料提供系统的检索和统计,能够展示一定的语言形式,提供反映语言现象的例证,从而强化、反驳或修正研究人员的直觉[14]12,帮助人们观察到语言背后隐含的意义[15]68。但词频分析将词汇从语境中抽离出去,可能影响到附着于单词的含义[16]213,尽管借助KWIC索引手段能够一定程度上还原语境,但依然有局限。因而本文试图在语料数据统计与分析的基础上,因循核心词项及其频率分布以及语义搭配所提供的整体视角,再具体结合对应的数据新闻报道,以之作为补充性的资料来源,对新闻工作者的经验性论述进行定性文本分析,寻找内在线索,深入挖掘文献意涵。

       借助语料分析软件AntConc 3.2.0④,收集互联网上对应章节的电子文本,本文建立了词容为27100字的语料库。首先通过单项检索概览词项频次的总体分布情况,因为有些词项在词义上同根,故继而在语义分析的基础上采用类别搜索,以获取具有相同词根之词项的总频数⑤。根据词频分析结果,排除居词频前列的英文常见虚词如the、to、of、and、a等,再比较出现频次较高的词。其中“数据”的出现频次为513次⑥,为实词词项排名第一位;“故事”词频排名第二,为131次;紧随其后的高频词有“项目”、“新闻业”、“新闻工作者”等。

       研究材料的论述主题即为数据新闻,故“数据”占据首位颇具合理性。而“故事”在频次上居第二位,则因为故事本身作为一种叙事结构和传统新闻常规之一,为诸多学者所探讨⑦,且从其他文献中数据新闻生产者的论述与访谈记录,也可以看到新闻故事在众多数据新闻生产者话语里出现。因而研究者将其作为研究中心,追问究竟数据新闻生产者如何看待故事?在数据新闻生产中,故事是传统新闻故事样式的延续,还是已经具有了不同的叙事或架构方法?是否蕴含新的理念和价值观?在探讨数据新闻如何讲述故事之前,首先需要对传统新闻的故事常规之样式特征及其理念、意义等做一梳理。

       三、传统新闻常规之“讲一个好故事"

       美国新闻主编坎贝尔总结该国新闻事业的两大传统为发现事实和讲述故事。具体而言,发现事实的传统是把公民当作客户,帮助建立杜威所言之“实用智慧”,而讲述故事的传统是把公民当作观众,通过“审美经验的力量”传递理解或宣泄感情[17]11。被视为全美写作质量最高报纸之一的《华尔街日报》的内部培训教材强调,“讲一个好故事”是读者最基本和普遍的需求。追求深度解析事件、揭示事情真相的调查性报道写作手册亦强调“核心任务是讲故事”[18]。而学者舒德森更是断言,“所有的新闻报道都是故事”[19]230。

       对故事的强调源于这样一种假设,即“讲故事是我们所以成为人的一个重要部分。我们通过故事来了解自己的生活和世界”[20]序言。人类“对故事的理解完全出于直觉,并且觉得故事总是比枯燥的分析更能激发人”[21]60。因而对作为叙事动物的人类而言,新闻故事提供了一个基于人类心理的接受结构。而新闻的民主、文化传承等社会功能实现的基础在于能否吸引且激发民众的阅读兴趣、认知、思考乃至行动,西方学者基于新闻实践经验与专业理想所提出的“新闻十大基本原则”中的一条,即为让重大事件变得有趣且与受众息息相关[22]7。作为故事的新闻显然比枯燥的信息呈现更具体、生动、有趣。

       再者,传统上强调以讲故事方式来报道新闻也有效率的追求,即“通过验证或否定一个故事,记者可以更容易地明确自己所要寻找的信息,以及如何解释它,编辑或出版者可以更容易地评估其可行性、成本、回报和调查项目的进展情况”[18]前言。尽管新闻事件作为社会事实中的一朵浪花,往往具有诸多意义与影响,但通过模式化的故事直接套用情节来审查和组织事实,记者简化并且加快了讯息选择进程,适应了新闻对时效性的要求,提升了新闻生产效率。然而,常规化了的新闻样式也意味着凸显与遮蔽。尽管有其心理上乃至功效上的合理性,模式化的故事生产仍然框定了如何进行主题选择和事件报道,从而影响新闻消息来源选择等,并最终可能阻碍新闻对真实的呈现。

       选题上,对新闻是故事的强调,影响新闻工作者从纷繁世界里选择报道的内容。一个事件是否具有戏剧色彩冲突成为决定这个事件是否成为新闻的特质之一。“戏剧色彩是定义新闻时不可缺少的一个特点。如果一个事件具备了某些戏剧元素,那这个事件就会特别地具有新闻价值。”[23]17由此,戏剧元素成了新闻价值的一部分。对于试图讲一个吸引人的故事的新闻从业者来说,“最佳的新闻素材是危机,而不是慢慢构成危机的过程,因为只有危机才符合戏剧化倾向性的需要”[21]55。这就使得更具备戏剧性的、耸人听闻的元素和煽动性的犯罪报道、社会新闻等从社会现象中凸显,且常能占据与现实重要性不相匹配的报道版面和时间,而诸多社会公共事务如教育、基金、政府运作等,以及社会问题诸如不平等、能源损耗、环境恶化等因其戏剧性不强,会由此缺少长期的关注[21]54。以西方学者对美国新闻报道政治框架的研究为例,当记者习惯性地将有争议的关于医疗改革政策的新闻描写成策略游戏时,这些政策本身却变得模棱两可、不再重要[24]33~34。如此,尽管新闻工作规范之一是“使新闻全面均衡”[22]5,但在一种戏剧化新闻的价值观下,有新闻价值的事件及其相关报道的数量比例经常表现出很大差异,这已为较多研究证实。如美国1995年关于犯罪的电视报道达到最高纪录,O.J.辛普森谋杀案及其审判以及其他轰动性案件被大规模报道,而关于医疗问题和联邦预算讨论的报道总量比犯罪新闻少很多,让观众觉得此类新闻没有犯罪事件重要。2002年《芝加哥论坛报》报道的当地犯罪事件中,有49%是关于谋杀,17%是关于性侵犯,而这些犯罪事件在警方统计的犯罪记录中不到2%[25]85。

       写作上,“讲一个好故事”的模式框定了新闻事件该如何报道。甘斯指出,“无论是印刷媒介还是电子媒介,最为基本的样式考量都是新闻只有在转变为故事的前提下才适宜刊载或播放”[1]204。把讲故事当作基本新闻要素的新闻撰写模式的显著特点之一,是“给了记者一个很大的空间,可以用来强调新闻事件戏剧性和叙述性的一面”[26]111~146,也使记者报道时经常会重新调整故事结构,以突出其中的戏剧效果。记者讲故事往往追求吸引观众注意力,“让故事深深刻在人们的记忆之中”[27]序言,因而会根据对观众的评估做出选择,考虑传递给观众一种什么样的观点,采用哪种情节技巧(如闪回、结果、性格发展、高潮等)来更好地传递这一观点[21]259。这种戏剧技巧式写作重危机而轻常态,重现在而轻过去或未来。而且用讲故事的办法,需要使用标准化情节,这种写作方式将事件压缩进一个固定的套路里,把复杂的事件组织成熟悉的、易于掌握的传播格式[21]60,限制了新闻内容。以一篇关于城市输油管道泄露造成爆炸灾难的报道为例,讲故事的新闻写作模式会更多地报道灾难状况,如财产损失和人员伤亡等细节,描述受害者的眼泪,受害者朋友的悲伤和同情,以及赈灾、政府援助,生产如何恢复等戏剧性画面和场景等,而灾难发生的起源、解决方案之探讨等难以进入戏剧性框架里。显然,这种故事样式以戏剧性的事件方式将复杂的社会过程简单化,将复杂的现象转变为敌对者之间的故事[19]60,以一种突出效果的手法加工故事,创造或凸显了某些符号意义,确如甘斯所指出的,有可能使新闻转变为道德剧[1]205。

       基于以上分析,当记者认为“最好的新闻故事是对戏剧化的活动或情感的报道”[1]218时,政治将被定义为关于政府与主流政党的事情,且强调政治人物的特质,经济新闻就局限于股票交易、政府政策、通货膨胀、贸易数字、货币供给等,国际新闻被用来指称各国政府间的关系,而国内新闻被分为强调冲突、暴力、劳资争议的硬新闻和软性的人情趣味新闻[28]321。如泰玛·利贝斯在检视了以色列电视新闻后指出,西方新闻业普遍具有一种关注和报道冲突、事件、行动以及简单化、人格化和戏剧化的偏向[29]357~381。可以说,在传统新闻故事生产常规下,《纽约时报》有关新闻理想的格言“所有值得印刷的新闻”成为不可能实现的神话。又因为需要把新闻事件塑造成一个有趣、连贯的故事,新闻报道经常赋予这些事件全新的意义和重要性,而现实则被扭曲了。以事件、行动、人物等为中心以及更多关注负面因此也成为被经常提及的新闻失真现象[19]59。且新闻报道的这种特定形式巩固了现有的权力机构,因为强势的机构,不管是政府还是其他组织,都可以通过策划或参与事件,以符合记者的事件取向来操纵事件。而社会改革运动则因为往往是问题取向而易被记者忽视,除非其能获得策划或参与事件的能力[30]。正如批评家所指出的,“新闻报道的形式形成了其自身的偏见”[31]168,故事模式不能如实反映社会现象。在舒德森眼里,新闻故事更因其对大量社会与文化象征的传输,成为需要摆脱的“文化的桎梏”[19]231。

       四、数据新闻如何讲故事?

       前文在已有研究基础上梳理了传统故事新闻样式在主题选择和报道写作上形成的自身偏见,并指出这些带来了接近真相的诸多不足。然而讲故事被视作新闻的基本要素有其理据,即就人类的心理接受结构而言,“故事情节本来就存在,而且可以说,它是对大的社会背景的具体表现”[21]87。人们定义和报道新闻时总是在信息与故事两头摇摆,这是因为社会现象本身既有表现为故事的一面,也有难以为单一、个人、片段化、戏剧性的故事呈现的作为信息的一面。在读者对“讲一个好故事”之普遍需求外,还有“对信息的需求”[27]序,3~5。因而讲故事与提供信息并不矛盾,可以视作“传播光谱上的两极”[22]169。

       正如班尼特所指出的,新闻的问题并不是使用了个人化和戏剧性的报道方式,而在于在报道中如何运用这些技巧[21]64。讲述故事如果能成功的话,既能够抓住受众注意力,还能够以一种审美经验之力量来传递理解或宣泄感情。故要拒斥的不是故事,而是传统新闻故事模式在实践中带来的种种局限与弊端。新闻人可以做的是在新闻故事样式的合理性基础上对新闻故事进行变革。如秉承公共新闻事业理念的学者杰伊·罗森提出了“架构故事”的构想,即在一个框架内将报道一个问题的可能方式整合在一起,将公民定位为政治参与者而不仅仅是观众,绘制出接触社群内不同知识阶层的路线图等[17]7。除了围绕实现传媒公共性而从宏观上架构故事之外,还可以具体从叙事结构上兼顾故事与信息的需求,将个人故事与更大的社会议题结合起来。

       记者选择一个新闻故事的考虑之一即是否能以及如何更好地抓住受众的注意力。新闻需要也应当追求注意力,甚至可以将新闻学视作一门注意力哲学[17]9,但通过什么方式以及将注意力导向何方则会影响到新闻所能发挥的功能。架构故事因而成为把握受众注意力且发挥新闻之社会功能的关键所在。在当下这个被诸多学者视作新闻业危机的时期⑧,数据新闻作为正在形成与发展的一种实践形态,激发了实践者与研究者对传统新闻理念的改造和更新[32]19,与公民新闻等一起被赋予了新闻革新的期待⑨。分析研究材料可以发现,“故事”是数据新闻工作者经验论述中的高频词。那么,究竟数据新闻工作者如何看待故事?如何讲述故事?这是架构故事首先要了解的。

       基于语料库的词频和语境共现检索,与“故事”密切相关的词项有“数据、项目、信息、新闻可视化、团队、调查、应用、公众、互动”等,这些词项构成了数据新闻主题论述的概念结构(见表2)。

      

       再在语境关键词索引查询的基础上,找到语料文本中与“故事”较频繁共同出现的语义搭配及使用的具体语境(代表性索引行见表3)。

      

       结合对应的数据新闻报道及实践,可以看到数据新闻讲述的是:一个由“数据驱动”(子文本19)、“需要从数据中识别与挖掘的故事”(子文本25);一个“可视化的故事”(子文本17);一个“复杂的”(子文本1)、“调查的”(子文本26)故事;一个在线的、互动的新闻故事(子文本14);一个“个性化的”(子文本3)、“公民自己生产的”(子文本16)、“他们自己的独特的故事”(子文本1)。

       数据新闻依然以叙事为中心,但这种叙事已经建立在新的技术与理念基础上,讲述的是一个为数据驱动、可视化的新闻故事,一个关乎读者且读者自己可以讲述的故事,一个更能把握真实、抵达真相的故事。

       (一)一个为数据驱动的故事

       语料分析显示,“数据”一词出现在整个研究材料中的每一个子文本中。不管是讲述编辑室运营理念,还是案例分析,“数据”都会高频度出现在数据新闻工作者的论述里。

       首先结合语料中的核心词项、词频及语境分析,对数据故事的形成过程进行概述。“所有的数据新闻背后都是一系列作业流程”(子文本22)。数据新闻工作者“在数据中发现新闻”(子文本1),通过一系列工具、技术、软件等来制作完成相应的数据新闻项目和应用等,以满足公众对数据的需求。数据新闻制作一般需要更长的时间,且往往由团队来完成。就团队构成而言,除了传统的新闻工作者外,还包括负责程序和设计的人员等,担任的角色不仅是报道者,还是开发者、设计师等。

       再以“数据”作为搜索词,基于语料分析找到搜索词的搭配和分布情况(代表性索引行见表4),联系案例中对应报道文本来分析数据新闻工作者对数据使用的主要认识。

      

       数据新闻工作者认为,“在信息时代,记者们比以往任何时候都更需要组织、验证、分析和综合数据的洪流”⑩。他们试图讲述一个“数据驱动的故事”(子文本19),致力于从数据中识别与挖掘故事,数据采集、过滤等处理成了数据新闻生产最重要的环节。且“对数据的使用使记者的工作核心由追求新闻报道的时效性,向讲述某一事态变化发展背后的真正含义转变”[33],这些使数据新闻致力于讲述一个更为复杂的故事,在选择和评价新闻故事的适应性时,侧重点从行动或事件转向情境。如案例1“机遇鸿沟”强调其新闻应用能够讲述一个“整体”又“详尽”的故事,向读者呈现一个宽泛的、梗概性的全国图景,这个图景对各州在教育资源分配上的表现进行比较,帮助读者了解全国教育资源配置,以及贫困在多大程度上决定了教育资源的配置。

       因为致力于讲述更为复杂的故事,这些数据新闻实践一般需要处理大规模数据。统计显示,除了一个案例提到了小规模数据处理之外,其他案例论述一般会强调数据规模之大以及数据处理之繁杂。如案例11“医护费用”中,为了调查并报道加州一个大型医疗机构利用联邦医疗保险项目牟取超额利润,加利福尼亚观察网的调研员需要收集和处理十分庞大的数据,每年就有400万病例,而报道者希望能够研究六年来的记录数据来考察模式变化。再以案例15“阿根廷的公车补贴”为例,当时阿根廷混乱的公交系统每天会影响到5800000名乘客的生命安全,且延误、罢工、车辆故障等事故频发,该数据项目试图调查阿根廷公交系统补贴取向,并且通过应用设计让每位阿根廷公民都能了解补贴数据,为此需要调查全国公交公司每月所获补贴。工作人员查阅了阿根廷交通部网站上自2006年开始政府每月对1300多家公交公司的现金支付金额,涉及400项PDF文件,9000台车辆的车牌号,每月从政府获得的维修保护费用,以及所属公司名称和信息。大规模数据的处理由此成为数据新闻工作最为基础与核心的部分,也使新闻价值上从追求时效性、冲突、戏剧性转向全面、深入、精确地呈现社会事实。

       需要指出的是,尽管这些数据新闻实践较多涉及大规模数据的处理,在相关文献梳理中亦有学者认为数据新闻要处理的是大数据,且往往以数据规模来衡量该类新闻价值的大小,但研究材料的文本分析亦显示出有些数据新闻工作者并不认为一定要依托大型数据库。如在案例16“公民数字记者”中,来自巴西公民媒体项目“珍纽瑞亚之友”(Friends of Janu

ria)的实践显示,在引导巴西城市珍纽瑞亚的当地青年提出信息自由之要求以及进入互联网上的官方数据库去获取公开披露的信息后,他们能以这些数据库为原材料,开发小规模数据库和数据表,发现极具价值的信息。

       在数据新闻项目与应用的开发中,数据新闻发现且试图满足公众想要了解各种数据的需求。如《卫报》数据博客的编辑指出,该博客启动时设定的读者群是那些制作应用程序的开发者,而实际上却是广大的普通读者想要深入了解各种数据(子文本22)。为此,数据新闻工作者为普通公众提供了大型数据库的进入方式。如在BBC推出的庞大数据库“每条道路上的每例死亡”里,用户仅仅通过邮编搜索,就能找到过去十年中每场道路事故发生的具体位置(子文本20)。案例8“Mapa76黑客马拉松”则通过设计Mapa76项目来帮助用户提取数据,为出于新闻、法律、审判和历史研究等不同目的的使用者提供开放的信息接入,并通过地图和时间轴来显示。这个项目目前还在正常运行,且提供了公共邮件列表和GitHub代码仓库,任何人都可以通过它们参与到这个项目中来。对公众数据需求的满足使数据新闻获得了关注和影响力,如“Zeit在线”的研发部门发现,数据新闻不仅能让受众阅读,还能让他们再利用这些数据,大大提升了其公信力(子文本23)。

       为了从数据中发现有价值的新闻,往往需要“花大量的时间对数据进行筛选”(子文本20),以及更多数据挖掘的技能。数据新闻是“更费时的”,有时新闻工作者“花了数小时收集数据,结果发现它们没有一点用”(子文本3)。在采集与处理数据过程中淘汰错误、过时的数据,挖掘出有新闻价值的报道,数据处理要求更多相关技能,“要将各自不同的技能——精深的专业知识、对数据实现最优化的理解、设计与编程能力等融合起来”(子文本1)。一方面,这对新闻工作者技能提出了更高要求,如BBC数据新闻团队尽管各自有自己专属的身份,如记者、研发人员,但他们勤于学习,不断增加对彼此专业领域的熟悉和了解。没有哪个记者专门司职处理数据,但所有编辑人员都必须熟练掌握一些基本电子表格的应用技巧,以便分析数据(子文本20)。另一方面,新闻编辑室可以通过专业人才之分工与协作来获得所需技能,且研究材料里提到的团队构成都将传统新闻工作者与技术人员统合起来,所涉及的全部案例亦都基于协作完成。澳大利亚广播公司的温蒂·卡利斯勒(Wendy Carlisle)认为,真正的数据应是跨领域的,数据新闻团队由过去从未共事过的人员组成。接下来的日子,传统新闻工作者将与电脑黑客、开发设计师、编程人员并肩作战(子文本19)。

       数据新闻实践中,数据成为重要的信息源。我们需要关注数据来源构成,因为虽然依托大规模数据的处理使新闻更为全面、可信,但也要谨防形成依赖惯性而再生了制度化的结构。即如同传统故事新闻模式对官方信源的依赖,数据来源也可能形成其特定偏向。就研究材料来看,数据来源一般来自官方资源。统计结果显示,18个数据新闻案例里有15个明确提到了具体的官方机构来源。如案例6“实时竞选黑客”这个对阿根廷2011年10月23日选举的最新投票结果进行数据可视化与政治分析的项目,其所有数据都来自官方,包括国家竞选局、内政部、卫生部以及全国人口普查与住房普查(INDEC)等提供的相关领域信息。

       研究亦显示,在互联网社交媒体发展的基础上,数据来源除了政府及其他公共机构外,还可以是商业机构与普通民众。如案例9中,《卫报》的数据博客对英国暴动的报道和案例13“无所不知的电话”里披露的个人行踪数据皆来源于商业组织。案例18“众包水价”则显示出数据获取的众包方式能够发挥巨大助益。该案例通过为水价网站设计一个众包界面,用户可以扫描水费账单、输入支付水费,在4个月内即有8500人在界面所在网站注册,并上传了超过5000份通过验证的水费单。

       在通过数据强化新闻报道叙事能力的过程中,数据新闻工作者既将数据视作其工作最为基础与关键的环节,亦强调数据只是工具,它仍然是在讲述故事,讲述数字背后关于人的故事(子文本3)。数据新闻工作者会认为数据能够用来核实各个拥有自己议程的信息来源提供的主张辩解等(子文本11),但亦有所反思,如怎样保证数据新闻的真实性和准确性?收集手段是否科学?来源是否可靠?数据是否有代表性和可比性?有数据新闻工作者指出,“相对于其他事实,数字更可能被粗浅地解读,因为数字被戴上了象征严谨的神圣光环,即使是完全捏造的也不例外”。强调记者要增强对数字的批判意识,要正确使用数据,对此开出的处方是“数据的熟悉运用”[33]。

       (二)一个以可视化方式讲述的故事

       “可视化”在论述经验文本中是排行前列的高频词(11)。再结合文本分析可以发现,可视化是目前数据新闻工作流程中的一个关键环节,《数据新闻手册》辟出专门篇幅集中论述如何实现可视化操作。这里只是就研究材料进行语料分析,在语境关键词索引查询的基础上,结合对应具体报道的文本分析来获得探索性发现,了解数据新闻工作者如何认识与实践可视化(代表性索引行见表5)。

      

       就“可视化”这一主题词分布而言,11个新闻编辑室论述文本里只有2个未涉及,18个案例文本中尽管有7个未涉及该词汇,但出现了意义接近的词如“图解的”、“视觉新闻”等。虽然有的因为论述主题强调数据采集与分析等而没有涉及相关词汇,但18个案例所对应的新闻报道都明显使用了可视化手段。对数据新闻而言,可视化不仅仅是美学形式的追求,更是一种功能需要,借以生动、有效传达大量且复杂的信息。即如数据新闻工作者指出的,可视化处理技术与研发人员的技术一起“构成了每一个数据项目的核心组成部分”(子文本20)。

       数据新闻工作者认为利用可视化技术可以将抽象变得具体,将复杂变得简单,以往需要长篇累牍地描述或解释的新闻故事现在可以在大数据信息处理技术条件下变成清晰易掌控的静态或动态视图。如《卫报》数据博客的新闻工作者强调可视化对英国暴动报道的重要意义,认为关于谣言在推特上传播方式的可视化作品“对故事的讲述大有帮助”,“有力地展现那些难以描述的东西,表明了谣言病毒传播的本质,以及谣言的生命周期如何随时间变化的方式”(子文本9)。BBC编辑室则列举了一个欧元区债务网上的专题报道,该报道的主题是欧元区各国错综复杂的国内贷款,为了鼓励用户去关注而不是被数字吓着,该报道通过运用颜色和比例箭头,并辅之以简明易懂的文字,以视觉化的方式来阐释复杂议题(子文本20)。

       这些数据可视化手段在数据工作者的眼里,“能够提升读者对故事的接受程度,也是整个编辑团队展示内容的一种很有吸引力的方式”(子文本23)。如Zeit在线的数据新闻工作者指出,他们参与的案例“基于PISA的财富比较项目”试图比较不同国家的生活标准(12),这是一个宏大的复杂主题,但该项目对经济合作与发展组织(OECD)一份报告所提供的数据进行分析与可视化,通过将财富、家庭情况、获取知识的来源等指标转换成自我解释性的图标,可以像纸牌游戏一样实现不同国家之间的比较,并且基于Raphael-Javascript类库创作出了高质量且漂亮的交互气泡图,带来了巨大的访问量(子文本23)。

       可视化常常会调用互动手段,交互性可视化、互动式地图是研究文本里较为频繁出现的词项搭配。互动是互联网平台相比传统媒体而言的一大优势,从已有案例来看,这些数据新闻实践绝大部分都调用了互动手段,认为通过互动设计可以提升用户的兴趣、参与感和使用体验。如BBC使用联合国人口发展基金提供的数据所做的专题:“70亿人口的世界:你是第几个出生的人?”用户只要输入自己的出生年月日,就可计算出自己是全球第几个出生的人,并可以通过Twitter和Facebook分享其排名。这个专题成为英国2011年Facebook上人气最旺的分享链接(子文本20)。

       另外,互动本身能够成为新闻的一部分。通过互动可以获取更多的用户信息和数据,并且还能赋权于普通公众。如前文提到的案例18“众包水价”通过交互界面来获取用户上传的水费单。案例3“欧元区的垮台”则通过交互性页面获取用户分享的欧债危机下家庭、个人的回应与故事。案例14“MOT测试失败率报道”则通过交互设计向用户开放报道中涉及的原始数据,鼓励用户使用软件参与新闻制作。在经验论述中,来自BBC的马丁·罗森鲍姆(Martin Rosenbaum)认为,数据新闻工作者的任务是“发现与共享”,其他人或许能够找出已有新闻工作者所遗漏或忽略的,可以在已有基础上进一步深入细致地研究数据,或运用不同方式呈现数据,实现视觉化。并且这种分享还将问责制和透明度融入新闻报道过程中(子文本14)。可以看到,借助于交互手段,数据新闻故事更容易与普通公众相关,普通公众更易于参与生产和传播,这一点将在后文进一步分析。

       数据新闻实践中的可视化手段往往是综合的。以澳大利亚广播公司ABC举例提到的数据新闻作品“数字上的煤层气”为例(13),这个数据新闻作品的叙事手段包括了交互地图、数据可视化以及文本。其中交互地图涉及的是澳大利亚煤层气气井分布和租赁情况,读者可以按地理位置搜索查看,除了整体分布及气井周围情况外,提供的信息具体涉及气井的当下状态、深度、开发商名称以及钻井日期等,且读者可在租赁情况和气井分布两种模式之间自由切换。另外,还采用数据可视化的方式来分析煤层气开发带来的废盐、废水等问题(子文本19)。在叙事策略上,通过联想、比喻、对比等可视化的具体手段让抽象晦涩的现象统计变得简洁易懂。如采用“水滴”图形来标识澳大利亚人的用水指标,用地图将空间可视化等。

       可视化手段的实现依赖于一系列工具,被数据新闻工作者提到的主要有:地图(尤其是谷歌地图)、矢量图形库、Excel宏、绘图产品Tableau Public、谷歌免费分享数据的网络工具Fusion Tables、Junar开放数据平台等。由此,可视化与数据采集和处理一样意味着新闻工作者需要掌握新的技能,包括图形可视化和高级研究技能等。为了掌握和利用这些技能,有的媒体机构会自己组建传统记者、程序员、设计师、学术研究员等合作团队,有的则会咨询对应专家(子文本19)。不管采取哪些方式,与数据采集和处理技术一样,可视化技术成为新闻工作者所需的技能之一。

       与对数据的反思一样,从数据新闻工作的讲述里也可以看到他们对可视化的反思。如可视化技术里表格和地图是目前常见的视觉表达手段,但有新闻工作者认为,仅仅以表格或地图呈现,会让原本整个连贯的故事显得断裂,需要更好地进行可视化设计,以呈现生动的新闻故事(子文本17)。BBC的数据新闻经验分享则强调用户体验,提出“数据可视化团队的工作就是将一些很棒的设计和编辑叙述结合起来,从而为用户提供引人入胜的体验”(子文本20)。从这些论述里可以发现,美观与信息、设计与编辑是可视化的两个基本点,并且数据新闻工作者认为可视化的美化设计元素最终植根于事实的故事讲述。如来自《纽约时报》的阿隆·菲尔霍夫(Aron Pilhofer)在讲述其团队对2008年美国大选总统选举结果的数据新闻报道时特别强调:

       理想情况是,一则真正出色的视觉新闻兼具美观与实用性。但当我们要在故事和审美上作出抉择的时候,记者们必然会选择故事性这一边。虽然这样呈现数据的版式布局并非单纯的设计师所设想的那样,但能将故事表达得非常清楚,让新闻充满可读性。(子文本17“选举结果大看板”)

       对数据新闻工作者而言,可视化和数据采集处理技术一样丰富拓展了新闻报道的叙事能力,并且被视为数据项目的核心组成部分,但可视化亦最终服务于讲述新闻故事。不过,借助于可视化,新闻故事更为生动、清晰、可读,让人印象深刻,并且通过交互设计而提高了参与度,可以与普通公众更相关且是为他们自己讲述。

       (三)一个与普通公众相关的故事

       传统新闻故事基于对时效性的追求,以及囿于消息来源的易得性和易用性,其报道关注焦点消息来源主要是国家政要、社会精英等,不仅难以全面呈现社会情状,也使得新闻资源和相应权利仅为少数群体所获得。因而美国学者对该国新闻业诊断后提出,新闻故事不仅需要在政府机构周围建立巡逻领域,更要关注民众日常生活,报道与民众密切相关的社会现象、问题等[22]。而数据新闻在数据化、可视化等叙事手段基础上,改变了对新闻重要性的界定,可以且已经更多地关注政治与经济事件的结构,以及常常处于匿名状态的职员、公务员以及非个人化的社会过程。

       分析研究文本中除了案例7“新闻中的数据玄机:维基解密”对阿富汗战争的解读日志以及案例9“《卫报》的数据博客对英国暴动的报道”属于典型的重大且具历史意义的事件之外,都将关注点投向了民众日常生活,涉及的题材主要有社会矛盾冲突、卫生和公共安全问题、公共政策问题及其长期深远影响的变化、趋势等。

       但如果只关注且呈现宏大主题,则正如甘斯所言,“新闻同样也会变得非个人化,人物故事将会减少,而大量的抽象描述与分析将主导新闻报道”[1]365,这也正是当下一些数据新闻所表现出来的局限,对人类叙事心理接受而言可能带来一定疏离感。但已有数据新闻实践在样式上于甘斯的想象之外做了改变,大致有以下两个方面。

       其一,在新闻记者采访所获得的人物故事之外,通过界面设计增添了更多个人化叙述的故事。如《华尔街日报》对欧元区垮台的报道在处理海量数据基础上制订好记者的报道计划,要求他们去探索有趣的故事,让读者更近距离感受欧债危机,并且设计交互性页面以获取读者观看后分享的故事,这些故事来自欧洲的不同类型家庭及不同世代、不同经历的人(子文本3)。采用个人逸事来讲述新闻故事被视为“有色彩”的[34]8,可以带来“地方感”,使人觉得说话的是活生生的普通人而不尽是官员。且当人们对讨论的事件有直接经验时,会以更具分析性的、联系社会实际的方式来解读新闻,并且采取行动。如威廉·盖莫森指出,有证据表明,当人们把个人经验与政治事件联系起来时,就开始与具有相同经验的人们产生认同感,并采取政治行动[35]。

       其二,除了选择主题与公众相关外,在数据新闻编辑的经验论述中强调要帮助公众(研究文本还较多使用“读者”“公民”等)了解各类事件或主题。如案例4“通过OpenSpending.org报道公共支出”中,强调该报道是为了增进新闻工作者和公众对财政的了解,作为项目“花销的故事”里的一部分,该报道让用户将公共支出和有关公共支出的报道相联系,来看“新闻背后的数据和数据背后的新闻”(子文本4)。

       BBC数据新闻编辑室强调数据新闻的报道原则之一,即为帮助读者更好地理解复杂议题,且让故事成为读者可以个人亲自参与的。为此,在新闻实践上他们提供了大型数据库的探索方式,以其1999年推出的“学校排行榜”为例,使用政府每年公布的数据所推出的应用能够帮助用户通过邮编找到当地学校,并根据一系列指标进行比较。BBC数据新闻编辑室还制作了简便工具,可以为用户提供个性化信息。如BBC推出了一种预算计算器,用户通过使用该计算器,可以预见财政大臣的预算生效后可能产生的更好或更坏的影响,然后分享计算结果。这些工具赢得了那些缺乏时间做冗长分析和搜索的用户喜爱(子文本20)。

       案例1“机遇鸿沟”除了就公众相关事务即学校教育情况提供概览性报道外,还通过交互式的新闻应用帮助读者在宏大的国家数据中理解和寻找与之相关的数据。读者可以找到自己当地的学校,并能与该地区不同贫困程度学校进行对比。读者在参与过程中通过自己已经知道的,如对当地学校的了解,来了解其所不知道或不明白的事,即“教育资源的配置,以及贫困在多大程度上决定教育资源的配置”(子文本1)。在这个读者参与的过程里,数据新闻“描述的不仅是问题所在,还有人们在解决问题的过程中所处的时空位置,以及在其他时间或地点,其他人如何解决了类似的问题”[36]9。

       在新闻编辑室经验分享里,《芝加哥论坛报》新闻应用团队将“帮助读者在数据中发现他们自己的故事”作为数据新闻挖掘的动力和意义,其具体论述如下:

       我们真正的动力应该来源于我们的作品对人们的生活、法律以及政治家的监督,等等。文字报道能够反映社会趋势并且通过几个具体的故事使之更加人性化,但当读者读完报道之后他们会做些什么呢?他们的家庭是否安全?他们的孩子是否接受到公平合理的教育?我们工作的意义在于能够帮助读者在数据中发现他们自己的故事。(子文本21)

       通过“他们自己的故事”,数据新闻在主题上对现实生活中普通民众相关事务的呈现能够引导读者从普通公民的角度来理解公众事务,并且鼓励公众参与。而对新闻工作者而言,当官员成为消息来源的时候,记者与官员定期接触所形成的关系使他们更容易同情这些官员,导致消息来源单一而且“系统性地偏袒某些人物、团体或组织”[37]2。而当社会公众成为消息来源和参与者时,新闻工作者在报道上也能更同情民众,真正专注于为民众提供新闻服务。

       (四)一个为读者自己讲述的故事

       “让数据新闻成为个人的”(子文本20)。“生产数据驱动新闻故事并非大型新闻编辑室的专利,这些对数据新闻工作者而言有用的技能同样能够帮助公民数字记者访问本地数据,并且转化为故事。”(子文本16)语料库分析显示,“欢迎参与性用户且为他们服务”的理念在论述经验文本里多有呈现,与之相关的词项有“个人的、亲自的、互动的”等等,因为在表述上较为分散,难以采用之前的关键词索引行来呈现,故下文将通过引文来具体分析。

       理念具体体现在数据新闻文本的交互性设计和新闻应用上。就这里涉及的18篇案例文本而言,全部都设计了交互性应用,并且会与常用的社交媒体相联系,将UGC内容纳入专业新闻文本里。语料文本中主要涉及的社交媒体有Twitter、Facebook等,并且在论述里强调了“网络”、“在线”等,数据新闻因而是一个“在线的故事”,它充分利用了互联网及社交媒体的影响力,让新闻变得更具个性和互动性。事实上,这亦为其他研究所证实,根据学者对英国《卫报》数据新闻频道中“2012美国大选报道”专辑中55篇相关报道的研究,用社会化媒体吸引用户参与数据新闻的制作与传播是这些报道的重要特点之一。每篇报道都设置了按钮,以方便用户浏览时可以分享到Facebook、Twitter、Google+等[38]141~142。

       回到具体文本,在案例1“机遇鸿沟”中,数据新闻工作者认为不仅需要通过复杂的新闻故事来解读、呈现复杂的社会,还需要让读者能够参与故事生产,这也是数据新闻工作者引以为豪的。该案例相关的新闻作品除了概述性新闻报道外,还在社交媒体Facebook上提供了交互式新闻应用,读者登录社交媒体后可以从庞大的数据库中找到自己所在区域或所关心区域的学校并查看该校相关教育资源(14)。而案例3“欧元区的垮台”则通过全方位展现欧元区的家庭来讲述欧债危机的故事,让读者能够更近距离感受欧债危机中不同世代不同经历者的声音。该案例也设计了交互式页面,用来获取不同读者看完照片后的反应和分享的故事,使用的符号有图片、声音、数据等。对这些报道来说,读者被视作能与报道信息互动的人,而不仅仅是信息的消费者。当公众的故事和观点以这种交互方式得以采集与呈现,人们既是信息接收者,又是信息生产与发送者,在倾听和被倾听的互动过程中,新闻真正成为“对话”的新闻[39]。

       除了通过互动设计和应用将UGC内容纳入专业新闻文本外,数据新闻报道还向用户开放新闻报道的原始数据,鼓励、教授用户使用软件参与新闻制作,帮助他们讲述自己的故事。如案例1中的数据新闻工作者认为,他们引以为豪的是所设计的新闻应用能够讲述一个复杂的故事,但更为重要的是,能“帮助读者讲述他们自己独有的故事”(子文本1)。在案例14中,除了报道所获结论外,还在BBC新闻网站上公布了相关的电子数据表,并且任何访问者都可以使用这些数据自己进行分析。前文已经提及的案例16“公民数字记者”里,巴西公民媒体项目“珍纽瑞亚之友”的数据新闻工作者同样津津乐道的是,他们成功帮助了毫无新闻背景的用户结合他们当地的情况以及感兴趣的领域来生产制作数据新闻。在这个案例中,数据新闻工作者帮助巴西境内小城市的当地居民学习基础新闻技术,并提出“信息自由”之要求,帮助他们进入互联网上的官方数据库等,在参加完12期的研习班后,一些完全没有任何记者背景的年轻人也能够写出由数据驱动的新闻故事,呈现出当地有趣的民生百态。对此,这些数据新闻工作者认为,公民记者能够利用数据来完成新闻稿,并不需要同大批专业人员一起待在大型新闻编辑室中(子文本16)。

       这些实践体现了数据新闻中的“开源”理念(15)。开源在技术上指的是一种透明与参与式编码,所有源代码能够被所有人使用、修改,且这些修改其他人又都能任意获得[40]15。其蕴含的理念即分享,也是网络诞生以来发展出的黑客伦理之核心,在实践中能够为群体及其行动提供更广泛的平台。可以看到,有些数据新闻团队正在做的便是开放专业生产与把关之门。谁来生产这些“数据故事”(16)?记者、信息设计员、计算机科学工作者?除了这些专业人士形成的职业团队之外,还有对此有兴趣的普通公众。

       开放源数据平台也是研究材料中出现频次较高且是被视为数据新闻传奇的《卫报》数据博客一直贯彻的,即分享数据、文章和问题。这种新兴的发布平台赋予个体数字化收集、共享数据以及将其转化为信息的能力,以开放式互动提升受众参与制作及解读数据新闻的能力,以求建立良好的数据资源生态。因为参与者和信息的增多会使数据表达的事实更为准确,而且正如数据新闻工作者在实践中指出的,还能够进一步拓展新闻工作者由于时间和技术限制的有限报道(子文本14)。这种参与也能增加用户对新闻的关注度,激发移动与按需时代的公民参与[41]。如巴西公民媒体项目中的一位公民数字记者接受培训后,根据联邦政府数据写出了其所在城市受雇医生数量的新闻报道,成功地提出了对官方数据的质疑。他感受到媒介赋权的力量,他想成为记者的梦想成了现实,相信获取数据是改变当地现状的一个重要工具,他这样说道,“我觉得自己有能力为改变我的家乡、我的国家甚至为整个世界出一份力”(子文本16)。

       从开源理念及其实践可以窥见,参与数据新闻的计算机程序员及其理念正在挑战传统新闻常规。如同学者在梳理众多关注与探讨计算机新闻的文献后指出的,以新闻职业为中心来探讨技术创新有可能限制开源所能发挥的能力。开放资源作为一种结构和文化的动力场,预示着一种新的新闻标准与规范[42]606。因而,未来将不再仅仅是基于美国传统新闻工作者视角所考虑的,即世界增加的复杂程度使新闻工作者为公众提供更深入全面的阐释与分析是必要的,而是借助于新的技术工具,新闻工作者不应再以中心化的方式建构道德判断与陈述,不再将数据分析当作其建构价值判断的工具,而是让用户成为这个建构过程中合法且积极的贡献者[43]865。

       “每一次技术进步都或多或少地重新界定了公民角色”[44]10。如果说在传统新闻故事中,公众更多处于被动解读与消费的位置,那么数据新闻实践正在持续关注普通公众的议题,并致力于在重要议题上让更多民众发表自己的意见,在报道中邀请市民参与并为其创造途径,使其更清楚能够做什么来推动事情的进展。可以认为,数据新闻实践正在贯彻和体现公共新闻学理念(17),即“新闻不应被政府和任何利益集团控制,它应该帮助社区和健全社会的民主生活正常运转”[22]5。数据新闻由此与人们日常生活密切相关,能够帮助与激发人们根据新闻来了解信息以及采取行动,并且也与其他公共新闻、公民新闻实践等一起,成为“重构新闻业”的力量之一。

       (五)一个更为复杂并接近真相的故事

       虽然现代新闻业秉承的原则是“要对真实负责”[22]5,职业信条是“坚守真实,探求真相”[45]45,但对真相的探求受限于普遍的权力机制,且人类认知结构自诞生以来就只能片面地呈现事实。这已为学者认识并限定了对新闻职能的期待,如沃尔特·李普曼在20世纪20年代探讨舆论一书中指出的,新闻的职能是要凸显一个事件,而真相的职能是“探明隐藏的事实,并使其彼此发生关联”[46]226。他认为只有当社会条件达到可以认知和可以测量的状态,真相和新闻才会一致,但显然并不能因为认识到一定时代环境下新闻呈现事实的局限就放弃赋予新闻业的理想和原则。为了更全面地呈现社会事实与接近真相,新闻业务需要发展出一种更有效的信息处理、组织与传播方式。而数据新闻之所以诞生伊始便被赋予厚望,原因之一是它突破了传统新闻中已经认识到的某些不足,在叙事上能够讲述一个更为复杂也更能接近真相的故事。这从研究文本的语料和文本分析可以推出:

       数据新闻工作者可收集、合成并呈现各种各样且常很难获取的信息,帮助受众真正深刻理解复杂议题。相比单纯地循环使用新闻稿,将其他地方听到的新闻事件再重述一遍,数据新闻记者能用交互式图表和直接获取的第一手资料给读者一个清晰明了、可理解且更好地量身定制的观点。这些观点不是琐碎的,而是有价值的。(子文本29)

       这较为典型地论述了数据新闻工作者对数据新闻叙事能力的认识。数据新闻工作者认为他们可以,也应该讲述一个复杂的故事,让读者能更好地理解复杂议题。正如有学者指出的,“一个事件具有新闻价值并不仅仅因为事件本身,还因为我们能用已有的叙述符码对其进行叙述”[47]70。传统新闻从业者认为读者对较长的故事会更容易丧失兴趣,讲故事力求简短,需要长篇累牍地描述或解释的新闻有时会从故事清单里剔除,因而经济主题、复杂议题常不被触及[1]204。但借助于数据化和可视化等叙事手段,这些不愿被触碰但又往往关系到公共生活之必要且有用的信息可以被有效报道,且以一种简单、清晰、更容易为受众所理解的方式。即如来自“德国之声”的一位数据新闻工作者指出的,借助于数据采集、数据分析及视觉化等数据工具和技术,人们越来越有能力去把握和理解那些极其繁杂的议题,如国际金融、债券、人口、教育等(子文本29)。

       整体分析研究材料的新闻议题可以发现,数据新闻明显更偏向于社会问题报道(如案例12“养老院危机”、案例13“无所不知的电话”),更多关注经济事件深层结构(如案例2“对欧盟结构基金为期九个月的调查”、案例3“欧元区的垮台”)、政治事件深层结构(案例5“芬兰议会选举与竞选经费”、案例17“选举结果大看板”)以及非个人化的社会过程等(案例9“《卫报》的数据博客对英国暴动的报道”),事实上这18个案例都涉及复杂的新闻议题。

       数据采集与处理是复杂的、“更耗时的”(子文本3),数据新闻工作者一般不以第一报道事件为追求,而是要成为值得信任的信息来源。针对一个复杂议题,在空间上,数据新闻工作者收集、整合并呈现多种多样甚至获取困难的信息来给读者提供真正的洞见,通过互动图形以及直接采访主要信息来源,带给读者一个简洁、全面、适宜的视角(子文本29)。在时间上,将事件置于历史语境中。如同美国学者所言,最好的新闻报道“不会解释了一个事件之后就跳到一个又一个其他的事件,而是长期追踪事件的重要进展,提供信息,使人们了解利害关系,知道如何参与其中,介绍社区的整体运转状况”[36]9。

       因为往往要深入探析一个复杂的题材,数据新闻会采用调查新闻的模式。“调查”在研究材料中是一个高频词,出现频率为62次,且语义集中度非常高,无论是点明数据新闻作为调查新闻(报道),或者作为动词,都强调了该词本义,即深入考察。另据研究者统计,在2012年首届全球数据新闻奖参赛作品里,数据驱动调查类新闻占到了121项,即总参赛作品的42.3%,将近一半。且根据分析,数据新闻目前发挥特长的领域是调查性深度报道。一般认为大数据有助于深度报道之创新[48],使以往调查事实和舆论所依赖的随机样本可以为更全面的样本所代替,而且还可以利用计算机和互联网进行更深入的数据搜寻。

       数据新闻故事与传统新闻故事(这里指的是形成特定生产常规、更多关注戏剧性冲突的新闻故事)在新闻报道的文本组织手段上可以借用传播学者山特·杨格对“插曲式新闻”和“主题曲式新闻”的划分[49],前者把记者和受众空投到一个已然的情境中,关注的是矛盾、冲突中的人;后者则突破眼前的戏剧场景,挖掘造成新闻报道中所涉及问题的根源,从更深层次上剖析社会、经济或政治背景。个人化的或“插曲式”的故事结构引导受众以一种短期、情感的和个人化的方式来思考诸如经济和社会政策等问题,而这类问题并非简单的故事能够涵盖,毋庸置疑,需要更深入的抽象分析把令人费解的公共事务和社会问题相关信息融入报道中。通过对社会问题的“主题曲式”的探讨,才能触及问题的发展趋势和历史背景,激励人们去思考这些问题的社会、政治和经济的力量,使人们不仅能理解,还能以之为行动指南。其他学者也肯定这类报道具有促进公众参与的力量,认为对复杂事件、主体和过程的解释性报道有助于增强民主[50]。

       通过讲述一个复杂故事来抵达真相这一理念也为数据新闻工作者所内化和追求,正如《金融时报》的数据新闻工作者辛西娅·奥墨楚(Cynthia O'Murchu)所强调的,数据新闻在实践上不应该只是目的性地分析数据或数据可视化,而且应将其作为一种工具来接近世界上正在发生的事情的真相(18)。

       五、结语:延续与变革

       基于数据新闻工作者的经验论述文本对“故事”的强调与阐释,可以看到新技术条件下重组后的新闻编辑室对传统新闻价值和故事样式的继承,与此同时,在故事这个样式场域中也可以看到新闻采集、呈现及其理念的变革。

       为了抓住人们的注意力,数据新闻依然在讲述新闻故事,但发展出了信息爆炸时代能更好地处理、传送与接收信息的模型和工具,如数据挖掘、数据分析、可视化、交互应用等,从而将传统的新闻敏感和有说服力、感染力的叙事能力与海量数据结合,创造了新的可能。数据新闻为数据驱动,以可视化的方式讲述故事,复杂的故事也能变得清晰。数据新闻增强了互动性,讲述多维故事,帮助读者探索新闻相关信息,且鼓励读者参与到创作和评价新闻故事的过程中。参与、互动、开源成为数据新闻故事的新特征:这不是传统讲述的集中化的故事,而是去中心化的故事。坎贝尔曾将新闻报道比作一条三角板凳,保持凳子稳定的三条腿分别为:强有力的报道、执拗的信息收集以及对时事对话的悉心扶持,并认为这对国家至关重要[36]9~10。数据新闻架构与生产的故事可以并且正在打造这个更稳定的三角板凳。

       但任何样式都是信息取舍的框架。起初数据新闻作为一种工具用以接近世界上正在发生的事情之真相,但在特定工具的强化和习惯使用中,借助数据采集、处理、可视化等常规手法来加工新闻事件,其本身会形成“一个读解日常生活片断的认识框架”[51]73。它会凸显什么,又遮蔽什么?我们依然需要保持对数据新闻故事模式的反思。认识到故事框架作为一种必然存在有助于带来生产与接受新闻时的警醒(19),因为无论含蓄或明晰,记者总会将事实裁剪成一种具有内在意义的形式,这种形式会形成其自身的偏见[31]168。以数据挖掘为例,数字在象征严谨上的符号特性暗示了叙事的真实性,但数字有可能被粗浅地解读。认识到这些框架的存在并形成反思性实践,有助于利用其对人类认知的积极意义,避免其带来的认知局限以及延伸出来的实践后果。

       《数据新闻手册》是一本“仍在进展中”[12]前言的书。而“数据新闻”也是一个概括性术语,“它囊括了一套仍在不断增多的用于新闻叙事的工具、技巧与方法”,“数据新闻正处在革新过去的操作手法以适应互联网的初始阶段”(20)。这也是一个重新架构故事的好时期。基于对新闻及其民主功能的期待(21),这里借用坎贝尔论述作为民主艺术的新闻事业的话来说,有效的新闻事业需要引导人们关注“生活重大的问题、每天重要的事件和塑造世界和我们服务的社区的日常紧急事件和非紧急事件”[17]10。无论以何种样式出现,这都是架构故事所应当追求的。

       要谨记的是,“你要把握新闻的真实性,保证自己能很好地讲故事”(子文本1)。

       注释:

       ①关于新闻常规的更多论述可参见:G.Tuchman,“Making News by Doing Work:Routinizing the Unexpected,” The American Journal of Sociology,Vol.79,No.1(1973),pp.110~131; P.J.Shoemaker & S.D.Reese,Mediating the Message,White Plains:Longman,1996,p.105。

       ②《数据新闻手册》已在业界和学界广为传播,相关研究参见:方洁、颜冬《全球视野下的“数据新闻”:理念与实践》,载《国际新闻界》2013年第6期,第73~83页;李希光、张小娅《大数据时代的新闻学》,载《新闻传播》2013年第1期,第7~11页;苏宏元、陈娟《从计算到数据新闻:计算机辅助报道的起源、发展、现状》,载《新闻与传播研究》2014年第10期,第78~92、127~128页。

       ③相关研究参见:S.L.Althaus,J.A.Edy & P.F.Phalen,“Using the Vanderbilt Television Abstracts to Track Broadcast News Content:Possibilities and Pitfalls,” Journal of Broadcasting & Electronic Media,Vol.46,No.3(2002),pp.473~492;P.Baker & T.Mcenery,“A Corpus-based Approach to Discourses of Refugees and Asylum Seekers in UN and Newspaper Texts,”Language and Politics,Vol.4,No.2(2005),pp.197~226;钱毓芳、田海龙《话语与中国社会变迁:以政府工作报告为例》,载《外语与外语教学》2011年第3期,第40~43页;赵凌《媒介·话语·权力·身份:“农民工”话语考古与身份生产研究》,浙江大学2013年传播学博士学位论文。

       ④该语料软件是由日本学者Laurence Anthony开发的绿色免费软件,具有词语检索、生成词表和主题词、检索词的上下文背景等功能。

       ⑤以“故事”为例,在英文表述中包括了story、stories、storytelling等,故通过词根通配以“stor*”进行搜索。

       ⑥以“data*”搜索获得,包括:“data”409次,以及相关的变异形式如data、database、dataset、datablog等。后续核心词的类别搜索方式类同。

       ⑦相关研究可参见:甘斯《什么在决定新闻》,石琳、李红涛译,(北京)北京大学出版社2009年版;[美]塔奇曼《做新闻》,麻争旗、刘笑盈、徐扬译,(北京)华夏出版社2008年版;[美]W.兰斯·班尼特《新闻政治的幻象》,杨晓红、王家全译,(北京)当代中国出版社2005年版。

       ⑧相关研究可以参看:M.Luengo,“Constructing the Crisis of Journalism,” Journalism Studies,Vol.15,No.5(2014),p.576; V.Pickard,“Can Government Support the Press? Historicizing and Internationalizing A Policy Approach to the Journalism Crisis,” Communication Review,Vol.14,No.2(2011),pp.73~95; P.Meyer,The Vanishing Newspaper:Saving Journalism in the Information Age,Columbia,MO:University of Missouri Press,2009;[美]迈克尔·舒德森、黄煜《社会学视角下的传媒研究:新闻、民主及其未来》,载《传播与社会学刊》2014年第30期,第1~26页。

       ⑨相关研究可参见:PEJ,“State of the News Media 2014,”2014~03~26,http://www.journalism.org/packages/state-of-the-news-media-2014/,2015~05~12; L.Downie & M.Schudson,“The Reconstruction of American Journalism,”Columbia Journalism Review,No.19(2009),pp.1~97。

       ⑩引述内容来自《数据新闻手册》“入门”部分,其中列出了数据领域的领先实践者和提倡者就为何认为数据新闻是个重要发展领域的回答。具体见Anon.,“Why Is Data Journalism Important?” in J.Gray,L.Chambers & L.Bounegru(eds.),The Data Journalism Handbook:How Journalists Can Use Data to Improve the News,http://datajournalismhandbook.org/1.0/en/introduction_2.html,2015~05~20。

       (11)对应词项包括了visual、visualize、visualization(s)等。

       (12)即The PISA Based Wealth Comparison Project。其中PISA,指的是Programme for International Student Assessment(国际学生评估项目)。

       (13)这是澳大利亚广播公司的在线新闻,具体参见http://www.abc.net.au/news/specials/coal-seam-gas-by-the-numbers/。

       (14)这个数据库包括了一个地区内所有规模大于三千名学生的公立学校。

       (15)研究材料里“开源”词频为3,较低,但以“open”搜索,词频为41,且语义大多含有开放分享之意。

       (16)参见W.Weber & H.Rail,“Data Visualization in Online Journalism and Its Implications for the Production Process,”in 16th International Conference on Information Visualisation(IV 2012),IEEE Computer Society,2012,pp.349~356。

       (17)从已有数据新闻实践,可以看到数据新闻基本上实施了公共新闻学的观念。具体参照美国学者汤姆梳理的传统新闻学与公共新闻学之九大区别,见刘肇熙、姚清江《公共新闻学:美国新闻理论的第三次革命——访〈哥伦比亚-密苏里人报〉总编辑汤姆·瓦霍沃》,载《青年记者》2004年第4期,第43~45页;[美]谢丽尔·吉布斯、汤姆·瓦霍沃《新闻采写教程——如何挖掘完整的故事》,姚清江、刘肇熙译,(北京)新华出版社2004年版,第4~6页。

       (18)该数据新闻工作者是子文本2和子文本12的讲述者。引述内容来自《数据新闻手册》“入门”部分,见Anon.,“Why Is Data Journalism Important?” in J.Gray,L.Chambers & L.Bounegru(eds.),The Data Journalism Handbook:How Journalists Can Use Data to Improve the News,http://datajournalismhandbook.org/1.0/en/introduction_2.html,2015~05~20。

       (19)事实上,新闻从业者起初对作品呈现事实的故事形式并非有强烈意识,也“一般不认为自己是一个故事讲述者”,而是“一个事实的采集者”。

       (20)引述内容来自《数据新闻手册》“入门”部分,其中列出了数据领域的领先实践者和提倡者就为何认为数据新闻是个重要发展领域所提供的回答。具体见Anon.,“Why Is Data Journalism Important?”in J.Gray,L.Chambers & L.Bounegru(eds.),The Data Journalism Handbook:How Journalists Can Use Data to Improve the News,http://datajournalismhandbook.org/1.0/en/introduction_2.html,2015~05~12。

       (21)参阅[澳]约翰·基恩《媒体与民主》,刘士军译,(北京)社会科学文献出版社2003年版;[美]迈克尔·舒德森《新闻社会学》,徐桂权译,(北京)华夏出版社2010年版。

标签:;  ;  ;  ;  

数据新闻:“讲一个好故事”?数据新闻对传统新闻的继承与变革_数据新闻论文
下载Doc文档

猜你喜欢