新闻搜索中舆论的“高峰”--对近年来我国重大矿山灾害报道网页数量的分析_矿难论文

新闻搜索中的舆情“峰值”——中国近年来重大矿难报道WEB页面数分析,本文主要内容关键词为:舆情论文,峰值论文,中国论文,矿难论文,新闻搜索论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一条重要的新闻,被各类传统媒体刊登与播出的频次,是很难统计的。而对于网络媒体来说,这种统计成为可能。是搜索引擎使这种可能变为现实。通常情况下,一条新闻在网上发布后,通过对这一条新闻的关键词的查询,能够迅速找到所有发布这一条新闻的WEB页面及其数量。这说明网络媒体不仅在历史资料的查询上大大优于传统媒体,并且建立在查询与搜索基础上的相关统计,也为传统媒体望尘莫及。

通过对有关新闻事件在搜索引擎中所搜索出来的WEB页面数量的统计,可以在一定程度上反映出网上的舆情。一般认为,网上舆情可从网络受众与网络媒体两个层面来考察。从网络受众的层面看,一个新闻事件的影响主要反映在BBS或论坛里就此事件讨论的人气上,这种人气可以由BBS里同一主题的发贴数与跟贴数反映出来。从网络媒体的层面看,如果一个新闻事件的影响越大,新闻网站与其他内容网站就这一新闻事件所做的“新闻专题”与“相关新闻”的页面通常就越多。无论是BBS里的贴子数量,“新闻专题”与“相关新闻”的页面数量,最终在搜索引擎中都表现为可以搜索到的页面,并构成这一新闻事件在网上的主要内容资源。因此,通过对某一新闻事件在主流搜索引擎中的WEB页面数的科学查询、搜索与统计,可以大体反映出这一新闻事件的网上舆情,这在一定程度上反映了新闻传播中的舆论情况,甚至,也反映了网络新闻“在价值取向上发生了一系列深刻的变化”。(注:董天策:《网络新闻价值判断的四个标准》(《网络传播》2005年第3期))

一、研究原因

1.搜索引擎是互联网上最热门的三大基础应用之一(另外两个是电子邮件与即时通信工具)。搜索引擎技术近年来发展迅猛,互联网上对搜索引擎的使用已经排在第二位,仅次于电子邮件。97%的网络用户每月都会使用搜索引擎。

2.从传播方式看,搜索引擎带来的最大变革,是将网络信息以WWW访问方式(即给我看),演进到自我查找方式(即我要看)。2004年9月Google中文新闻的推出引人瞩目,它“利用软件自动抓取功能实现了每15分钟更新一次新闻”,(注:闵大洪:从Yahoo新闻到Google新闻(紫金网:http://www.zijin.net/blog/ more.asp? name=mdh&id=167))虽然也存在不少问题,但某种程度上它更为客观。

3.从传播研究的角度看,搜索引擎不仅是信息查询工具,也是信息统计工具,因此亦可视为研究的辅助性工具。

二、研究对象

研究对象为中国近年来网上的重大矿难报道。之所以选取这个对象,因为近几年来关于矿难的报道在互联网上引起了普遍关注,并且社会影响越来越大。

本研究关注的重点,是想通过矿难报道这样重大的新闻事件在搜索引擎中的搜索结果(即WEB页面数),察看它们在网络舆论环境下的各自的“峰值”状态,即所谓的舆情“峰值”,从而揭示出这类新闻事件在网上舆情的形成、变化情况及其相互之间的关系。

仍要强调,这里的舆情系从网络媒体所发布的信息的角度考察,在此前提下,可以给网上舆情“峰值”下一个定义,那就是:反映一个重要新闻事件或与该事件相关的WEB页面的项值(数量)。

选取矿难个案的原则,系近年来(从2001年起)死亡50人以上的矿难事故。按照原煤炭部1995年颁布的《煤炭工业企业职工伤亡事故报告和统计规定》,一次死亡50人(含50人)以上为特别重大事故。因此,本研究所选八大矿难事故,均属于“特别重大事故”。

三、所采用的搜索引擎及分类

1.搜索引擎

(1)Google(2)Baidu(百度)(3)Yahoo

2.采用理由

(1)在iResearch(艾瑞调查公司)发布的《2004中国搜索引擎研究报告》(注:《2004中国搜索引擎研究报告》于2005年2月发布,根据其数据显示,2004年中国搜索引擎市场中百度依然处于领导者地位,网民认可度高达85.3%。其次分别为Google、雅虎和一搜、网易、新浪、搜狐等。)中,百度、Yahoo中文(注:这里是指“雅虎系”,“雅虎系”包括一搜、3721地址栏搜索、雅虎门户。)、Google中文分别以36.29%、22.72%、21.22%的用户占有率占据国内搜索引擎市场的前三位。

(2)据美国WebSideStory公司2004年4月的研究报告称,Google(英文)的市场份额已经达到41%,占美国搜索市场份额的第一位。第二位Yahoo(英文)占27.40%,第三位MSN占19.57%。

3.搜索引擎分类

将上述三个搜索引擎分为6个搜索类别:

(1)Google(中文简体)(2)Baidu(中文简体)(3)Google(中文繁体)(4)Baidu(中文繁体)(5)Google(英文)(6)Yahoo(英文)

4.分类理由

本研究的思路是把搜索引擎按语言分为三类,即简体中文、繁体中文和英文,并一般地认为:简体中文的搜索结果与大陆舆情相关,繁体中文的搜索结果与境外华人圈的舆情相关,英文的搜索结果则与西方社会舆情相关。

因此,所有的搜索结果,均系通过三大搜索引擎的“高级搜索”方式获得。之所以采用高级搜索,主要是为了能按照中文简体、中文繁体和英文三种语言类别分别进行搜索并获取相应的搜索结果。

四、搜索结果与分析

这里将近年来中国主要矿难情况,以一览表的形式作进一步梳理(表一)。在此基础上确定中文搜索关键词与英文搜索关键词,进行搜索与分析。搜索的结果是否理想的关键,在于对中、英文关键词的选择。

表一 中国近年来矿难概况与WEB页面搜索关键词一览表

矿难名称

发生时间死亡人数 中文搜索英文搜索

关键词

关键词

广西南丹特大透水事故2001年7月17日81南丹特大透水

mine accident

事故 (Nandan+Guangxi)

黑龙江鸡西矿难 2002年6月20日124

黑龙江鸡西矿难 mine gas explosion(Jixi+Heilongjiang)

河南大平矿难2004年10月20日

147

河南大平矿难

mine gas explosion(Daping+Henan)

河北沙河矿难2004年11月20日

70河北沙河矿难mine fire(Shahe+Hebei)

陕西铜川矿难2004年11月28日

166

陕西铜川矿难

mine gas explosion(Tongchuan+ShanXi)

辽宁孙家湾矿2005年02月14日

214

辽宁孙家湾矿难 mine gas explosion(Fuxin+Liaoning)

山西朔州矿难2005年3月19日72山西朔州矿难

mine gas explosion(Shuozhou+Shanxi)

广东兴宁矿难2005年8月7日 123

广东兴宁矿难

mine accident(Xingning+Guangdong)

1.关于执行搜索的几个重要说明

(1)搜索执行日期。搜索执行日期分类两类情况:

第一类为自陕西铜川矿难以来的4次矿难,其搜索执行时间原则上为自矿难发生的一个月内进行,具体日期视各个矿难情况而定,一般为矿难事故处理基本处理结束或阶段性结束的那一天,通常各类媒体自此之后对该矿难的报道就大大降温了。因为根据实验,一个矿难从发生到基本处理结束,是其网上相关WEB页面大量涌现的时期,此后,关于该报道的WEB页面数增加不大。现分述如下:

陕西铜川矿难:搜索执行日期为2004年12月15日(发生在2004年11月28日),这一天铜川矿难矿难166名遇难矿工家属全部接受赔付;

辽宁孙家湾矿难:搜索执行日期为2005年2月24日(发生在2005年02月14日),这一天国务院决定对此矿难负有重要责任的辽宁省副省长刘国强停职检查;

山西朔州矿难:搜索执行日期为2005年4月15日(发生在2005年3月19日),这一天国家安监总局通报了山西朔州矿难14位责任人被逮捕(其中包括造成29人死亡的3月9日山西省吕梁市交城特大瓦斯爆炸事故责任人,两起事故一起通报的);

广东兴宁矿难:搜索执行日期为2005年8月7日(发生在2005年8月29日),这一天广东省“8·7”特别重大透水事故抢险救援指挥部召开新闻发布会,宣布放弃救援。

第二类为陕西铜川矿难之前的4次矿难,因为本研究从2004年底开始搜集资料,因此对于此前发生的这4次矿难,难以在搜索执行日期上实行第一类的原则,即在矿难发生一个月内进行搜索,帮统一将搜索执行日期定为2005年2月14日,即这8次矿难中影响最大的辽宁孙家湾矿难处理基本结束的那一天。这样做显然对这4次矿难的WEB页面数的统计有失精确(根据实验是数量会减少),但这样做也是不得以为之了。

(2)“高级搜索”中对搜索条件的设置。有关选项如下:时间:全部时间,即包括指从搜索执行日起以前的全部时间。

地区:全部地区。

文档格式:所有网页和文件,文件格式包括:Adobe Acrobat PDF(.pdf)、Adobe Postscript(.ps)、Microsoft Word(.doc)、Microsoft Word(.xls)、Microsoft Word(.ppt)字词位置:网页内的任何地方。

(3)关键词的选择,以搜索最多结果为一般原则。

中文关键词的选择,一般以发生矿难的地名加上“矿难”二字,而略去省名,如用“辽宁孙家湾矿难”为关键词,在Google简体搜索中的结果是276,000项,而用“孙家湾矿难”为关键词,在Google简体搜索中的结果是434,000项,故采用“孙家湾矿难”作为关键词,余类推。

英文关键词的选择要复杂一些。由于英文新闻在对大陆矿难的报道中,在地点上不如中文报道那么详细,有时会略去发生矿难的地名或煤矿名,但一般不会略去省名。所以在英文关键中不能略去省名,否则搜索的结果数会减少许多。但也不能只用省名不用地名,如果某省历史上发生过不止一次矿难,仅用省名的搜索结果就会有误。这样,对每一个矿难就有3个关键词可供选择,即“mine gas explosion+矿名”、“mine gas explosion+地名”和“mine gas explosion+省名”经过试验,前两种关键词的搜索结果相差不大,最后采用了“mine gas explosion+地名”与“mine gas explosion+省名”两次搜索的平均值的方法。

例如:对辽宁孙家湾矿难的搜索,在Google英文搜索中," mine gas explosion+Sunjiawan" 的结果是556," mine gas explosion+Fuxin" 的结果是693," mine gas explosion+Liaoning" 的结果是5,600,弃去" mine gas explosion+Sunjiawan" ,取" mine gas explosion+Fuxin" 与" mine gas explosion+Liaoning" 两个结果的平均值:3,147。

对辽宁孙家湾矿难的搜索,在Yahoo英文搜索中," mine gas explosion+Sunjiawan" 的结果是595," mine gas explosion+Fuxin" 的结果是815," mine gas explosion+Liaoning" 的结果是2,220,弃去" mine gas explosion+Sunjiawan" ,取" mine gas explosion+Fuxin" 与" mine gas explosion+Liaoning" 两个结果的平均值:1,518。

河北沙河矿难,实为火灾,故核心关键为" mine fire" ,同理,广西南丹特大透水事故的核心关键为" mine accident" 。

1.数据整理与搜索结果

表二为6类搜索引擎的分类搜索结果记录,但也不完全是原始数据,如Google英文与Yahoo英文的页面数本身已经是根据不同的关键词搜索后结果的平均值。

表二 网上矿难报道WEB页面记录数〔按搜索引擎分类〕

矿难名称Google中文

Baidu中文

Google中文 Baidu中文

Google英文 Yahoo英文

简体页面数

简体页面数 繁体页面数 繁体页面数

页面数

页面数

1 南丹透水事故 30,400 12,500 25,300 3,330571 524

2 黑龙江鸡西矿难24,100 5,810 1,800 781

726 634

3 河南大平矿难 40,300 49,600 7,600 3,0202,348

1,073

4 河北沙河矿难 16,800 33,400 2,300 818

3,131

867

5 陕西铜川矿难 105,700 96,400 23,400 2,8353,156

1,014

6 辽宁孙家湾矿难434,000 173,000195,0003,1703,147

1,518

7 山西朔州矿难 109,800 58,000 8,700 820

415 102

8 广东兴宁矿难 55,700 65,300 1,080 1,920356 197

表三系利用SPSS对表二中的数据进行统计、处理的结果,即按6类搜索引擎的页面总数、6类搜索引擎的页面平均数、三种不同语言的页面平均数生成新的五个类别,并根据矿难发生时间进行排序。

表三 网上矿难报道WEB页面统计数〔按发生时间排序〕

矿难名称 发生时间6类搜索引擎6类搜索引擎 中文简体页面

中文繁体页面

英文页面平均数

页面总数 页面平均数 平均数平均数

1

南丹透水事故 07/17/2001 72,62512,104

21,450

14,315 548

2

黑龙江鸡西矿难

06/20/2002 33,8515,64214,955

1,291

680

3

河南大平矿难 10/20/2004 103,941

17,324

44,950

5,310

1,711

4

河北沙河矿难 11/20/2004 57,3169,55325,100

1,559

1,999

5

陕西铜川矿难 11/28/2004 232,505

38,751

101,050 13,118 2,085

6

辽宁孙家湾矿难

02/14/2005 809,835

134,973 303,500 99,085 2,333

7

山西朔州矿难 03/19/2005 177,837

29,640

83,900

4,760

259

8

广东兴宁矿难 08/07/2005 124,553

20,759

60,500

1,500

277

表四则是在表三生成的五个类别的基础上,根据矿难死亡人数进行排序。

表四 网上矿难报道WEB页面统计数〔按死亡人数排序〕

矿难名称 死亡人数6类搜索引擎6类搜索引擎中文简体页面

中文繁体页面

英文页面平均数

页面总数 页面平均数平均数 平均数

1河北沙河矿难70 57,316 9,553 25,100 1,559 1,999

2山西朔州矿难72 177,83729,640 83,900 4,760 259

3南丹透水事故81 72,62512,104 21,450 14,315548

4广东兴宁矿难123124,55320,759 60,500 1,500 277

5黑龙江鸡西矿难 124 33,851 5,642 14,955 1,291 680

6河南大平矿难147103,94117,324 44,950 5,310 1,711

7陕西铜川矿难166232,50538,751 101,050 13,1182,085

8辽宁孙家湾矿难 214809,835

134,973 303,500 99,0852,333

表五系网上矿难报道的英文页面平均数。

表五 网上矿难报道的英文WEB页面平均数。

矿难名称 发生时间死亡人数

英文页面平均数

1

南丹透水事故 07/17/01 81548

2

黑龙江鸡西矿难

06/20/02 124680

3

河南大平矿难 10/20/04 147

1,711

4

河北沙河矿难 11/20/04 70

1,999

5

陕西铜川矿难 11/28/04 166

2,085

6

辽宁孙家湾矿难

02/14/05 214

2,333

7

山西朔州矿难 03/19/05 72259

8

广东兴宁矿难 08/07/05 123277

分析将主要通过从表三到表五中的统计数据进行,因为这些统计数据已经不是单一搜索引擎的搜索结果,而是同类搜索的总量或平均值,相对来说更能反映出由于单一搜索引擎可能造成的误差。

2.结果分析

(1)网上矿难报道的“舆情峰值”随时间发展呈上升趋势,到2005年2月14日(大年初六)的辽宁孙家湾矿难发展到顶峰,随后又有所回落(图一)。

附图

图一 网上矿难报道WEB页面总数与平均数随时间变化经态势

值得注意的是2004年11月28日的陕西铜川矿难,是“舆情峰值”上升的起点。铜川矿难作为近年来网上矿难报道的热度明显上升的一个起点,特别值得注意。一方面,发生在铜川陈家山媒矿的这次矿难(死亡66人),是我国自1960年11月28日平顶山龙山庙煤矿死亡187人的瓦斯煤尘爆炸事故之后,44年来我国煤炭行业死亡人数最多的一起矿难。另一方面,由于温家宝总理事后(2005年1月2日)到陈家山媒矿看望、慰问了矿难家属,也引起了媒体对这次矿难的特别关注,并不可避免的反映到网上来。根据笔者记录:温家宝总理慰问矿难家属后的第二天(2005年1月3日),上述6类搜索引擎上关于铜川矿难报道的WEB页面数比前述2004年12月15日(这一天铜川矿难矿难166名遇难矿工家属全部接受赔付)的搜索结果有了较大幅度的提升,从232,505个页面增加到268,708个页面,上升了15.6%,而发生在其前后的沙河矿难与辽宁孙家湾矿难,在矿难事故处理相对告一段落后的一个月内,相同指标的WEB页面数均不超过3%。

关于铜川矿难还有一个关注点。根据新浪网2005年4月24日报道,“陕西铜川特大矿难70名遇难矿工遗体尚在搜寻中”,也就是说,这是近年来第一起近半数遇难矿工遗体在矿难发生半年后仍然尸骨无存的矿难——这至少部分地解释了为什么这次广东兴宁矿难大多数遇难者虽然也寻尸无着,却未能具有较高的网上舆情“峰值”(图一中的曲线最终呈回落态势)。

(2)网上矿难报道的“舆情峰值”一般与矿难事故规模(死亡人数)密切相关,死亡人数越多,峰值越高(图二)。

附图

图二 网上矿难报道WEB页面总数

从图二中可以看出,辽宁孙家湾矿难形成了“峰值”“井喷”现象,使网上舆情达到前所未有的高涨程度。出现这“井喷”的原因有:

——这次矿难的死亡人数高达214人,为建国以来我国矿难死亡人数之最;

——这次矿难发生在2005年(鸡年)大年初六;

——这次矿难发生在2005年02月14日,距上一次的陕西铜川陈家山矿难不到3个月。

这里还要补充一点资料,以反映孙家湾矿难事件网上舆情“峰值”的绝对“高度”。笔者对发生在孙家湾矿难前后的另外两个网上热门事件的WEB页面数也进行了统计,一是杨翁婚恋事件,二是董建华辞职事件。2004年12月24日杨振宁翁帆登记结婚,10天后(2004年1月4日)关于这一事件的6类搜索中的WEB页面平均数是39134,董建华辞职2005年3月10日宣布辞职,10天后(3月20日)关于这一事件的6类搜索中WEB页面平均数是89950,孙家湾矿难发生在2005年02月14日,10天后(2005年02月24日)其在6类搜索中WEB页面平均数是134973,超过杨翁婚恋WEB页面的245%,超过董建华辞职WEB页面的50%,这很能说明孙家湾矿难在网上受关注的程度。应该说,杨翁婚恋事件与董建华辞职事件都是国内的重要新闻,也可列入网上最为“吸引眼球”的新闻之列,但这两个事件的网络舆情“峰值”,仍远远低于孙家湾矿难的“峰值”。孙家湾矿难的“峰值”,突显了在网民新闻价值取向中,对生命的尊重和对公民权益的保护呈现出——或至少一度呈现出压倒优势。

此外,还有两个“异动”的“峰值”值得关注,即死亡72人的山西朔州矿难,其“峰值”高于死亡123人的广东兴宁矿难及其他几起矿难;死亡81人的南丹特大透水事故,其“峰值”又高于死亡124人的黑龙江鸡西矿难。形成这些“峰值”异动的效应有:

时间效应:山西朔州矿难发生在2005年3月19日,距2月14日辽宁孙家湾矿难只有一个月多5天,而孙家湾矿难又造成“井喷”现象,可以看作是“井喷”效应的延续。

政治效应:2001年7月17日发生的广西南丹特大透水事故,曾经因为当地政府蓄意隐瞒而轰动全国。南丹特大透水事故的事故追查曾经一度扑朔迷离,困难重重,网上关于这次事故的报道也是旷日持久,直到2002年06月05日才算告一段落。这一天,广西南宁市中级人民法院判处原南丹县委书记万瑞忠死刑;原南丹县长唐毓盛有期徒刑20年。

(3)网上矿难报道的“舆情峰值”主要集中在大陆网络用户层面(中文简体),占81.3%;在海外华人圈的“峰值”(中文繁体)为17.5%;在西方社会(英文)仅为1.2%。这说明大陆矿难事件在海外仍缺少足够的影响,尚未获得其应有的新闻价值(图三)。

附图

图三 网上矿难报道中文简体、繁体与英文WEB页面数百分比

这里补充一个数据,2004年12月16日发生在美国堪萨斯州的蒙哥马利剖腹夺婴案这条新闻的相关消息,在Google英文与Yahoo英文中,通过与以上相同搜索条件的设置,条其搜索结果分别是248,000和566,000,远远高于中国矿难事件的搜索项值。

这一方面说明中国人的事情通常也主要是中国人关注,另一方面也说明:中国的矿难事件,并未引起西方社会的普遍关注与足够重视。

(4)网上矿难报道在西方社会的舆情“峰值”虽然总量较低,但从2004年11月到2005年2月这一段时期内,出现了一个相对的高峰“区间”(图四),使西方社会对中国矿难问题的关注形成历史性的“高点”。

附图

图四 网上矿难报道英文WEB页面数随时变化态外

这是因为在三个月内接连发生了三起矿难,其中后两起(即陕西铜川矿难与辽宁孙家湾矿难)又是近年来最引人注目的两大矿难(前者因温总理慰问成为媒体焦点,后者因死亡人数最多且在大年初六发生令人震惊),引起西方社会前所未有的关注便在情理之中。可以说,2004年是西方社会对大陆中国的“矿难关注年”。甚至可以进一步说,2004年下半年,是中国矿难问题引起国际社会关注的一个起点。

本研究的局限性在于:

1.对于提供一个科学分析所依赖的准确的数据来说,目前“智能化技术”还不够成熟或正在发展中的搜索引擎是难以完全胜任的。

2.现在还不完全清楚,对于一个相对完结的新闻事件,在过了相当长一段时期之后,其搜索结果(WEB页面)数值衰减的规律。因此,本研究对前4次矿难不能在它们发生后一个月内及时执行搜索,其搜索结果的客观性肯定不如后4次矿难的搜索结果来得准确,这对总体分析的客观性会带来一定的的影响。因此以上的统计与分析,还不能算作比较理想的定量研究。

标签:;  ;  ;  

新闻搜索中舆论的“高峰”--对近年来我国重大矿山灾害报道网页数量的分析_矿难论文
下载Doc文档

猜你喜欢