当代青年雾霾情感的可视化分析——以微博用户为例,本文主要内容关键词为:为例论文,当代论文,青年论文,情感论文,用户论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、问题的提出 情感已成为多学科议题(Clay-Warner & Robinson,2008;Waldron,2011)。当今社会信息技术日新月异,利用情感信息预测重大事件发生、通过处理网络情感信息预测情感趋势等一系列揭示情绪氛围与社会系统涨落之间关系的研究已成为情感社会学的研究热点(成伯清,2013)。近年来,与民生休戚相关的环境污染问题再次成为人们关注的焦点;其中持续高发、频发、连片且危害程度不断加重的雾霾更成为大众最为关注的环境问题之一。它俨然已成为影响社会安定、民生发展的负性环境风险事件(马跃修,2014;邓滢、汪明,2014)。关注情感是研究负性风险事件的重要视角,人们对雾霾的情感存在多元化的倾向,既包括因其造成健康、财产等危害而恐惧、悲伤,对阴沉雾霾天气的厌恶等负性情感;也有渴望、期盼雾霾消除等正性情感。尤其是与其相关的热点事件同时发生时,情感爆发的烈度和规模程度更为明显(Thelwall et al.,2011 )。 但是,大众雾霾情感类型究竟应该如何划分,其强度如何,受哪些因素影响等至今还没有被涉及。纵观国内已有有关雾霾的研究,我们发现,其研究主要还是集中在雾霾形成机理、预防治理及相关宏观微观政策指导等方面(魏成光,2014)。但对于雾霾情感的研究却不多见。有研究表明,在事件期间,与其相关的热点事件同时发生时,情感爆发的烈度和规模程度会更为明显(Mike et al.,2011)。2015年2月底,柴静雾霾调查纪录片《穹顶之下》播出仅一天,网络点击近亿,立即在网络上引发“刷屏”效应,成为特定时段有关雾霾的热点事件。虽该调查的真实性有待商榷,但毋庸置疑,它影响了人们雾霾情感的倾向性。此热点事件后,大众雾霾情感倾向重新定位,发生着微妙变化。本研究也选取此热点事件作为雾霾事件影响因素之一,旨在探究热点事件前、中、后雾霾情感变化的趋势,并通过其影响机制,对雾霾情绪管理和疏导提出针对性建议。 基于雾霾情感研究的目的,本研究选取网络新媒体——微博作为情感研究的信息来源。随着Web2.0互联网技术的发展,微博已成为网民发表个人观点、进行情绪宣泄、浏览热点事件的重要渠道,因而海量微博评论信息就为事件的情感挖掘提供数据来源。根据2015年中国互联网络信息中心发布的《第35次中国互联网络发展状况统计报告》显示,全国网民中10-39岁人群占78.10%。①因此,在此背景下,微博青年作为雾霾事件情感分析的研究对象,更具代表性、针对性与时代特色。 微博情感研究方法主要以情感分析为主。情感分析(sentiment analysis)也称观点挖掘(opinionmining),是指分析说话者在传递信息时所隐含的有价值的情绪状态,对说话者的意见、态度进行判断与评估(Pang & Lee,2008)。情感分析在微博上的应用涉及企业营销、突发事件信息预测与网络舆情监控等方面(周胜臣等,2013),研究领域也扩展到心理学、社会学、计算机科学等多学科(文坤梅等,2012)。微博中文情感分析虽起步较晚,但在国内已较为成熟,受到越来越多的关注(蒋盛益等,2012),其中对特定主题情感分析的研究是未来情感分析的重要方向之一(周胜臣等,2013),而雾霾主题情感分析恰契合此方向。 二、研究意义 针对当代青年雾霾态度的情感研究具有现实的必要性,同时也具有诸多应用价值。 (一)为雾霾情绪监控和预警提供情感类型的支持 严重大气污染与不利的自然天气条件的“恶性循环”导致雾霾天气持续出现,漫天雾霾刺激各种感官(如视觉、嗅觉和听觉等),极易引起不同水平的情绪唤醒(申彦丽,2013),尤其是负性情绪体验。而负性情绪往往又会产生不良社会影响,如恐慌、厌恶会影响人际判断(柳恒超等,2010)等。再者,负性事件容易激发群体情绪,通过网络渠道扩散,极易引发网络社会情绪危机(刘志明、刘鲁,2013)。因此,了解当前当代青年雾霾情感倾向及其趋势变化,对于疏导负性情绪、监控和实时预警群体情绪都具有较好促进作用。 (二)利用雾霾情感状态激发环境保护行为 就雾霾而言,人人是受害者同时也是制造者;因此雾霾防控需要大家共同努力。在环境心理学领域,有研究证明情绪作为中介变量能够激发人们环保觉醒意识和环保行为(Onwezen et al.,2013;Passafro et al.,2014;Mazzocchi & Montini,2001)。罗杰斯(Rogers,1975)曾提出“保护激活理论”(protection motivation theory),指出在一系列与风险、威胁有关的事件后,人们普遍会激发保护决策行为(Rogers,1975)。哈思(Harth)及其同事通过实证研究得出,内疚、愤怒和自豪情感会产生不同的环保行为意愿(Harth & Kessler,2013)。因而,通过分析雾霾事件的情感类型,合理利用不同情绪的激发作用,可以鼓励和促进民众自发参与抗霾,激发保护环境的行为。 (三)利用情感状态建立良好风险认知水平,增强环境危机应对能力 近年来,许多学者探究情感在风险领域中的作用。斯洛维克(Slovic)等人的情感启发式模型指出,情绪影响风险决策,个体往往依据直觉或者经验而非理性分析做出风险判断,正性情绪时趋近,负性情绪时回避(Slovic et al.,2007)。例如,恐惧负性情绪会增大人们对消极生活事件后果的预期(Lerner et al.,2003);正性情绪促使人们考虑问题更加积极、周全,增加个体生理、心理、社会等支持资源(Fredrickson,2001);而此过程往往自动化,对事物的情绪反应要快于对其认知评价反映(Zajonc,1980)。因此情绪状态代表着适应动力,会表现不同应对环境危机策略,对个体适应环境有重要作用(汤冬玲等,2010)。 基于情绪在风险认知、判断与决策中的作用,我们可以利用正负性情绪不同的社会心理功能,有针对性地进行情绪疏导和舆论引导,提升自身的情绪管理能力,正确对待环境风险事件,降低其不良影响,维护社会安定。 三、研究方法 (一)研究材料样本抽取 本研究根据“中国观点分析测评”(Chinese Opinion Analysis Evaluation,COAE)(赵军等,2008)设置的6个任务3个方面的语料评价规则,由一名副教授和7名研究生组成语料抽取判别团队分别在词语级、语句级与篇章级三方面达成对“雾霾”相关情感词的确定。采用主题抽取方法(周胜臣等,2013),利用微博信息发布栏中“#”的定位作用,按照统一标准选取主题词微博(如“#雾霾#”)。在抽取过程中,我们还对噪音微博进行剔除,包括滤除官方微博所发布的客观微博、过滤无用广告微博、舍弃长微博及其评论等。在微博短文本的处理中,我们保留了表情和网络用语。文本利用ROST-CM6(Content Mining System Version 6.0)②内容挖掘系统软件抓取频率词、过滤无意义词,从频率词中挑选含有雾霾态度的情感类词。 研究选自用户量最大、使用最广泛的新浪微博作为信息来源,以44岁以下的微博青年用户为研究对象。每天上午、下午、晚上三个时段分别进行取样:在“空气质量状况”因素分析中选取2015年1月份(1月2日-31日)微博短文本,搜索“北京”、“雾霾”关键词,每天抽取90条,总计2700条;在“热点事件”因素分析中,选取2015年2月21日-27日(热点事件前1周)、2月28日-3月6日(热点事件周)、3月7日-3月13日(热点事件后1周)的微博短文本,每天抽取90条,总计1890条。 (二)情感分析 文本中情感表达十分复杂,且难以量化。近年来,诸多情感分析研究基于情感词典或者其它工具实现了情感分析量化,本研究选取中文情感词汇本体库文档③(徐琳宏等,2008)作为中文情感评价词典资源,对于词语中含有常识、隐喻等情感信息部分参照了《情感常识库》(陈建美、林鸿飞,2009)。此外,研究文本来自网络平台,涉及网络用语和表情符号等网络渠道中特有的情感信息成分。本研究也参照了《表情符号情感词典》、《网络用语情感词典》(杨佳能等,2014),最终选取的情感词库文档适用于本文的微博情感分析。 (三)数据分析处理 根据抽取到的文本词类,对应情感词典中词类的等级强度,正性情绪记为正值,负性情绪记为负值,进行加减运算,重复词频的词类重复加减,计算总分。表情情感词类和网络用语词类先经过《表情符号情感词典》、《网络用语情感词典》(杨佳能等,2014)转换后再进行情感计算。对于情感本体词库文本中少量不识别的词类予以删除,不计入情感强度得分(允许存在少量误差)。 (四)可视化分析 可视化分析是把数据、信息和知识转化为可视的表示形式并获得对数据更深层次认识的过程,它能够使复杂信息快速且容易被人理解(洪文学、王金甲,2010)。雾霾情感类型多元,在不同影响因素的作用下,各情感之间的关系复杂。因此,为更好地反应研究结果之间深层次复杂的结构关系,达到更好展现雾霾情感强度及其变化趋势目的,我们使用了可视化方式来展现情感分析的结果。在本研究中,我们试图用“雷达图”、“折线图”和“柱形图”这些可视化形式来展示情感分析的结果,这使得抽象的文本信息可以变成实际可观测的量化数据信息,从而更加清晰地展现数据之间的复杂趋势变化。 四、研究结果 下面我们从雾霾情感类型的划分、雾霾情感的强度、热点事件背景下雾霾情感强度变化的角度来分别进行分析。 (一)雾霾情感类型的划分 根据中文情感本体词库的情感等级(徐琳宏等,2008)与抽取的情感词含义,我们对雾霾情感进行了三级划分。划分类型及主题词意义阐释见表1。 (二)雾霾情感强度随日间空气质量状况的变化 根据《环境空气质量指数(AQI)技术规定(试行)》的规定,AQI可划分为六个等级。其中,0-50为一级优、51-100为二级良、101-150为三级轻度污染、150-200为四级中度污染、201-300为五级重度污染、300以上为六级严度污染。图1为北京市1月份每日空气质量指数。 图1 北京市1月份空气质量指数趋势图④ 本研究为分析七类雾霾情感强度随空气质量状况的变化,将各类雾霾情感在每日的强度值以折线图形式呈现,从而形成北京市1月份每日的微博用户雾霾情感状态(见图2)。 图2 1月份北京市微博用户雾霾二级情感状态趋势图 图2结果显示,雾霾情感强度随空气质量状况而变化。在优、良等级下(1月2日、6-8日、21日、27-31日),空气质量状况最好,雾霾的各项负性情感值都较低;尤其是在27-31日,可观察到明显的正性情绪值增大和负性情绪值降低,且正性情绪中,“乐”类情感较“好”类情感(期望)强度要高;此外,也可以观测到空气质量状况处在持续稳定状态时,“好”类情感的延续。在重度污染和严度污染等级下(1月5日、13-16日、23日),北京市空气质量状况最差,各项雾霾负性情感值随着空气质量状况变差而增强,并在空气质量状况最差的15日前后达到负性情绪的最大极值,在22日前后达到第二个负性情绪极值。 正性情感中,“乐”类情感强度值几乎达到最低,“好”类情感强度提升明显,分别在重度污染持续的后期(18日前后和24日前后)出现极值。在轻度和中度污染等级(1月4日、6日、8日、10日、12日、16-20日、22日、25-26日)下,空气质量状况处于中等程度,各类情感强度值也处于中间值。总体分析发现,“惧”、“哀”和“恶”三类负性情绪是主要的情绪,各级情绪随空气质量状况而变化不同。 (三)热点事件背景下雾霾情感强度的变化 1.热点事件“前、中、后”雾霾二级情感强度变化 为呈现热点事件前、中、后七类雾霾情感强度的变化情况,本研究生成如下雷达图(见图3)。 图3 热点事件“前、中、后”微博用户对雾霾情感分类及其情感强度(数值代表强度值) 从图3可以看出,在热点事件前,雾霾负性情感“惧”、“哀”、“恶”的强度值最大,与北京市1月份雾霾情感表现相似,“怒”、“惊”比重相对较少。正性情感中,“乐”的强度值高于“好”;在热点事件周,负性情绪中“惧”、“哀”、“惊”的强度值最大,正性情绪中“好”的情感强度明显提升,“乐”的情感强度更低,各类情感强度都在此背景下达到最大或最小极值;在热点事件后,各类情感强度值都相应下降,“惧”、“恶”、“惊”、“怒”强度值比热点事件前都有相应程度的降低,“哀”情感强度值较之前增大,正性情绪中,相较于热点事件前,“乐”强度值有所下降,“好”强度值有所提升。 2.热点事件“前、中、后”三级情感强度变化 为清晰呈现热点事件“前、中、后”三级情感强度对比变化,本研究生成柱状图(见图4)。 图4 热点事件“前、中、后”三级情感比较 (1)“恶”三级情感 热点事件周,除烦闷外,其它三类情感强度值都为最大。热点事件后,相较热点事件前憎恶、烦闷、贬责强度值都有减少,但怀疑强度值增大。 (2)“乐”三级情感 热点事件周三类情感强度都达到最低值,热点事件前后快乐和安心强度值都有所下降,而相信情感强度值则增大。 (3)“哀”三级情感 热点事件周各类三级情感强度值都达到极值。热点事件后悲伤和失望值较热点事件前下降,但疚情感值在热点事件后有明显提升。 (4)“惧”三级情感 热点事件周两类情感值都最大。热点事件后惧怕和慌张情感强度值都比热点事件前降低。 3.热点事件情感趋势对雾霾各类情感强度影响 (1)热点事件情感变化趋势 在分析热点事件情感趋势对雾霾情感影响之前,我们需要首先分析热点事件本身的情感走势。为此,本研究抽取了“柴静雾霾调查”主题关键词,选取包括雾霾、柴静等所有事件相关话题的情感词类和表情,进行情感分析。 图5热点事件的情感趋势概括为:积极情绪高涨期—消极情绪高涨期—积极情绪回暖期—平息后不应期。积极情绪高涨是因为纪录片引起大部分民众共鸣,在与民生休戚相关的环保问题上,大部分网民赞赏柴静的行为、称赞其有担当;消极情绪的高涨来自学者、意见领袖、“砍柴派网友”等诸多关于纪录片及柴静本人的质疑之声;积极情绪的回暖来自反质疑之声,“挺柴派”对质疑点再反驳,使事件情感转向积极;平息后的不应期,是事件热潮过后的平静期,即民众对事件的热情度减退,越来越少参与事件讨论。 图5 热点事件情感强度趋势 (2)热点事件周雾霾情感强度趋势图 为分析热点事件本身情感趋势对雾霾情感强度的影响,本研究生成图6热点事件一周内雾霾情感强度变化图。 图6显示,负性情绪基本遵循:积极情绪高涨期情感强度值上升;消极情绪高涨期,情感强度值有所下降;积极情绪回暖期,负性情感强度再次升高。而两类正性情感中,“乐”情感强度基本平缓,强度值较低,“好”类情感值前期较大,后期平缓。在事件不应期内,“惧”、“哀”、“惊”负性情绪强度值有明显回落,“恶”、“怒”强度值也开始趋于平缓。 图6 热点事件周雾霾二级情感强度变化趋势图 五、结论 (一)空气质量状况影响雾霾情感强度 本研究选取北京1月份青年微博用户的情感状态,探究了空气质量状况对雾霾情感倾向的影响。研究发现,雾霾情感态度随空气质量状况变化而变化。空气质量状况变差,雾霾的负性情绪随之增加;同时,天气持续转好时,用户会因天气晴朗而喜悦、愉快,表现出安心、踏实,也表现出更强的战胜雾霾的信心。 (二)热点事件对雾霾情感强度的影响 1.热点事件“前、中、后”雾霾情感强度的变化 雾霾相关热点事件对雾霾情感波动也有重要影响,此种影响产生的情绪在情绪机制下往往再生成舆论,不可等闲视之(夏雨禾,2011)。负性情绪中,“惧”、“哀”在热点事件“前、中、后”三种情况下强度值最大,表明不论何种状态下,青年用户对于雾霾的情感态度主要以“惧”、“哀”类情感为主。正性情绪中,“乐”的三级情感分析发现,在热点事件前,快乐为主要的情感成分,安心和相信强度值较小;“好”类情感在热点事件周时强度值明显大于其前和后,表明在雾霾负面信息席卷背景下,青年用户强烈渴望、期盼雾霾天气转好。 2.热点事件情感趋势对雾霾情感强度的影响 为看出热点事件情感趋势对于雾霾情感的影响,本研究也分析了在热点事件不同时段态势下,当代青年各类雾霾情感的变化。结果显示“柴静雾霾调查”情感趋势分四个阶段:积极情绪高涨期—消极情绪高涨期—积极情绪回暖期—平息后不应期,这与社会舆情分析结果“赞赏—纠错—扒皮—理性”类似。⑤ 六、启示 (一)情绪疏导启示 雾霾负性情绪的疏导具有重要的现实意义。在风险认知研究中,人们感知到风险越可控,就会产生越低的风险认知,从而减缓心理的恐慌和焦虑(Slovic,1987)。因此,提升空气质量状况的可控性,可以有效排解因雾霾产生的负性情绪。 情感适应的AREA模型认为,个体对消极事件解释越充分,思虑就会越少,情感适应就会越好,相应的情感反应就会减弱(范富霞,2013)。因此,对于情绪热点事件的合理阐释、科学解读和宣传显得尤为重要。正确解读热点事件涉及良好风险沟通问题,获得信息、解析信息与正确理解信息是建立良好沟通的基础。 尤其在网络时代,海量信息每天以爆炸式形式聚集而来,热点事件后,关于事件各种正面、负面消息报道接踵而至,各种小道消息更是趁机混淆视听,纷杂信息混淆了民众的判断力,因而也会加剧人们的不安全感,增强负性情绪。这就要求媒体传播信息公开透明,澄清事实,及时采取良好的沟通方式,传达正确可信信息,尽量降低民众风险与专家风险的差异,进而有效避免信息失真引发的群体情绪激化,引发社会放大效应(Kasperson et al.,1988)。同时,人们在获得消息时也应理智分析,勿轻信或者盲目跟从。 (二)合理情绪利用启示 心理学领域,研究得出正性情绪使人有更广阔的问题空间,从而有效促进人们对未来的导向思考(Aspinwall,1998),也使个体在应对逆境时采取计划,积累资源(Aspinwall & Taylor,1997)。利用雾霾事件中天气好转时的愉快、渴望雾霾好转时的期盼、抗霾信心等正性情绪建立未来应对雾霾的知识储备,提升人们应对环境危机能力;同时利用正性情绪在应对风险时的趋近性(Slovic et al.,2007),建立良好的风险认知。再者,充分发挥情绪在环保行为中的激发作用,积极利用自豪感激发人们自发参与抗霾活动;利用内疚感激发人们参与修复雾霾天气行为;利用愤怒情绪增大人们对破坏环境者的惩罚力度,增强社会监督,服务于环保事业。 本研究通过情感分析探究微博青年用户雾霾情感分类及影响因素,将雾霾情感分为三级,随空气质量状况变化,受热点事件影响;研究分析了雾霾情感研究必要性,探讨了其在事件情绪疏导、监控与预警中作用,以及情绪机制下环境风险事件应对中作用,并根据其影响因素,有针对性地提出雾霾情感管理与疏导建议。 同时,本研究也有许多局限,以期后续研究的改进。第一,本研究以情感本体词库及其它参考词库为基础划分雾霾情感强度,但由于目前微博短文本处理技术的限制,雾霾情感词类的分类精度受到一定程度影响,如何进行更进一步的细分需要进一步研究;情感词类之间相互影响也有待研究和分析;同时,不同主题,情感词类、语言规则、词库判断标准都不尽相同,有必要建立专门的雾霾情感词库。第二,本研究只是对部分影响雾霾情感的因素进行分析,以后的研究可以针对此,找到诸多影响雾霾情感的因素,完善雾霾情感类型。第三,以雾霾事件为情感研究方向的领域,需加强多学科和大跨度交互研究,更多从交叉学科的视角进行探讨。 注释: ①http://news.mydrivers.com/1/381/381898.htm。 ②武汉大学ROST-CM6内容挖掘系统:http://hi.baidu com/ietynxalzidjoye/item/77fa3d392e5f8b6f7c034baee/。该软件是由武汉大学研发的应用软件,能对网页、微博、聊天记录等文本信息进行抓取,并能对文本信息进行词频、特征词、语义关系网络、可视化等分析。 ③中文情感词汇本体库文档是大连理工大学信息检索研究室林鸿飞教授及其团队成员整理和标注的中文文体资源。情感本体库的基本知识来源于现有词典,包括《新世纪汉语新词词典》、《中华成语词典》、《汉语熟语词典》、《现代汉语分类词典》、《汉语褒贬义词语用法词典》。本体情感词库文档包含词性种类、情感类别、情感强度及极性等信息。将情感强度分为1、3、5、7、9,其中1为最小强度,9为最大强度。为研究方便,本研究将中性词汇定为0强度,积极词汇定为正强度,消极词汇定为负强度。 ④转引自天气后报网(http://www.tianqihoubao.com/aqi/beijing-201501.html)。1月份北京空气质量状况的基本分布:优:4天;良:9天;轻度污染:6天;中度污染:6天;重度污染:2天;严度污染:2天。AQI最低值为27;最高值为372。 ⑤大众网舆情(http://yuqing.dzwww.com/yqjd/201503/t20150318_12058239.htm)。当代青年朦胧情绪的视觉分析&以微博用户为例_雾霾治理论文
当代青年朦胧情绪的视觉分析&以微博用户为例_雾霾治理论文
下载Doc文档