基于大数据的旅游目的地情感评价方法探究
杨崇美(山东外事职业大学)
摘要: 基于情绪归类定向,通过分析概括三个旅游文本情感分析的滤过参数:旅游方面的专属大词库、语意逻辑规则和情感指数分析,构建网络大数据的旅游目的地情感评价体系。基于此模型,获取了130631条游客评论,对8个旅游目的地作出切身评价体验,并以联合国世界旅游组织旅游可持续发展监测数据作为标准数据进行校验。研究表明三个过滤参数兼具部分程度的科学性,可以较为精确地捕捉到旅游者们对目的地评价的总体情感意愿;此次结论很大程度上证实了旅游大数据的可用性,为理论推进、实践践行提供出相关的科学依据。
关键词: 大数据;旅游重点区域;情感评价分类;情绪意愿
一、引言
目前旅客们更趋向于使用移动网络来预定自己旅游所需要的用品、并在体验产品之后抒发自己的真实感受、发表不同的观点来进行评价交流活动。这些大规模的碎片化语言也因此逐渐的成为了研究方面的“大数据”。关于这方面的数据的旅游研究总共三个主题。第一方面是对网络上面的评价进行直接的数据分析,由此便可以将重点旅游区域或旅客的感知特性与用户体验的互相关联了解清楚。第二方面是利用语言学中有关文本的特殊分析方法和计算机技能结合为一体,而后进行大数据研究分析,如用自然语言处理工具,按照词频统计、有关词语的汇聚,提出网站内容中包含的问题。第三方面是通过聚集制定专属数据,构建出数学模型,由此来分析游客的出行和消费特征与爱好。从事与旅游业相关的人员即可通过挖掘这一方面的数据,来掌握旅客满意度和预估市场的主要需求,进而跟进服务提升和营销策略改造。但是,目前的研究基础在市场管理、市场营销等方面的研究领域,重点在于优化旅游企业,而还未实现从企业层面上升到空间层面,因此将此次研究数据作为旅游目的地方面的整体评价。本文将从这里启程,探索如何将旅游大数据应用于开启创新的方法,由此来构建旅游目的地的整体评价模型。那么对旅游研究的情感分析分类的初步拟定,需要收集大量的旅客在社交媒体与旅游网站上发表的相关旅游评论,尽可能的来剖析旅客的情感基本征象,因此获得更先进的关于旅游目的地测评的方法。在此基础上,利用第三方有关的数据,对其使用的模型进行初步验证,以此强化该模型的说服力与可信度。
二、有关大数据情感的详细解析
之前的旅游调查惯用访谈还有调查问卷等形式进行研究,尽管获得的信息精确,但是信息的丰富程度以及数量均非常有限。并且,因为涉及到所受访者的个人详细信息,所以调查的过程中存在着私密性不足的问题,这一点的存在非常重要。因此可信度也会受到影响,反而显得很局限。而与之相比,旅客在体验旅游的过程中发表的切身体验的评论,恰恰很新鲜、真实,所以逐渐成了测评旅客们满意度和旅游服务质量的最佳新鲜素材。尤其是旅客在旅游结束时由内心发出的对景区以及服务质量的简短网络评论,不仅短小精炼、数量多、准确度高,而且许多人在进行网络评论的同时附带了评分。这些个颇具特色的大数据,渐渐地成了咨询和旅游服务研究领域重点关注的可观的信息源。但是并不能以此判来断线上网站的旅游评分是真实地反映游客心理的最佳评判依据。如何从大量的旅客评论中发现旅客情绪特征的信息,是当下有关于旅游大数据评价研究的新挑战。欲做到这些,还需从心理学的情感理论研究开始,利用语言学中在线文本分析方面的技术,共同来构建属于旅客情感评价的分析模型。现在主要对游客情感研究、线文本分析和情绪理论研究这三者进行论述,进而探索研究制定的切入点。
(一)情感分析的理论基础
经多次情绪体验的叠加后,人会对某一事物形成较为理性的、有组织的、较为稳定的体验态度,称为情感。情绪是人对外界事物感知过程中产生的即时的、感性的心理反应。经文字语言发表的旅游评论,是介于情绪、情感中的心理态度的表达,更接近情感,但因体验时间较短,并不能完全替代情感。研究的目的是利用海量网络数据来探求旅游目的地的测评方法,因此分析逻辑与研究LIWC大体上是一致的,均是提前拟定出更加需要分析的情绪分类,而后在进行词汇捕获。
(二)游客的情感研究
基于当面的大数据库应用于旅客情感研究领域,这些研究并不成熟,必须基于现存的数据挖掘技术以及旅游学科、文本分析的特征进行特定的改进。目前缺乏足够的理论基础,来开展对演变机制和旅客情绪产生变化的研究。在此基础上,三个关键问题需要解决。第一,现有大数据的游客情感分析研究缺乏证实,大多数都会利用机器学习技术,以网络的评分作为评价的参照标准。但是网上评分极有可能因为大众“社交积极倾向”的影响,而出现过度乐观的评价。同时,若这些网络评论与评分均来自于一个旅客,必定存在着某种程度上的循环论证。并且,有关机器的学习法非常局限,其建模方式全依赖计算机自动编译算法来构建分型,但这样的结果只能用来进行整体判断,其内在逻辑是伸手不见五指的黑洞。第二,深受人们钟爱的情感词库是较为完整的词库,对应用于旅游的专属词库还未完善,不能精确捕捉在“非惯常环境下”行为的情感特征征象,其游客情感和其他的情感分型方法效果是相似的,并不能突出体现旅游活动的特异性。在普通词库中,“刺激”一词常与“惊讶”相关联,但在旅游相关的活动中,“刺激”则是“兴奋”的表达。第三,基于现在对文本情感以及情绪分类方面的研究极多,但是,研究并未加入语义逻辑和情感强度的分析,实际上未考虑关于语言表述中副词、连词等系列的虚词对于情感表达方面的影响,因此就容易导致错误判断,对情感强度控制不够精准。
三、研究方法
(一)数据来源
在数据来源方面,选择目前国内旅游评论较为丰富的旅游电子商务门户网站。通过研究组织对数据的选择性,选取了三个评论最丰富、知名度较高的旅游网站:携程网和百度旅游网、去哪儿网。如果对比着来看,纵使阿里旅游拥有海量的腾讯用户,单单就以其入市场时间短、用户评论不够活跃、而穷游等知名旅游网站又长游记为主,在用户整体评价和开展情感分析上加大了难度,也不能入选。
因为大众在社交网络上的评论大多都具有选择性,社会比较容易认同积极的情绪,积极的人,致使人们有选择性的在社交网络上只显示积极向上的一面。因此,直接计算正负面词语的数量,去判断整体评价的情感特点缺乏科学性,将会增加正面评论,影响结果,因此要对正负面词汇的比例进行系数矫正。本研究所获得的初步词频统计的结果也证实了此观点。这8个旅游监测点的评价统计,正面词语总量为负面词语总量的7.19倍。假设直接把词汇总数当做评价的标准,结果会夸大正面情绪感。本文从实验的角度来判定误差的频度,拟定三个情感系数,分3倍、4倍、5倍,即当评论中的正面评价比负面评价的3倍、4倍、5倍多时,才可以将此条评论作为正面评论。
(二)情感乘数拟定
“汪队长说得好!一个人生理上的青春难得永存,而精神上的青春,却永不褪色。现在,我倒是离不开这身军装了!”李晓英完全沉浸在自己的思维中。
俗话说:“书中自有黄金屋,书中自有颜如玉。”最令我开心的既不是去旅游,也不是品尝美食,而是在图书馆中遨游。
(三)模型规则
根据游客在那些旅游刚刚结束后,在网站上进行评论,还有对旅游目的地的打分,操作者即进行的直接来判断。不同网站的评分模式与方法基本上一致,分值界定为1~5。其中1为最低分,表明游客极为不满意;5为最高分,表明游客十分满意。此次研究将中间值3分作为分界线,获得4分或5分的评论被判定为正面评论,获得3分的为中性评论,获得1分或2分的为负面评论。这个数据可以直接对网站上面的结果进行分析,以此来建立分析模型。
强化相关人员责任意识、科学统筹教学训练、做好场地器材保障、抓好医疗保障服务等方面都只能从外部降低训练伤发生的风险,而最主要的还在于参训者本人。参训者除了具备一定的训练安全知识外,还要增强个人身体素质,有关研究表明,身体素质全面、过硬的人,发生训练损伤的比例相对较低。宁愿在训练场上流血,也不愿在战场上灭亡。从某种程度来讲,越贴近实战、贴近战场的军事训练,就越容易发生训练伤,参训人员还应保持一颗强大的内心,训练场上越是畏首畏尾、紧张、焦虑的人越容易受伤。
四、结论
本研究最大的价值是为旅游目的地评价研究选定了新的道路,并且旅游大数据的可用性也得到了很好的证实,为理论推进、实践践行提供了相关方面的科学依据。本研究不仅为后面的研究奠定了基础,并且修正了此情感分析模型,而且在情感逻辑和语义方面也进行了探索,此模型比传统方法更加准确地。能够更好地掌握游客对旅游目的地的整体评价,成为了旅游分析大数据研究的大突破。
参考文献
[1]刘逸,保继刚,朱毅玲.基于大数据的旅游目的地情感评价方法探究[J].地理研究,2017(6):30.
[2]湛东升,张文忠,余建辉,党云晓,李小云.问卷调查方法在中国人文地理学研究的应用[J].地理学报,2016(6):899-913.
[3]刘瑜.社会感知视角下的若干人文地理学基本问题再思考 [J].地理学报 ,2016(4):38-49.
[4]黄昊,贾铁飞.古运河旅游开发及其空间模式研究——以京杭大运河长江三角洲区段为例[J].地域研究与开发 ,2013(2):129-133.
[5]李永乐,杜文娟.申遗视野下运河非物质文化遗产价值及其旅游开发——以大运河江苏段为例[J].中国名城 ,2011(10):42-45.
[6]张高军,李君轶,张柳.华山风景区旅游形象感知研究——基于游客网络日志的文本分析[J].旅游科学,2011(4):87-94.
标签:大数据论文; 旅游重点区域论文; 情感评价分类论文; 情绪意愿论文; 山东外事职业大学论文;