基于互联网内容分析法的中国风景名胜区网络图像索引研究_旅游景区质量等级的划分与评定论文

中国景区网络形象指数研究——基于互联网内容分析方法,本文主要内容关键词为:互联网论文,景区论文,中国论文,形象论文,指数论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      旅游业是国民经济的战略性产业,具有先导性和关联性的特征。旅游业的蓬勃发展加剧了旅游目的地之间的竞争。越来越多的研究者发现,目的地形象问题是吸引旅客最关键的因素之一[1]。互联网及移动客户端时代,网络信息对于旅游目的地形象的形成过程起重要作用[2],尤其是在旅游者掌握有限信息的情况下[3]。互联网正逐渐成为人们获取旅游目的地形象、进行旅游目的地选择的重要工具。

      近年来,国内外学者基于网络的旅游目的地研究明显增多,并已形成3个主要研究方向。第一,研究某旅游目的地的整体网络形象及其网络形象的突出特征。Soojin等分别分析了澳门旅游局官方网站、旅行社网站、在线旅游杂志、旅游博客等网站中的澳门旅游形象,发现澳门旅游形象在不同网络信息源中的表现不同[4];肖亮等通过对两岸综合旅游网站、旅行社网站及台湾旅游官方网站的内容分析,提炼出互联网传播的台湾旅游目的地形象主题[5];林一辰等通过对旅游局和旅游目的地官方网站的内容分析,认为美食是台湾网络形象的重要代表[6]。第二,对一个或多个网站的文字和图片信息进行内容分析,研究若干旅游目的地形象之间的差异。Karolien等对欧洲10个国家的欧洲旅游委员会(European Travel Commission)网站和相应的访问欧洲(VisitEurope.com)网站进行了比较内容分析[7];唐亮等对澳门旅游局官方网站、旅游中介机构网站、旅游杂志网站进行了全面的内容分析,发现澳门旅游目的地形象在中英文网站之间存在显著差异,文化因素是形成这种差异的最重要原因[8]。第三,互联网内容分析的方法研究。叶强等使用朴素贝叶斯(

Bayes)、支持向量机(SVM)和基于字符的N元语法模型(character based N-gram model)等3种方法分析了美国和欧洲7大著名景点相关旅游博客的情感倾向,并认为后两种方法在准确性方面优于第一种方法[9];张子琼和叶强等分别针对酒店住宿和酒店销售的网络评价进行了情感分析,认为在分析粤语语境下的旅游目的地形象时,基于语义的二元模型(character-based bigrams)方法较为适用[10-11];Svetlana等创新性地使用控制系统设计用交互式软件包(ATPAC)和沃得(WORDER)软件对旅游目的地文本信息进行了分析[12]。

      尽管上述学者使用互联网信息对旅游目的地形象进行了研究,但总体而言,学者们对旅游目的地网络形象的测度主要以定性描述为主,尚未形成较为系统的概念框架及可量化、可操作的指标评价体系,因而不能全面揭示旅游目的地网络形象的知名度与美誉度。其次,现有研究所分析的旅游目的地数量往往较少,尚没有出现对一国某类旅游目的地网络形象的系统研究。此外,现有研究所监测的互联网网站数量与信息量有限,从而不能比较真实全面地反映某个时期互联网上旅游目的地网络形象的客观图景。旅游景区作为一类重要的旅游目的地,对其网络形象的专门研究尚未出现。鉴于此,本文构建了中国景区网络形象指数,尝试使用大数据方法,以截至2013年1月16日的153家国家5A级旅游景区为例,进行景区网络形象定量测度和比较分析,并探索其空间分布规律及类型特征,以期为旅游景区和目的地形象研究提供新的视角,为旅游目的地的网络营销与管理决策提供科学依据。

      1 形象模型与指标体系设计

      旅游目的地形象是指主体(现实和潜在的旅游者)对客体(旅游地)的整体印象。旅游目的地网络形象是指在某个特定时期所有互联网信息对旅游目的地整体形象的综合记录,是旅游目的地形象在互联网中的映射。它一方面反映了这一特定时期所有社会主体对旅游目的地属性特征的认知评价,另一方面也体现了社会主体对旅游目的地的情感倾向。因此,它既是主观的认知与情感判断,又是特定时期旅游目的地在互联网信息圈中的客观存在。Baloglu和McCleary提出了由认知形象、情感形象和整体形象构成的目的地形象“新三维结构”,认为认知形象和情感形象共同决定了目的地的整体形象,并且得到了学者们的广泛认同[13-15]。认知形象是指人们对某一目的地感知属性的个人看法和观点[16],表征旅游目的地的知名度;情感形象表示人们对某地的感情[16],表征旅游目的地的美誉度。

      旅游景区是一类重要的旅游目的地,因此本文借鉴“新三维结构”模型以及《国家5A级景区评定标准》,提出了以5A级景区网络形象为一级指标,以认知形象和情感形象为二级指标,以旅游资源、基础设施、接待服务、综合管理为三级指标的5A级景区网络形象模型与指标体系(图1)。

      

      图1 中国旅游景区网络形象指标体系

      本文指标选择基于以下4项原则:遵循《国家5A级景区评定标准》等有关规范文件;适用于互联网文本分析;指标简洁明了,具有代表性;指标可计算、可维护、可扩展。

      (1)旅游资源指标。旅游资源是旅游景区存在的基础与前提,也是吸引旅游者做出旅游决策的重要驱动力量。将旅游资源指标按照自然资源与人文资源进行划分[17],以期全面涵盖互联网信息所包含的景区旅游资源。

      (2)基础设施指标。基础设施是衡量景区形象的重要维度,游客在游览过程中接触到的相关设施都应当纳入该指标的评定范围内。基础设施指标包括交通设施(游览车、停车场等)、通讯设施(无线上网等)、商业设施(餐厅、商店等)和卫生设施(卫生间等)。

      (3)接待服务指标。接待服务质量贯穿于旅游活动的全过程,与景区形象密切相关。随着我国经济社会的不断发展,群众旅游需求发生了根本性的变化,游客不仅希望企业能提供优质的产品,更希望企业能提供满意的服务[18]。本文将接待服务指标划分为信息引导、服务质量、价格水平3个4级指标。信息引导考察景区游览提示系统的建设,服务质量考察景区服务态度与水平,价格水平考察景区消费是否“物有所值”。考虑到信息抓取的需要,4级指标并没有按照具体旅游产品分类。如价格水平指标仅关注网络信息中出现的有关旅游价格的表述,但并不区分该条表述所针对的客体。

      (4)综合管理指标。有学者将景区产品、服务管理、景区环境等指标作为评定景区管理总水平的重要标准[18],这类研究侧重于使用管理结果来衡量管理过程。景区管理是一项系统工程,如果单纯使用管理结果来衡量景区管理水平,并不利于对管理工作实施过程控制,进而阻碍景区管理水平的提升。本文结合《国家5A级景区评定标准》中对景区管理的相关要求,将机构与制度(管理机构、规章等)、景区营销(形象、品牌等)、景区建设(运营、修缮等)、景区安全(分流等)作为综合管理4级指标,从而全面涵盖景区管理者的各项工作。

      本指标体系以抓取的互联网信息数量表征认知形象,以抓取的互联网好评信息数量表征情感形象。认知形象与情感形象加总得到景区网络形象。

      2 计算方法与步骤

      2.1 网站选取

      旅游局官方网站、景区官方网站和各类综合旅游网站是旅游者从互联网获取信息的重要渠道。本文选择旅游局官网、景区官网和门户网站旅游频道共计205个网站为研究样本。其中,国家旅游局官方网站及全国34个省份的旅游局官方网站(含港澳台),共计35个;153家景区的官方网站,共计156个(苏州园林景区与福建土楼景区分别有3个和2个官方网站);选择大学教授、旅游景区管理者、旅游媒体从业者共10名专家,从权威性、影响性、易读性3个维度对门户网站旅游频道打分,最终选择14个门户网站旅游频道作为研究样本(http://travel.people.com.cn/等)。截至2013年9月1日,在以上205个网站所有可浏览信息中,共采集数据50余万条。采集信息以新闻信息为主,包括部分网页留言、评论,不包括论坛、博客以及微博数据。

      2.2 内容抓取与分析方法

      本研究使用火车采集器根据网站结构特点配置信息抓取规则,从杂乱的非结构化文本数据中提取结构化数据,并将其存入MySQL关系型数据库中以便后期分析。在文本分析环节,将数据导入至Solr服务器中,建立索引文件并进行分词。最后根据中国景区网络形象指标体系,使用Solr软件分别获得抓取信息中相应指标的全部报道量及好评信息报道量,使用Excel软件对频次信息进行统计与分析。

      2.3 指标计算与权重设定

      2.3.1 第四级指标计算方法

      

      式(1)中:

表示某第四级指标认知形象分值,Rnum表示网页重要性加权报道量,Ext表示景区信息展布性,

值设定为1,PR(Page Rank)表示网页级别,Count(Rnum≠0)表示所有网站中对景区报道量不为0的网站数量,Count(website)表示所有网站数量。

      第四级指标认知形象分值取决于网页重要性加权报道量与网络信息展布性两个方面。其中,网页重要性加权报道量由新闻所在网站的重要性衡量。网络信息展布性衡量网络信息的传播范围,信息在不同网站中分布越均匀,信息就越容易被大众阅读,认知形象分值就越高。

      

      式(2)中:

表示网络中对景区全部好评报道的网页重要性加权报道量,

表示网络中对景区全部新闻报道的网页重要性加权报道量。第四级指标情感形象分值是二者得分之比。

      2.3.2 第三级指标计算方法

      

      式(3)中,

表示第三级指标认知形象分值,

表示某第四级指标认知形象分值,e表示第四级指标权重。

      式(4)中,

表示第四级指标,

表示

所属第三级指标。式(4)表示了权重e的计算过程。权重e表示一个景区第四级指标的得分在该景区对应的第三级指标总得分中所占的比重与全部景区该第四级指标得分在全部景区对应的第三级指标总得分中所占比重的比值。权重e的值越大,一个景区特定指标的表现越好。如确定故宫博物院交通设施权重时:

表示故宫博物院交通设施得分,对应的

表示故宫博物院基础设施得分;

表示153个景区交通设施得分总和,

表示153个基础设施得分总和。该方法可以定量获得权重数值,避免人工赋权带来的误差,具有较强的科学性与实用性。第三级指标情感形象分值的计算过程与认知形象分值计算过程相同。

      2.3.3 第二级指标计算方法

      

      式(5)中,

表示认知形象分值,

表示第三级指标认知形象分值,w表示第三级指标权重。本文借鉴《国家5A级景区评价标准》得到第三级指标权重,即分别计算该标准中基础设施、核心资源、接待服务和综合管理的分值,与总分相除可得到每个指标的占比,保留两位小数后确定为该指标的权重。经过计算,基础设施权重为28.03%,核心资源权重为23.06%,接待服务权重为19.89%,综合管理权重为29.03%。第二级指标情感形象分值的计算过程与认知形象分值计算过程相同。

      2.3.4 第一级指标计算方法

      

      式(6)中,I表示旅游景区网络形象总分值,

表示认知形象分值,

表示情感形象分值。旅游景区网络形象总分值是认知形象分值与情感形象分值的平均值。

      3 研究结果与发现

      3.1 总分排名

      表1是2013年全国153家5A级景区网络形象总分值。通过总体分布研究可知,得分在80~90分之间的景区数量为18个,占全部景区数量的11.8%;得分在70~80分之间的景区数量为104个,占比为68.0%;得分在60~70分之间景区数量为31个,占比为20.2%。根据总体分布特征,本文将80~90分设定为优秀等级,70~80分设定为良好等级,60~70分设定为及格等级。

      2013年全国153家5A级景区网络形象指数得分之间存在较大差异。得分属于良好等级的景区占全部景区数量的比重超过了60%,及格等级的景区数量是优秀等级景区数量的两倍。这表明,我国153家5A级旅游景区网络形象较为中庸,缺乏认知及口碑俱佳的“明星景区”;大多数5A级景区安于传统生存及营销模式,缺乏新时代下对互联网形象重要性的认识以及开展互联网营销的有效手段。

      2013年5A级景区网络形象指数得分排名前10的景区分别为:陕西渭南华山景区(87.73)、镇江市金山·焦山·北固山旅游景区(87.13)、乐山市峨眉山景区(87.11)、张家界武陵源—天门山旅游区(86.66)、泰安市泰山景区(86.12)、南平市武夷山风景名胜区(85.83)、黄山市黄山风景区(85.61)、杭州市西湖风景名胜区(85.06)、丽江市丽江古城景区(84.73)、湖北省十堰市武当山风景区(84.03)。本文认为这10个景区得分较高的原因主要有:(1)多数景区在国内家喻户晓,网络媒体尤其是具有强大网络影响力、辐射力的门户网站和旅游局官网的报道量大;(2)每个景区官方网站的架构完整、内容丰富、更新及时,作为景区网络信息的原始来源及传播核心,官方网站发挥了景区对外宣传的旗手作用;(3)景区顺应产业发展趋势,普遍提出了促进旅游产业转型升级、打造景区核心竞争力的战略或口号,注重发展智慧旅游,互联网报道量和转载量大;(4)积极开展丰富多彩的节庆活动,媒体曝光率高。网络形象指数得分较低的景区,因受限于景区规模小、5A级历史短等诸多因素,知名度普遍不高,与其他旅游景区相比网络信息量明显偏少,景区网络形象亟待提升。

      中国5A级景区网络形象与以旅游接待人数衡量的景区形象呈现错位现象。以2012年5A级景区旅游接待人数为例,排名前10位的景区分别是故宫、深圳华侨城、广州长隆、广州白云山、颐和园、横店影视城、天坛、八达岭、庐山和黄果树瀑布,但这10个景区的网络形象仅达到及格或良好等级,惨淡的网络形象与火热的接待景象对比鲜明。而网络形象排名靠前的景区,其旅游接待人数排名普遍处于中下游水平。这说明,我国5A级景区网络形象与景区旅游接待人数不匹配,传统上认为接待人数与网络形象相一致的观念是不正确的。

      

      

      3.2 空间格局

      标准差椭圆(standard deviational ellipse,SDE)是一种从重心、展布范围、密集性、方向和形状等多角度准确刻画地理要素空间分布整体特征及时空演化过程的空间统计方法。SDE中心反映经济要素空间分布整体在二维空间上的相对位置(重心);长轴的方向(方位角,即正北方向与顺时针旋转的长轴之间的夹角)反映其在二维空间上展布的主趋势方向;长、短轴的比值可以体现要素空间分布的形态;单位标准差椭圆上分布的空间要素总量可以体现其在二维空间上展布的密集程度[19]。本文采用加权标准差椭圆方法,基于153家5A级景区的地理位置(经纬度),用该景区对应的景区网络形象分值表示相应的权重,计算旅游景区网络形象空间分布的标准差椭圆。

      图2中灰色图形表示的是153家5A级景区地理空间分布标准差椭圆,反映153家5A级景区地理空间分布格局,位于地理空间分布标准差椭圆内部的地区是我国5A级景区分布的主体地区。黑色图形表示的是153家5A级景区网络形象空间分布标准差椭圆,反映153家5A级景区网络形象的空间分布格局。黑色SDE与灰色SDE相比,展布范围明显缩小,南—北方向的收缩趋势强于东—西方向的收缩趋势。这表明:中东部地区5A级景区网络形象分值普遍高于东北、西北及西南地区,且位于两个SDE东西两端的长三角、云贵川地区5A级景区网络形象优于位于南北两端的京津冀、珠三角地区。造成这种现象的原因有:中东部地区经济发展水平高,交通、通讯、住宿等基础设施完善,景区服务意识强、规章制度齐全;中东部地区5A级景区数量多、分布集中,旅游景区间的竞争激烈,景区不断提升自身形象的动力较强;长三角和云贵川地区得益于良好的管理水平和丰富的旅游资源,各景区知名度与美誉度普遍较高。

      图2中虚线部分表示的是总分值排名前20位景区的空间分布情况。由图2可知,5A级景区网络形象呈现空间集聚特征,得分较高的景区主要分布在江苏省、浙江省、安徽省、福建省四省交界区和四川省、云南省中部,并分别形成了“钻石地带”和“高分走廊”两个高分集聚区。在这两个集聚区之外,其他高分景区零星散布在山东省、陕西省、湖北省、湖南省和新疆维吾尔自治区。

      

      图2 5A级景区网络形象指数得分标准差椭圆

      

      图3 认知形象和情感形象整体情况二维分布图

      3.3 二维分布

      图3是国家5A级景区网络形象指数二级指标得分的二维分布示意图。坐标轴横轴表示认知形象得分,纵轴表示情感形象得分。图3中分别标出了景区网络形象排名前20名景区、认知形象排名前20名景区和情感形象排名前20名景区。由图3可知:(1)认知形象排名前20名景区和总分排名前20名的景区中有16名是重合的;(2)情感形象排名前20名景区和总分排名前20名的景区只有4名是重合的;(3)认知形象排名前20名景区和情感形象排名前20名景区均不相同;(4)灰框内密集分布81家认知形象得分低于75分且情感形象低于80分的景区,该类景区数量占景区总数的53%。

      这表明:(1)全国153家5A级景区认知形象和情感形象的总体表现不尽如人意,超过一半的景区两个维度的形象得分均没有达到优秀级别,景区提升空间巨大。(2)我国5A级景区认知形象与情感形象分异明显:认知形象得分高的景区通常情感形象得分低,情感形象得分低的景区通常认知形象得分高。这是由于认知度低的景区以官方网站报道为主,信息总量少,但是官方网站的自我营销性质决定了在总量信息中好评文章占比高,因而导致了认知形象得分低、情感形象得分高的现象;而认知度高的景区一般是网络媒体关注的焦点,一旦出现负面消息就会迅速形成网络热点,导致互联网中对该景区的负面报道总量增加,好评报道占比下降,情感形象得分降低。(3)认知形象得分整体高于情感形象。目前网络媒体发挥的主要作用是传播而非宣传,这为未来旅游景区互联网营销提供了良好的机遇。

      

      

      3.4 指数类型分析

      首先,根据每个三级指标得分,按照平均极差的方法将每个三级指标分成4个等级。其次,分指标将处于第一等级的景区设定为A级,处于第二等级的景区设定为B级,处于第三等级的景区设定为C级,处于第四等级的景区设定为D级。例如,华山景区4个三级指标的等级分别为AABA。通过对153个景区三级指标等级的分析,可以将其划分为两大类别:均衡型与驱动型。均衡型是指4个指标得分中有且仅有两个等级。其中,两个等级为A、B的为高水平均衡型,两个等级为B、C的为一般均衡型,两个等级为C、D的为低水平均衡型。驱动型是指有且仅有一项指标得分为A或B的类型。根据以上划分方法,可以将153个景区分为高水平均衡型、一般均衡型、低水平均衡型、旅游资源驱动型和综合管理驱动型5大类型(见表2)。以华山、杭州西湖为代表的12个景区属于高水平均衡型,占全部景区数量的7.84%;以故宫、鼓浪屿为代表的46个景区属于一般均衡型,占全部景区数量的30.1%;以白洋淀、十三陵为代表的52个景区属于低水平均衡型,占全部景区数量的34.0%;以九寨沟、布达拉宫为代表的14个目的地属于旅游资源驱动型,占全部景区数量的9.2%;以五大连池、镜泊湖为代表的5个目的地属于综合管理驱动型,占全部景区数量的3.3%。一般均衡型与低水平均衡型景区所占比重达到64.05%,说明大多数景区特色模糊,整体仍有较大发展空间。

      4 结论与讨论

      研究表明,中国旅游景区网络形象呈现4大分异。(1)整体形象分异:以华山、峨眉山、张家界为代表的景区网络形象总分值达到了80分以上,但是仍有超过1/5的景区总分值未达到70分。153家景区虽同为国家5A级景区,但网络形象分异悬殊。(2)空间分异:我国5A级景区地理空间分布与形象指数空间分布出现一定偏差,形象指数分布具有明显的空间集聚特征,高分景区成群成带聚集分布,并形成了以“钻石地带”和“高分走廊”为代表的两个高分区域。(3)知名度与美誉度分异:5A级景区认知形象与情感形象重合度低,某些景区虽然网络知名度高,但是网络美誉度低,而某些景区虽然名不见经传,但是情感形象得分高。这表明,网络营销是一把“双刃剑”,旅游景区应当对网络营销采取审慎管理态度,在高度重视网络营销及信息化力量的同时应制定网络媒体应急处理预案,将负面消息带来的不利影响减至最低。(4)类型分异:5A级景区中既有在一方面表现特别突出的“单科冠军”,也有各方面均衡发展的“全能选手”。景区类型的差异决定了景区管理不能采用“一刀切”的方式,不同类型的景区应采取不同的发展策略。高水平均衡型景区在维持现有水平的基础上,应着力挖掘自身潜力,打造景区特色品牌,不断提高辨识度与影响力;驱动型景区在保持现有竞争优势的前提下,应当尽快补足短板,提升景区层次;一般均衡型与低水平均衡型景区可以率先在基础设施、旅游服务等方面寻求突破,以点带面促进景区发展。

      本文选取的是一定时期内互联网上5A级景区的有关信息,未来会深入刻画旅游景区在不同时间节点上网络形象的动态变化特征及规律,同时会进一步提升指标体系的准确性与科学性,改进网络抓取及内容分析技术。此外,未来的研究中还将把“景区网络形象指数”进一步拓展为“旅游目的地网络形象指数”,以进一步引导旅游目的地加强网络营销、提升区域整体竞争力。

标签:;  ;  

基于互联网内容分析法的中国风景名胜区网络图像索引研究_旅游景区质量等级的划分与评定论文
下载Doc文档

猜你喜欢