国外旅游研究领域Web点击流分析研究进展,本文主要内容关键词为:研究进展论文,研究领域论文,国外论文,旅游论文,Web论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
Web点击流数据记录了访问者访问Web站点路径的过程。使用者每次按某一顺序访问一系列Web页面的过程被称作是一个会话(session),Web 网站的点击流数据是发生于该网站的一组会话[1],记录Web点击流数据的文件或数据库数据往往也被称作“用户访问日志”。关于旅游消费者使用互联网和电子商务交易的情况,通过对Web点击流数据或访问日志分析所得到的数据比调查问卷等方法更直接、更可信。通过对Web点击流数据的深度挖掘和分析,可发现旅游者在相关旅游网站上的浏览模式,更深入地了解并预测旅游者的网上信息搜索行为、旅游决策行为以及旅游产品消费模式等,从而提高旅游目的地营销、吸引物管理运营以及旅游服务流程提升等方面的效率。
1 Web点击流分析在旅游领域的价值
1.1 Web点击流数据的类型
对Web点击流数据的收集和处理方法有多种,按照数据的收集方式可将Web点击流数据分为“以网站为中心”的数据和“以用户为中心”的数据。“以网站为中心”的数据是指各网站所保存的该网站与其访问者之间发生交互过程的详细记录,这种数据集可提供特定网站内的非常详细的信息。但由于此类信息由各个网站收集,难以了解其访问者在其他网站的访问数据。“以用户为中心”的数据是通过跟踪用户访问互联网的活动来收集点击流数据,其涵盖了用户访问的所有网站(包括彼此竞争的网站)的数据,但在选取用户的样本规模以及精确跟踪用户在其感兴趣的特定网站内的活动能力方面都存在挑战。
1.2 Web点击流数据的独特价值
Web点击流数据追踪并存储了关于用户使用互联网以及进行电子商务交易的记录,从而为了解和预测消费者选择行为的实证研究提供了重要机会[2]。通常,Web点击流数据包含的信息有:计算机或个人的识别号(如cookie ID、IP地址或用户名)、浏览器的类型、请求的页面或点击的广告条、每次点击活动的时间戳、前一个访问页面以及其他与访问页面相关的变量。因此,Web点击流数据集追踪了在线用户的所有活动,并记录了每个用户在浏览Web时留下的虚拟轨迹[3]。对旅游相关网站而言,Web点击流数据可能包含用户点击过的广告、用户搜索旅游信息的关键词以及点击顺序、用户浏览旅游目的地网站或旅游代理网站网页的顺序、用户在线预订旅游产品和服务等。
1.2.1 对用户的测量更精确 相对于传统媒介,Web点击流为互联网媒介提供了改善测量媒介受众规模及特性的手段[4]。报纸、电视等传统媒介的受众规模可以根据报纸发行量以及电视普及量等粗略衡量,但很难精确得知读者或观众阅读了报纸的哪部分信息或者收看了电视的哪个节目等具体信息。Web点击流数据提供了详细的电子跟踪信息,可以对互联网媒介所接触的受众的单次及重复访问、访问的内容、访问停留的时间以及这些访问之间的顺序进行更精确的测量。以旅游目的地网站为例,为了解旅游者对该目的地电子宣传手册使用的模式,观察点击该目的地网站上电子宣传手册相关的Web 点击流,可以精确得知用户是点击下载电子宣传手册、还是在线填写信息要求将旅游宣传册邮寄到家、抑或根据在线导航选取自己感兴趣的章节阅读。对于选择在线阅读的用户,通过点击流分析还可精确测量用户经常访问哪些内容。
1.2.2 降低旅游企业的市场研究成本 传统方式下旅游企业(及旅游目的地组织)为锁定目标市场而进行市场研究,不仅需要花费大量财力,而且难度较大,相对而言,Web点击流数据为旅游企业(及旅游目的地组织)给出了具有财务可行性的市场研究机会。例如,对于那些建有网站的旅游企业,从自有网站记录的用户点击流数据中,根据点击流数据的IP地址信息和访问的特定的旅游产品页面信息,可以锁定来自哪些区域的用户对这一特定旅游产品感兴趣,可以从这些用户点击的页面的顺序和内容中挖掘出客户决策过程各阶段所需的详细信息;对于那些没有建立网站的旅游企业,也可以从搜索引擎所记录的消费者搜索和浏览的与该旅游企业信息相对应的Web点击流数据中,有效地辨别出目标客户。
1.2.3 更深入地识别用户模式 与1980s早期用于开发和测试“选择模型(Multiple Choice Model)”的面板数据(Panel Data,截面数据与时间序列数据的综合)相比,Web点击流数据提供了更为详细的信息[5]。Web点击流数据跟踪了用户在线搜索及购买行为的过程,这一信息使得旅游研究者可以对旅游者搜索及购买行为的更多方面进行研究,旅游研究者还可以使用更大规模的点击流数据集识别旅游者行为的不同模式。例如,通过分析在线旅游代理网站的不同页面(如主页、旅游产品类型及信息、旅游产品预订等)的Web点击流数据,可以识别访问者的行为模式,如直接预订型、搜索/考虑型、浏览型以及知识储备型[5]。
1.2.4 促进旅游网站个性化 基于Web点击流分析,旅游网站可以通过实时地向相关消费者提供个性化的信息,及时反映每个消费者的行动。以旅游网站广告投放为例,旅游网站可以在快速搜索大量的Web点击流数据并进行分析后,针对当前点击用户的来源地,投放针对该客源地的个性化的旅游广告。旅游网站还可以限制呈现给每个用户的针对性的广告数量,根据用户已经浏览过的路径变化网站内容。而旅游目的地建议系统则可采用基于概率方法的序列模式挖掘技术,实时预测浏览者下一步点击选择的倾向,对在线的潜在旅游者提出旅行或度假规划建议。
1.2.5 改善旅游网站设计 对Web点击流的分析有助于旅游网站改善网站设计进而提高营销能力。与拥有自己的技术系统以及技术团队的大型旅游在线代理公司不同,中小型旅游企业通常将其网站设计和维护外包,甚至还没有建立网站。鉴于市场竞争十分激烈,对旅游企业而言,通过改善网站设计增加在线交易十分重要。网站的营销和设计往往事先假定了潜在消费者的信息需求和浏览路径,而分析Web服务器上记录的日志文件,则有助于网站管理者基于用户的实际浏览路径[6,7]进行交互式的网站设计[8]。以酒店网站为例,酒店管理者想知道以下问题:访问者(潜在顾客)在酒店网站上寻找什么信息?为了得到这些信息都浏览了哪些网页?最经常访问的网页?从哪个网页进入网站?哪个搜索引擎将潜在顾客指引给酒店网站、访问者在这些搜索引擎上用了哪些搜索词?以上问题均可以通过对酒店网站所收集的Web点击流数据进行统计分析而得到答案。进而,酒店管理者则可以根据这些访问者的行为特征重新调整网站设计。例如,在经常被访问的网页上提供最想推销的酒店产品、更有针对性地进行搜索引擎营销等。
2 国外旅游研究领域Web点击流分析研究进展
为了解国外旅游领域Web点击流分析的研究进展,笔者首先以“clickstream analysis/log file analysis”和“marketing”为关键词,在Academic Search Complete(Ebsco)、Science Direct(Elsevier)、OmniFile FT Mega(Wilson)、Web of Science(ISI)、ProQuest学位论文数据库搜索,得到文献69篇。以关键词“clickstream analysis/log file analysis”和“tourism/travel”进行联合搜索,发现仅有文献3篇。对比市场营销领域和旅游研究领域的文献数目可以推测,Web点击流分析在国外属于新兴旅游研究领域,因此文献可能集中在会议论文集内。以相同的关键词在ENTER(Information and Communication Technologies in Tourism)会议论文集中搜索,得到文献4篇(文献总量为7篇)。可见将Web点击流分析应用于旅游领域的研究仍较少。
2.1 研究内容
在旅游领域,笔者发现旅游网站点击流分析活跃的研究领域有:旅游网站(包括目的地网站和酒店网站)访问者行为、旅游者在线信息搜索以及旅游目的地建议系统等。这些研究的主要内容及其贡献如下:
2.1.1 旅游网站使用与浏览 基于Web点击流数据分析提取旅游网站的使用及浏览模式的研究涉及酒店网站和旅游目的地网站。在酒店网站消费者行为领域,Schegg等[9]在利用Web Trends对15家瑞士酒店网站的日志文件进行分析的同时,辅之对网站的内容和信息结构进行人工分析评估,解释了消费者如何找到并浏览酒店网站,发现所研究的酒店网站的访问者对这些酒店比较熟悉,但酒店应更好地重新组织其网站,使得访问者可以便捷地获取关于预订交易的信息。之后,Leung等[10]根据香港一家5星级国际连锁品牌酒店网站的用户访问日志,分析用户检索的信息及其访问路径,发现大多数网站访问者是当地居民,且其主要兴趣为餐饮信息,该网站在搜索引擎上的可见度较低导致网站知名度较低。此外,该酒店的信息结构组织不够好,访问者平均点击3.94次才能到达希望访问的网页。该研究通过酒店网上记录评估的方式提高了对在线用户访问行为重要性的认识。在旅游目的地网站访问者行为领域,Anuar等[11]对美国一个网站的电子旅游手册使用模式进行了研究,通过对日志文件(即点击流数据)进行分析,考察了以不同信息源形式(在线下载全部手册、直接读取手册中相关网页以及在线提交邮寄申请)提供的电子旅游手册的效率。该研究强调了Web点击流数据挖掘在浏览模式识别方面的重要性,指出基于数据挖掘的浏览模式识别不是常见的页面点击率分析所能提供的。
2.1.2 旅游者在线信息搜索 旅游决策过程中的重要行为基本可以概括为信息搜索和处理。旅游决策需要大量内部及外部信息,可能包含信息搜索、评估以及整合任务和活动。旅游者往往对搜索信息很积极,并将其作为旅行计划的一部分,这点被认为是旅行体验的重要组成部分。提供给个人的旅游信息对旅游者决策的各方面有重大影响力,特别是在目的地选择方面[12-15]。很多研究指出,信息搜索的主要功能是支持决策、降低风险及不确定性[16-18],旅游者信息搜索及处理行为的研究由来已久,并对旅游市场营销有重大贡献[[19-22]。
应用Web点击流分析对旅游者在线信息搜索进行的研究有:Wolk等[23]为了解旅游者对欧洲城市的兴趣,基于用户访问www.visiteuropeancities.info所留下的日志文件进行分析,提取用户搜索信息时的重要模式。此项研究发现,使用该网站的用户所访问的城市之间信息相似,即旅游者对这些城市的认知比较相似。此类发现有助于城市或者旅游管理者为建立所期望的城市形象而重新考虑其营销计划。另一类在旅游者在线信息搜索领域涌现的应用Web点击流分析侧重于微观实验研究。Pan 等[24]在实验中用专用软件结合摄像头等仪器记录了被试者在制订度假计划时进行在线搜索的点击流数据,采用语义图表示被试者的搜索信息空间,利用语义分析软件CatPacII对不同被试者的语义空间进行了分析,并通过对基于互联网的度假规划微观过程的考察,提出了旅游者在线搜索的概念模型。Pan 等[25]在研究在线评论及建议对旅游者度假计划的影响的实验中采取了类似的收集数据的方法,即利用屏幕记录软件Camtasia Studio和互联网监控软件PC Tattletale记录被试者所有的网络浏览行为。
2.1.3 旅游目的地建议系统 旅游目的地建议系统是帮助潜在旅游者从复杂的在线选项中找到其感兴趣的信息和服务的特殊工具。它是为旅游者或旅行者在目的地和其他旅行相关产品选择方面提供引导。由于旅游者至少在一定程度上不是纯理性的,其决策可能基于情绪化的标准,旅游建议系统试图通过重新调整信息结构或者在解决问题的过程中提供特定的步骤,以解决信息过载的问题并缩小信息搜索范围[26]。
旅游目的地建议系统所依靠的主要Web点击流分析技术是协同过滤(Collaborate Filtering),即基于当前用户选择(或感兴趣)的数据项和前一个用户感兴趣的数据项的相似性给用户提供建议,或者通过测量当前(目标)用户的个人资料(可能是一组评级数据项或一组访问或购买数据项)同前一个用户的访问资料文件之间的关系,以便找到数据库中具有相似特征或偏好的用户。Schiaffino等[27]提出了一个Travelle虚拟专家代理人系统,该系统的虚拟代理人根据用户的资料,结合对当前用户访问网站的Web点击流分析,为用户推荐其感兴趣的假日旅游包。为了对引发用户退出建议系统前的最后行为进行实证性探测,从而评估旅游建议系统,Zanker 等[28]提出了一种将典型的Web点击流分析同奥地利Spa度假酒店开发的交互式旅游建议系统所收集的用户反馈相结合的实证检验方法,侧重于评估建议系统的效率、效益以及可付诸行动的营销智能。
2.2 研究方法
Web点击流分析在旅游研究领域所采用的方法多为综合方法,除对Web点击流数据的直接分析外,还结合对点击内容或用户其他资料的分析。在Web点击流数据分析中,大多数研究采用商业化工具,如Schegg等[9,10]采用Web Trends进行描述性统计,而Zanker等[28]应用点击流序列分析方法时使用的IBM DB2 Intelligent Miner则采用了数据挖掘技术,可视化地呈现用户在线的交互路径,显示路径上每个节点的流量。该研究在衡量点击流复杂度时借鉴了Senecal等[29]在测量用户在线购物行为时采用的点击流密度(compactness)和点击流层次(stratum)测量指标[30]。相对前两种研究,因采取实验法的研究[24,25]所采集的点击流数据量较少,所以可以人工进行。
2.3 当前研究存在的问题
市场营销领域应用Web点击流分析的文献非常多[2],具体应用领域有:Web使用及访问、互联网广告以及在线购物和电子商务。与此类似,鉴于了解用户点击流数据的重要性,越来越多的研究开始将Web点击流分析应用于旅游业。但目前国外旅游领域Web点击流分析刚刚起步,存在如下问题:
2.3.1 研究领域不广 与市场营销领域的Web点击流研究相比,国外旅游领域研究者意识到了Web 点击流分析的重要性,但相关研究起步较晚(2005年起)。截至目前,运用Web点击流数据进行分析的研究仍较少,这不仅表现在文献总量较少(7篇),还表现在目前尚缺乏关于旅游电子商务(即旅游者在线预订旅游产品等消费行为)以及投放旅游广告的研究。这可能是因为研究者在获取数据方面需要获得旅游网站的许可、商业化工具需要资金、数据挖掘算法难度较高等原因。
2.3.2 深度挖掘不够 对用户在线行为的深度挖掘较少,仍局限于对面向浏览的Web点击流数据。这是由于商业化工具所提供的功能大多为面向浏览的点击流模式识别,如统计页面访问量等,而面向交易的点击流模式识别(如跟踪某个用户的访问路径、识别用户在线交易的模式)则仍需要开发专门的算法或程序。因此,旅游领域的Web点击流研究(尤其是“以网站为中心”的Web点击流)多停留在依靠商业化工具所提供的功能的基础上(迄今仍无研究者自行开发相关数据挖掘算法),造成对用户行为的深度挖掘较少,改善这一局面亟须多学科跨领域的合作。
3 发展趋势
Web点击流分析技术本身是一个新兴的领域,将Web点击流分析应用于旅游研究中更具挑战性。由于旅游研究者和旅游业界人士日益认识到Web 点击流的价值,即Web点击流分析有助于发现旅游者Web使用模式,从而促进旅游网站改善系统性能,为潜在旅游者提供个性化服务,并最终提高旅游目的地(或旅游产品提供商)营销效率。预计今后旅游领域的Web点击流相关研究将出现以下趋势:
3.1 研究领域拓展到旅游电子商务、在线社区营销等领域
将Web点击流应用于旅游电子商务领域,有助于旅游产品和服务提供商/旅游目的地组织更好地了解旅游者的在线消费行为。例如,研究者跟踪酒店在线预订的点击流,可以发现网站预订流程设计与用户实际点击的差别,可通过改善网站设计以提高酒店预订率。
将Web点击流分析应用于电子口碑传播将成为趋势。互联网为旅游产品和旅游目的地的口碑营销提供了媒介,如博客(Blog)、聊天室、社区、论坛等,来自旅游者的评价越来越受到其他打算出游的互联网使用者的重视;旅游网站也允许游客对其目的地或旅游产品进行评价,如研究者可以跟踪旅游在线社区的点击流,将其与旅游产品销售或其他收入相关联,则有望对网上营销的有效性进行衡量[2]。
3.2 多种分析方法相结合
为了更有效地使用Web点击流数据,需要结合旅游企业的业务信息对Web点击流进行分析。目前研究已经出现这一趋势,即“以网站为中心”的点击流数据分析往往结合对网站内容的分析进行。例如,一个访问者访问了目的地网站的许多页面而非一个页面,是因为该网站比较有趣还是因为访问者难以找到所需的信息,这需要通过分析进入这些网页的入口点以及对网页上现有的信息进行综合判定;另一方面,对“以用户为中心”的Web点击流数据的分析则通过用户访问路径分析(Path Analysis)结合对用户的观察(如通过摄像头记录)及用户调查进行,这也将成为一个趋势。用户访问路径分析可以得知用户从哪里进入某特定网站,以及在该网站内的访问路径,而对用户的观察则可以了解用户如何在多个网站之间更替,用户调查则可以了解更多的用户信息,可以更深入地了解潜在旅游者的决策过程。
3.3 应用数据挖掘技术和工具
由于Web点击流数据量庞大且复杂,借助于数据挖掘技术及工具可以更好地了解旅游者浏览和使用网站的行为,这将是旅游领域点击流数据分析的趋势。应用于Web点击流模式识别的数据挖掘算法可分为:描述性统计分析、关联规则、流特征聚类、预先分类、序列模式以及从属关系建模[31],而商业化序列数据分析软件则有IBM DB2 Intelligent Miner、Web Trends、SPSS Clementine等。但商业化工具提供的功能并非针对特别的问题而设计,仍需研究者应用数据挖掘算法解决其研究所针对的问题。例如,欲了解一个在线旅游代理商网站的酒店预订流程与Web点击流中记录的用户实际访问的流程有何不同,从而了解消费者为何只浏览不预订或者预订过程没有彻底完成,就必须依靠专门的算法和程序分析这种面向交易的点击流。
4 结论
Web点击流所包含的丰富的以用户为中心的数据为旅游研究者和业界人士提供了了解旅游者在线行为的机会。对Web点击流的分析可以降低旅游企业的市场研究成本、更精确地对用户进行测量、更深入地识别用户模式、实现旅游网站个性化、改善旅游网站设计。目前,国外应用Web点击流分析的旅游研究还不多,活跃的研究领域有:旅游网站(包括目的地网站和酒店网站)访问者行为、旅游者在线信息搜索以及旅游目的地建议系统等。尽管其研究领域尚不够广、深度挖掘不够,但随着旅游研究者和业界人士对Web点击流价值的认识日益加深、Web点击流分析所借助的数据挖掘技术及工具的逐渐成熟以及跨学科的合作越来越多,旅游领域Web点击流的研究将继续扩展到旅游电子商务、在线社区营销等领域,并将更多地应用数据挖掘技术和工具,且保持多种分析方法相结合的趋势。