基于知识的旅游目的地管理平台框架与构建_数据仓库论文

知识型旅游目的地管理平台框架及其构建,本文主要内容关键词为:管理平台论文,目的地论文,框架论文,知识型论文,旅游论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      文章编号:1003-2398(2014)04-0104-07

      一个行业的经济发展同通过行业所需知识的获取来重新配置资源从而保持竞争力息息相关[1],旅游目的地的竞争力很大程度上依赖于信息如何通过基于ICT的基础设施和服务来满足相关者的需求[2,3]。基于知识的模式将旅游看作是一个复杂的社会现象,而知识即是目的地可持续发展的基石,通过知识的产生和智能应用能够使目的地的利益相关者之间的信息不对称大大降低,这样就可以加强创新和协作能力,从而通过以可持续的方式使用目的地资源并反过来强化市场培育和提高服务效率[4]。Frechtling[5]和Rob[6]发现,通过建立预测模型,准确的规划可以减少对未来进行决策的风险。在宏观层次上,精确的预测结果可以帮助一个目的地预测旅游者对地方经济、文化和环境的贡献和影响;政府可以规划旅游公共收入并确保合适的能力和设施的维护。在微观层面上,开发者可以利用准确的预测结果来建立可操作的需求,而投资者可以研究项目的可行性。在任何情况下,准确的规划都能使由于过量供应或供应不足而带来的经济损失最小化。然而,我们的旅游目的地虽然已经积累了大量的数据,这些有价值的知识却没有被很好地利用[2,7-9]。调查发现,对旅游管理者来说,他们对于旅游市场研究数据的发布有着很高的需求。但他们往往不知道从哪获取知识,不知道哪些数据源是可以获取的;他们面对各种数据源可能会无所适从,不知道在分析某类主题时应该如何正确选取数据[10]。而实际上,这些数据大量地散落在国际旅游组织、经发组织、统计部门、旅游管理部门、涉旅企业等的不同系统和网站中,主要包括市场与环境信息、用户行为信息、行业竞争信息、内部执行信息等,这些信息被

归纳为描述性/事实性知识。另一类知识即为基于方法的过程性知识,主要是管理者可以利用一些模型和方法来生成知识从而辅助其决策[10]。为了纠正与实际的偏差,旅游行业的管理者通常需要及时的分析报告来检测实际的执行效率,同时他们也需要适当的分析来帮助进行长期的决策。他们看了大部分的分析和报告,时间被花费在分析之前从各类系统中收集的数据上,而不同系统的分析结果还可能因为分析方法与路径、目标选择的不同而使得结果大相径庭。管理者们想了解更多的信息,但分析在高代价的时间下只能获得较小的信息量。因此为了更可信地预测模式和趋势并对特定情境下的问题进行更有效的分析,就需要一个满足此类目的的数据仓库,为管理者提供一个历史的、汇总的、综合的全局视图[7]。

      旅游目的地的管理竞争力和组织学习可以应用商务智能的方法得到显著地提高[11-13]。商务智能(Business Intelligence,BI)被理解为将企业中现有的数据(业务、财务、研发等)转化为知识,帮助企业做出明智的业务经营决策的系统架构。其实质上是数据仓库、在线联机分析处理(On-Line Analytical Processing,OLAP)和数据挖掘等技术的综合应用,目前已成为当前企业应用非常广泛并逐步深入的技术和方法。缘于越来越多的企业发现在80年代到90年代初期所盛行的在线联机事务处理系统(On-Line Transaction Processing,OLTP)已经不能满足当前企业决策分析的需求,数据仓库的出现和发展则为解决这些问题提供了一种面向主题的、集成的、时序的数据组织环境与架构。Remzi

和Tjoa认为任何现代决策支持架构的基础都是数据仓库[14]。因此,这种数据组织的解决方案为我们构建一个旅游目的地知识管理平台提供了技术基础,本文即要构建一种基于数据仓库相关技术的决策与数据分析平台,通过对旅游市场与经济数据的重新组织与深层次的OLAP分析,发现数据、指标之间的相关性,分析在一定时间序列下的发展态势与趋势,把握旅游市场的发展现状与规律,为开展旅游科学研究和旅游产业发展决策提供依据。

      1 相关研究与案例

      一些文献讨论了数据仓库的相关理念及其在旅游行业应用的必要性,例如Danubianu提出了罗马尼亚对于旅游数据仓库的需求,认为旅游数据仓库能够为旅游决策者提供一个有效且及时的分析工具[7]。Remzi

和Tjoa给出了一个基于web的数据仓库及决策支持系统(DSS)在旅游领域应用的框架[14]。虽然对于数据仓库在旅游中应用的研究文献并不多,但也有一些国家很早已经开始利用数据仓库构建旅游决策支持平台。如Hendawi和El-Shishiny以埃及旅游局(Egyptian Ministry of Tourism)的数据为基础,构建了埃及旅游数据仓库原型,给出了数据仓库的设计步骤与架构[8]。DATATUR是西班牙国家旅游局建立的一个基于旅游统计数据、调查数据为基础的旅游统计信息系统,系统亦基于商务智能技术构建了一个旅游统计数据仓库,满足旅游管理者的各类查询、分析报告及预测性分析等需求[15]。澳大利亚自2001年建立起了国家旅游数据仓库NTDW(National Tourism Data Warehouse),它是由所有的澳大利亚国内各州和地方政府旅游组织以及澳大利亚旅游局联合发起而构建的,主要致力于澳大利亚旅游产品及目的地市场的营销,为其国内外的贸易伙伴和消费者提供一致的、可靠的产品和目的地信息,并使NTDW能够最大化地被各方获取。其产品的范围包括住宿、景区、目的地信息、节事、信息服务、旅游雇佣、交通和旅行等,其内容按照统一的国家认可的标准由各州和地方旅游组织每天完成更新[16]。

      Tour MIS是1996年由奥地利国家旅游局(Austrian National Tourist Office)发起的一个项目用于开发一个基于互联网的旅游营销决策支持系统,旨在为旅游行业提供一个最优的信息与决策支持。传统的旅游市场数据源如国家统计局、世界旅游组织、欧盟统计数据库等虽然亦积累了大量的数据,但这些数据却很少被使用,因为它们忽略了终端用户的特定需求,系统缺乏实用性,不能满足特定的行业需求,且缺乏详细充分的解释,因此,需要构建一个集成的数据环境来满足目的地知识管理的需求。Tour MIS系统主要包括:一个旅游市场数据仓库;各种基于方法的程序模块,用于通过成熟的方法/模型将知识可视化;以及各种管理程序用于维护数据库,跟踪和控制用户搜索行为的信息。数据源主要来自于:①奥地利国家统计局的数据(OSTAT);②国际组织的统计数据(OECD/WTO);③欧盟城市旅游局的数据(FECTO);④奥地利游客调查(GBOASART);⑤德国旅游普查数据(RA);⑥奥地利经济研究所(WIFO)提供的奥地利地方收入统计;⑦每年的酒店和餐馆面板调查数据(BV-ASART);⑧主要客源国的经济数据(OECO)。系统的使用者主要为旅游管理人员(占44.6%)、雇员、学生和研究人员(占31.6%)、非旅游专业人士和个人(23.8%)。为了评估系统和发现管理者对于信息的需求,他们还对256个旅游管理人员使用TourMIS系统12个月的日志记录进行跟踪与分析(因为系统使用前需要注册,因此能很容易地获取个人信息)。分析发现旅游管理者使用TourMIS系统主要感兴趣的数据是对奥地利过夜数和旅游人数的统计。奥地利国家统计局的数据是最有价值的和最为被关注的数据,主要包括过夜数、游客数、床位拥有量、住宿率、游客平均住宿天数等。通过对用户使用系统的搜索内容统计,发现用户普遍关注的是国家统计局的月度数据(这说明人们更关注及时的信息发布),其次是欧洲城市旅游组织(European Cities Tourism,ECT)和欧洲旅游委员会(European Travel Commission,ETC)发布的数据,而且这两类数据查询量的增加也意味着用户对国际的统计数据也越来越感兴趣。另外,该系统也由于能够保持持续的更新和在线获取而保持着旺盛的生命力,截止到2003年,已有超过100个管理者分布于30多个不同的欧洲国家自愿地为系统贡献数据,同时也确信了这一项目的重要性与价值。

      

等则应用数据仓库和BI方法原型实现并测试了一个目的地管理信息系统DMIS[17]。该系统主要是基于游客信息的收集,主要包括人口统计及心理特征变量、购买动机、价格敏感性、品牌感知度和忠诚度以及信息与产品的消费模式。具体指标包括经济效益(游客预订、过夜数、价格、营业额)、用户行为(网站浏览与搜索、预订与消费行为、用户档案)、用户感知和体验(目的地品牌感知、目的地价值、用户满意度、忠诚度)。系统以瑞典的一个滑雪目的地为例,数据主要来源于目的地的几个网站的旅游者在网站的浏览、预订、消费等交易数据,以及市场调查的用户反馈数据。系统亦引入了商业智能方法,方便管理者与目的地供应商能够通过OLAP进行在线分析。还构建了一些数据挖掘的原型来对所搜集的数据进行分析,如利用k-means聚类方法对网站客户按照网站浏览的特性进行分类来识别浏览模式;利用Apriori关联规则算法发现网站用户的预订行为模式,如预订行为和季节的关系等;采用决策树方法对用户取消预订的行为进行分析,找出用户取消的路径与原因。

      2 知识型旅游目的地管理平台框架

      基于对相关文献的分析,以及各国已经实施成功的案例,我们发现,为了构建一个旅游目的地的管理、营销的决策支持平台,对于数据收集与处理的对象一般可以分为两类,一类是以统计、市场调查数据为主,一类是以旅游者的行为数据为主。而同旅游决策相关的知识可以分为两类[2]:一类是市场培育类的知识,即如何利用目的地资源来吸引最有价值的客户并提供有效的信息服务;另一类是目的地管理与开发相关的知识,即提供设施来避免拥塞、环境保护、基于价值细分的产品一市场组合开发、节事管理、培训、公私伙伴关系等[18,19]。这些知识都需要通过对多源数据的集成、转换和处理并存储于一个统一的数据仓库中,从而在此基础上利用商务智能、人工智能、数理统计等技术与方法进一步将信息加工为知识,供旅游目的地的管理人员所使用。基于此,我们提出一个知识型目的地管理平台的一般框架[20,21],如图1所示。

      数据源:一般可以包括市场类数据、游客行为类数据、产业类数据。市场类数据像国际旅游市场统计数据一般可以通过世界旅游组织(UNWTO)、世界旅行业理事会(WTTC)等通过购买的方式获取。而国内旅游市场数据可以通过国家旅游局出版的历年旅游统计年鉴及各省市的统计年鉴获取;对于游客行为类数据,一般可来自于显式的用户反馈,像游客调查反馈、网站打分和评价,也可以通过隐式的对旅游者的信息跟踪的方式获取,如网站浏览数据、在线请求、预订和支付数据以及基于GPS的空间移动数据等;产业类数据可以通过企业直报系统、上市公司季报,以及一些咨询公司发布的市场调研报告进行收集。

      旅游数据仓库:虽然数据挖掘技术已应用于一些旅游企业,但对整个旅游目的地而言,一个综合的系统的集成不同数据源而构建一个中央数据仓库的几乎没有[9]。除了组织部门的限制和隐私问题等,主要原因还在于缺少一个统一的数据仓库模型来对所有的旅游业务过程进行建模[22]。数据仓库为决策支持系统和联机分析应用数据源提供了一个结构化的数据环境,它能将数据转变为信息进而让用户可以使用更多的知识来做出竞争性的决策。数据仓库中的数据是以主题的方式而非应用程序的方式进行组织,所以数据仓库仅仅包含的是决策支持过程中所需要的信息[14]。它能够很好地支持OLAP分析和数据挖掘[23],因此,也是知识型目的地管理平台的基础。

      数据抽取、转换与加载(ETL):由于数据来源于不同的渠道,异质性高,且噪声多,需要通过对数据进行清洗、转换,加工成便于进行分析的形式。而目前一般的商务智能软件都提供这一工具。而对于非结构化数据,可能还需要进一步采用文本挖掘和自然语言处理等方法进行加工处理提取出有用的信息。

      知识生成:在旅游行业利用数据发现知识是从80年代计算机预订系统的普及而积累了大量的游客预订和消费行为数据开始,航空公司则率先通过分析客户数据来进行产品优化。一个著名的例子即是DINAMO系统,1988年由美国航空公司引入的[24]。还有一些例子是需求预测[25]、取消行为预测[26]和游客细分[27]。近几年,数据挖掘在旅游部门变得非常重要,因为它能在大量的数据中发现未知的模式,对比大部分统计方法,它还能处理非线性关系。虽然数据挖掘没有深入地在旅游行业应用,但基本所有主要的数据挖掘技术都已经有所涉及:描述/探索性分析被用于形成报告或OLAP分析[10,15];监督学习方法,比如分类、估计和预测被用于解释游客预订、取消和消费行为,或预测旅游需求。非监督学习方法聚类是数据挖掘技术中应用最多的,主要用于游客细分、动态价格或客户关系管理[28]。随着万维网的应用,Web挖掘在旅游领域也得到了特别的关注,主要包括Web内容挖掘和Web使用挖掘。Web内容挖掘,主要是对旅游在线平台和网站的内容分析(如游客点评网站、博客、微博等社交网络平台),尤其是对用户产生内容的分析(UGC)。所采用的文本挖掘方法主要为基于统计或语义分析的方法,并被应用于反馈聚合、意见挖掘或情绪检测[29-31]。Web使用挖掘是对在线平台或网站的游客行为的分析,通过跟踪用户的浏览行为来发现用户的关注热点及偏好,从而进行游客细分,并应用于网站自适应和产品个性化推荐[32-34];或者使用序列关联规则挖掘进行点击流分析来发现在线用户的浏览和搜索习惯[35]。归纳起来,数据挖掘在旅游业的应用按其功能主要包括五类[36]:自动预测趋势和行为[37]、关联分析[38]、聚类、概念描述[39]、偏差检测。典型的,自动预测趋势和行为的例子即是旅游需求的预测。目前,预测方法有传统的定性定量方法,如德尔菲法、计量经济方法[40]、时间序列方法[41],以及现代的神经网络[42]、粗糙集[43]、模糊理论[44]、灰色理论[44]、支持向量机[45]等。通过比较分析,Law等认为相对于传统的计量经济方法或统计模型方法而言,数据挖掘方法在旅游需求预测上的应用还处于萌芽期,人工神经网络方法是用的最多的一种方法,而且他还得出结论认为没有一种单一的方法能够适用于所有的情形,而神经网络方法则相对于其他预测方法的质量要高[6]。在目前的旅游需求预测文献中,主要是从方法的角度来研究,基本上没有涉及到旅游预测方法在实践中的作用,也没有提到通过旅游需求预测,如何提高旅游目的地的服务水平与供给能力,使需求与供给达到平衡,最大可能地提高旅游目的地的绩效水平。而这一点却是旅游目的地最关心的,也是旅游需求预测的最终目的。

      

      图1 知识型旅游目的地管理平台一般框架

      Fig.1 General Framework of a Knowledgeable Destination

      知识应用:即为知识的表达与可视化。将加工生成的知识通过一定的形式展现给终端用户。根据之前所述对于知识的分类,对于描述性/事实性知识可以通过如OLAP分析、报告、图形等形式加以展现,对于过程性知识还需要由系统通过构建一些模型和方法以不同的形式展现给用户。

      3 基于数据仓库的旅游决策支持与分析平台

      3.1 平台实现架构

      技术框架见图2所示,平台数据源可能来自平面文件以及其他的数据库系统,系统将通过ODBC、OLEDB以及各种数据库自带的连接驱动建立数据源连接,并通过ETL工具对各类异构数据进行清洗、转换并加载到数据仓库中。在Microsoft SQL Server Analysis Service的基础上通过一个前端应用程序接口,利用可视化的操作界面进行数据视图的管理、元数据管理以及OLAP数据库的管理及多维模型的发布。对于数据分析工具,一方面可以利用SQL Server提供的服务进行数据挖掘,另一方面亦可通过API将SPSS/EVIEWS等软件集成到平台中,进行更专业的数据分析。

      3.2 数据来源

      数据源是平台的基础与根源,因此,需要确定平台所需的数据来源与渠道。为了保证数据的权威性、真实性与可获取性,我们重点选取权威机构、社会媒体公开发布的数据,见表1所示。

      3.3 知识展现与应用案例

      知识的生成主要是通过对数据之间的关系进行预分析,以数据仓库的主题为单元进行数据的存储,最终以OLAP分析来实现对知识的展现,让用户可以通过全局的数据视图和灵活的OLAP操作(如切片、钻取、旋转等)对数据进行探索性的分析,最终还可以自动生成分析报告。目前平台设计了以管理驾驶舱、多维分析报表等形式来进行知识展现。其中管理驾驶舱主要是采用仪表盘、即席报表、图表(饼图、趋势线、气泡图、漏斗图、雷达图等)、数字地图等形式来综合反映一些影响旅游市场和经济发展的关键性指标,使旅游管理者可以快速地把握当前发展的现状及趋势,并在发现问题时,可以通过图形、报表之间的钻取操作,找出更深层次的原因。多维分析报表利用OLAP技术,以面向主题的分析帮助用户进行多角度、灵活动态的知识展现。多维分析报表由多个“维度”(影响因素)和“指标”(衡量因素)组成,能够灵活地增删维度、指标的个数,通过对报表进行旋转、钻取等操作,使用户可以以全局的方式综观不同时间维度、地区维度之间的对比,定制指标的度量与计算,从而能够真正为用户所理解、真实反映旅游市场与经济特性信息。

      

      图2 平台技术框架

      Fig.2 Technical Architecture

      

      在实际应用上,我们根据旅游数据的特点及旅游管理者的实际需求进行了知识展现形式的设计。一方面,该平台能为旅游管理者提供一个全局的旅游市场数据视图及强大的市场决策支持功能。管理者很容易就能了解到当前国际入境旅游人数、旅游收入排名前十的国家,中国在去年的旅游市场中排名如何?最近一年的指标同比往年有何变化?当一个国家的旅游局来访中国时,立即搜索出该国家的详细旅游市场信息,如过去几年中国出境到该国家以及该国家到中国旅游的人数、花费情况等。为了便于查询和比对,我们还设计了一种盟国组织的浏览方式,即将盟国组织也作为一个维度。像东盟、金砖五国、欧盟、申根国、二十国集团、环印度洋地区合作联盟、上海合作组织、七十七国集团、南美国家联盟、太平洋共同体、东非共同体等都定义为维度的属性。这样用户即可以以盟国组织的形式来进行查询或数据比对、汇总等,如图3所示。用户可以从属性列表中选择任一盟国组织加入到行区域或列区域进行分析。而且,用户可以使用管理驾驶舱来迅速捕捉一些关键指标和趋势。对用户最有价值的功能就是通过钻取操作来发现数据之间的关系并找出问题的答案。当在饼图上选择某一区域后,即可显示该分区的TOP10(图4),在TOP10柱形图中再双击选择某一国家的柱形,就会出现钻取路径选择列表,进一步查询同该国相关的更明细或其他指标的报表(图5)。

      

      图3 金砖五国的多维浏览报表

      Fig.3 Multi-dimensional Report Viewed by Five Brics

      

      图4 多图联动关系示例

      Fig.4 Example for the Correlation Between Two Charts

      

      图5 驾驶舱的钻取路径分析

      Fig.5 Drill Path Analysis in Management Cockpit

      4 结论与展望

      本文在综述国外相关研究与案例的基础上提出了一个知识型旅游目的地管理平台的一般框架,并基于此框架构建了一个旅游市场与经济的数据仓库及决策分析平台,它将为大数据在旅游业中的应用奠定数据和技术基础。另一方面,在项目的实施过程中,我们发现最大的困难不在于技术层面,而在于需求分析与主题模型的确定,因为原始的数据是零散的,可能分散在多个数据源中,因此需要将零散的数据聚合在一起,使数据变得更有意义;另外,数据源的整理与数据校验亦是一个繁琐的问题,需要将数据整理为便于导入的格式。常规的数据校验可以由ETL完成,但数据本身的错误还需要人工进行发现,为提高数据校验的效率,我们主要是通过核查汇总数据来检验数据的正确性。另外,为了确定数据的来源与统计汇总方式,还要跟发布方(如UNWTO)进行沟通确认。数据的价值不在于数据本身,收集数据固然重要,但还远远不够,其价值还在于通过对数据的加工、重构而使其无限的被再利用,成为有助于人们决策的有用信息产品。因此,基于此平台,我们今后还有很多工作要做。一是要进一步采用数据挖掘工具对已经积累的数据进行分析,如旅游市场细分、旅游需求预测等;二是开展对过程性知识的构建,即通过建立一些模型和方法进行辅助决策。比如,我们将通过构建一些旅游市场景气指数模型、旅游价格指数模型、游客满意度模型等来直观地反映旅游市场与经济等的变化规律;另外,我们目前收集的数据还仅限于统计数据,下一步也希望能收集更多的外部数据源充实到数据仓库的平台中,比如像携程、艺龙、驴妈妈、同程网等旅游交易类网站,去哪儿、酷讯等旅游搜索类网站,以及蜂窝网、到到网、大众点评等旅游点评营销类网站的非结构化数据,这将有利于我们把握在线旅游者的市场需求特点与规律,作为开展旅游电子商务研究的基础,尤其是旅游点评类网站,类似于著名的社交类网站facebook、Twitter等,把旅游者集聚在一起,将对挖掘旅游者深层次需求、开展旅游舆情分析等提供有力的支持。但同时数据的连接、定期更新机制等亦是需要考虑的主要问题。

标签:;  ;  ;  ;  

基于知识的旅游目的地管理平台框架与构建_数据仓库论文
下载Doc文档

猜你喜欢