面向大数据的旅游微观数据信息平台研究,本文主要内容关键词为:数据论文,微观论文,旅游论文,平台论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着互联网的发展,人们生产数据的能力越来越强,传统IT设备以及各种智能终端产生的信息,爆炸性增长的数据充斥整个网络,其中与旅游相关的数据不可计数。学者、旅游管理者和政府部门已越来越重视旅游数据统计工作,结合互联网、大数据、数据挖掘领域的研究已经成为热点。互联网的大数据统计时代已经到来,一批学者开始研究互联网的搜索行为和旅游行为之间的关系。福蒂斯(Fodness)等认为,旅游信息搜索内容能够反映游客的在线信息需求[1]。潘(Pan)等研究游客如何利用网络制定假日旅行计划[2],并通过研究Excite搜索引擎日志后发现有超过一半以上的被调查者将酒店作为第一搜索任务,然后才会转移到交通或者其他活动和旅游吸引物[3]。白智广等从海量的假日旅游信息中进行数据挖掘,研究假日旅游的状态问题[4]2-3。这一系列研究和成果都表明旅游数据的获取和统计需要新的方法和手段。 和以往研究不同的是,本文希望从微观数据统计的角度,结合移动互联网、LBS、数据挖掘等新技术和新理念,研究开发出一种能够直接反映旅游个体行为,特别是消费行为的数据统计平台,以适应大数据时代科学研究与普通游客对旅游信息化的需求。与以往数据统计平台不同的是,该平台直接面对游客个体,而不是旅游接待单位(酒店、旅行社等),使得数据的来源更真实,旅游数据的获取和分析更科学、更有效;通过对获取数据的统计分析,能够掌握游客的行为规律、时空足迹和消费特征,成为智慧化的旅游信息平台。 一 旅游数据统计在国内外的研究与应用 大数据之所以称为大数据,不仅仅因为其量级的庞大,也因为它与其他数据的复杂相关性[5]。游客在旅游行为中产生的数据不仅复杂,而且与其他因素有很大的相关性,这成为旅游大数据研究的先决条件。2012年,DealAngel(http://www.dealangel.com)作为第一个利用大数据分析方法进行酒店比价的搜索引擎获得成功。DealAngel的市场评分以酒店及周边地点的价格数据为依据,参考了网络上超过百万的数据点,为游客提供最划算的酒店信息。目前DealAngel已经被俄罗斯旅游网站One Two Trip收购,成为旗下子公司之一。根据权威的创投互动AngelList社区统计,目前世界上“大数据”概念的旅游企业主要涉及旅行计划网站、旅游照片应用、酒店评价、个性记录和体验分享等各个方面[6]。在旅游以外的各个领域,大数据都在发挥巨大的影响。例如,利用在Twitter上的数据,找到一种让用户可以及时找到全世界相关信息的方法[7];利用大数据对用户进行分类投递广告;在公共交通领域中应用大数据进行智能交通管理[8]。这些信息明确地表明,大数据在旅游中的应用会更深入,也会给旅游行业带来新的变革。 很多学者注意到互联网的重要性。2002年,有学者预见到电子商务将提高旅游业的透明度和工作效率,降低边际成本,从而将对中国旅游市场带来巨大的变革[9]。国内学者也开始注意到旅游数据统计的问题,有学者对旅游的Web数据挖掘和传统市场调查获取的数据进行了对比[10],研究在线搜索行为模式与游客行为的关系[11],对网友在论坛中发布的旅游相关信息、照片进行统计分析来研究旅游者的行为。有学者利用心理学中的认知模型,对旅游网站提供的信息和服务对潜在游客出游决策发挥的作用进行了量化研究[12]。 但是,随着移动互联网的发展,移动端发展的速度令人惊讶。根据艾瑞咨询公布的统计数据,2011年智能移动终端的出货量就超过了PC,所以针对移动端数据源的采集需要得到更大的重视。基于移动端的数据源和Web数据源有以下差异。 (1)移动端数据源更有利于对旅游者进行追踪。LBS(Location-Based Service)的出现最早是为手机用户提供紧急救援服务,有学者专门研究了用移动工具追踪在城市空间内个体行为的方法,并追踪了100起事件后证明城市中的旅游行为是可以被在线检测的[13],现在已经广泛应用于移动端为用户提供地理位置服务,与此同时也产生了大量的地理信息数据。除了可以获取用户的时空行为数据外,手机移动数据中还包括用户的个人信息,管理系统根据手机号码可以得知用户的性别、年龄、收入等信息[14]。 (2)移动端产生的是实时信息。传统旅游者提供的数据是某一个时间断面的旅游者信息,而基于手机定位可获得个体实时移动信息[15]。这一特点让基于手机端产生的数据能够最直接最迅速地反映现实情况。 (3)移动端服务更易于与游客互动。与web相比,手机服务更个人化,游客在旅行过程中也能够便捷地使用。Google地图、Booking Tonight以及旅行翻译官等著名的APP软件已经为大量用户提供了便捷的旅游服务。有理由相信,与旅游信息和数据相关的手机端平台将直接受惠于普通的游客群体。 移动互联网对人们的生活产生了巨大的影响,与旅游相关的手机应用也逐渐广泛,除了各种直接面对游客的旅游攻略、机票酒店预定、旅游资讯发布的手机应用以外,对移动端在景区管理方面也有进一步的研究。RBSim是一款专门用于模拟在室外环境中人类游憩行为软件,研究和管理人员可以在网络上模拟游憩环境中人们的移动,为景区管理提供依据,现在北美和澳洲景区实践使用[16]。基于手机的旅游数据统计分析一直比较罕见,能够被查阅的案例不多。1999年,在日本大阪城堡会议中心,以手机作为数据获取手段,对前来观看相扑表演的100名被访者进行了研究[17];2004年,为了探索手机移动数据在国际旅游市场分析中的作用,在爱沙尼亚对共计1.28亿次来自96个国家的国际漫游通讯行为数据进行了分析[16]。我国有学者利用数码相机拍摄照片时记录下的地理位置信息对游客时空行为进行研究[18];或引入时间地理学和认知供给理论与方法提出了“旅游者时空行为研究理论框架”[19]5-20,为以移动端作为数据源的旅游数据统计和分析提供了理论思路。 二 旅游数据获取中的问题 目前国内旅游统计数据基本上是宏观数据。中国国家旅游局编制的《中国旅游统计年鉴》和中国旅游出版社出版的《中国国内旅游抽样调查资料》中关于游客花费情况的统计数据比较粗略,并且其抽样统计方法也不能真实反映游客的消费情况,这些统计数据存在不同程度的数据造假、项目分类不合理、统计项目过于粗略、抽样样本不足、问卷设计不合理等问题[20]。旅游卫星账户的建立同样需要详细的旅游消费数据。国内学者在研究编制江苏省区域旅游卫星账户(JSTSA)时就发现,目前旅游消费方面的数据主要来自全国范围内统一实施的海外旅游者和国内旅游者抽样调查数据,但现有的旅游者抽样调查中关于旅游消费的调查项目比较简单,不能完全满足JSTSA游客消费核算账户中较细分类水平的旅游消费支出项目研究的需要[21]。比如,《2012中国旅游统计年鉴》中标明2011年江苏省接待入境过夜游客有7373266人次,但在连云港旅游政务网站上公布的《关于2011年江苏入境游客抽样调查情况的通报》表明,该次调查回收问卷数量为1704份,仅占当年游客人次的0.023%[22]。这样的数据量是否能够反映当地游客的真实情况,值得怀疑。旅游数据来源的主要途径是问卷调查、电话访问等形式。虽然调查方法和问卷设计都经过了科学化改良,但是随机采样的方法样本小、调查对象对问卷回答的随意性高、数据获取周期长等问题依然无法解决。 旅游数据统计是一项世界性难题,关于数据获取的方法和理论目前都还在探索之中。数据使用者需要高质量的旅游数据,但是对旅游者个体消费数据的统计遇到了技术上的难题,这就需要我们研究和探索新的数据统计方法和技术。 三 MTIS平台构建 为解决目前旅游数据统计分析中存在的问题,更充分利用移动端数据源的各种优势,我们研究开发出一种创新性的数据获取和分析方法。该方法以互联网为平台,从旅游个体角度获得真实的海量数据,再进行存储与挖掘,为旅游学术研究、旅游营销、旅游管理等领域提供大规模数据存储、处理、挖掘与可视化分析服务;同时也为游客提供相关的旅游信息服务,是旅游信息资源整合的大型互联网服务平台——“基于游客个人行为的旅游微观数据信息平台”(A Microdata Tourism Information System Based on Personal Behaviors),简称为MTIS。 (一)游客个体的数据产生和数据需求 在旅游过程中,数据信息的产生是时时发生,纷繁复杂的。这样的数据产生在每一次游客消费、地点转换等过程中。我们已经确信的是,对于旅游管理机构和旅游学术研究者来说,真实的旅游数据是有价值的,但是对于普通游客来说,他们和旅游数据之间的关系如何呢?本文认为游客与旅游数据之间有三点关联。一是游客产生数据。旅游数据不可能凭空发生,所有数据都是与游客有直接或者间接的联系。二是游客有数据统计需求。对于普通游客来说,“花了多少钱”,“花在哪里”,是他们对旅游数据最基本的统计需求。此外,游客还想了解真实旅游与旅游预算之间的差距,与其他游客花费的比较等等信息。三是旅游数据影响游客的旅游计划。在计划旅游时,游客希望了解的信息尽可能全面详细,包括其他游客的旅行花费、旅行行程安排、同一时间在同一地点的游客人数估计等等,这些信息可以直接影响他们的旅行计划。在游客出行的整个过程中,从出行计划决策、旅游过程中及旅行结束,整个过程游客可时时调整自己的计划,更新自己的数据,也就是说,数据更新是一个动态的过程。 (二)MTIS平台设计方案 基于游客、旅游管理、旅游学术研究等多方面的分析和研究,我们设计出了MTIS平台方案(如图1所示)。平台的构架由三大部分组成。第一部分是用户端服务。其核心是在用户使用中生成统计平台的初始数据,包括自动生成的LBS地理位置数据和用户自己录入的旅游消费数据。游客可以即时掌握自己的消费数据,包括一些简单的统计功能,例如费用记录、分类、对商家的评价等等。第二部分是本地数据解析。在用户生成数据后,根据统计平台的需要,自动将用户使用生成的初始数据进行进一步的整理归类分装,形成统计平台所需的数据内容并上传远端服务器。第三部分是远端统计数据。在远端服务器根据旅游微观数据的统计需求,对数据进行二次分析并存储,一方面形成海量的基础数据库,另一方面根据需求对这些数据进行再次挖掘和分析,形成分析结果,分别提供给游客、景区、旅游管理机构和旅游研究者。 (三)MTIS平台的开发实现 MTIS平台由Client端和Server端组成。Client端通过第三方LBS提供商的API接口,向用户提供基于地理位置信息的用户数据标记及用户间的各种位置互动信息。Client端安装在用户手机中,直接面向用户,由基础模块、用户生成数据模块和用户间交互模块三个部分组成。基础模块针对平台Client端所需技术进行规划整合,为Client端其他模块构建实现基础;用户生成数据模块为总体平台的数据产生部分,直接面向用户,按照用户实际可能产生的需求进行规划设计,平台用户产生的内容及数据通过用户间交互模块进行交互,该模块提供内容及数据的用户间分享,并产出用户间互动所产生的新数据。旅游大数据微数据信息平台的研究_大数据论文
旅游大数据微数据信息平台的研究_大数据论文
下载Doc文档