基于Kohonen网络的城市居民国内旅游需求分类研究,本文主要内容关键词为:城市居民论文,国内旅游论文,需求论文,网络论文,Kohonen论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
旅游业作为一项现代新兴产业,它的出现与发展和城市的发展过程紧密相连。城市居民构成了我国国内旅游的主要群体,在旅游需求规模上居于主体地位。而我国各城市由于区位、经济发展水平、收入状况、文化观念、消费行为习惯等方面的差异,使得不同城市的居民在旅游需求方面也存在差异[1]。将旅游需求差异依据量化指标可以转化为分类问题,通过分类可以更为客观地认识不同城市居民旅游需求存在的差异。从方法的角度讲,长期以来传统的分类方法有系统聚类法、分解法、加入法、动态聚类法、有序样品聚类法、重叠聚类法和模糊聚类法等,但大多数属于监督学习,容易产生人为的主观性[2]。近年来由于人工智能、神经科学的进展,人工神经网络逐步显示出它在处理复杂系统特别是以人为主体领域上的优势。它具有模式识别和分类方面的优势,能够有效提高分类判断的客观性,是解决分类问题行之有效的一类方法[3,4],本文选取其中的自组织特征映射网络来对我国39个城市居民旅游需求进行分类。
1 Kohonen网络基本原理
自组织特征映射网络(Self-Organizing feature Map,简称SOM),又称Kohonen网,是由芬兰学者Teuvo Kohonen于1981年提出的一种无监督学习的神经元网络模型,是目前应用较为广泛的用于聚类的神经网络模型。与传统模式的聚类方法相比,具有自组织功能,网络通过自身训练,自动对输入模式进行分类。
对于外界特定信息所产生的特定兴奋过程是Kohonen网络中竞争机制的生物学基础[5]。生物学意义上的神经元间存在这样一种联结方式:大神经元不但加强自己,同时也加强接近它的那些神经元。一般情况下,随着神经元之间距离的增加,每个神经元加强自身及邻近神经元,并且同时抑制周围的神经元。在一个神经细胞兴奋后,通过它的分支对周围其它神经细胞产生抑制,这种侧抑制使神经细胞之间出现竞争,最终兴奋作用最强的神经细胞所产生的抑制作用战胜了周围所有其他细胞的抑制作用而获胜,其周围的其它细胞则在竞争中失败。Kohonen网络正是基于该生物结构和人脑对信号处理的特点所提出的,它具有抽取输入信号模式特征的能力,从而实现特征相同的神经元在空间分布上的聚集,并将其最终分为不同的类型。
1.1 Kohonen网络结构
Kohonen网络模型由输入层和输出层组成,输入层用于接收输入模式,输入层的各神经元通过权向量将外界信息汇集到输出层的各神经元。输出层也是竞争层,上面分布着离散的神经元,其排列有多种形式,如一维线阵、二维平面和三维栅格阵。其中二维平面组织是Kohonen网最典型的组织方式,下面具体介绍二维网络的结构。
如图1所示,网络上层有输出节点s个,按二维形式排成一个节点矩阵;输入节点位于下方,有n个矢量,即n个节点;所有输入节点到所有输出节点之间都有权值连接,而且在二维平面上的输出节点相互间也可能是局部连接的。
图1 Kohonen网络结构
1.2 Kohonen网络运行过程
Kohonen网络的自组织学习过程是以无监督的网络训练方式进行的。待分类的模式类别属性未知时,网络竞争层中的各神经元通过竞争来获取对输入模式的响应机会,自动对周围环境的模式样本进行学习和调整,直至网络的结构及其连接分布能合理地反映训练样本的统计分布。具体运行过程可以描述为:对于每一个网络输入,只调整一部分权值,使权值矢量更接近或更偏离输入矢量,这一调整过程就是竞争学习。随着不断的训练,所有权值矢量在输入矢量空间分别聚类,形成各自代表输入空间的一类模式,这就是Kohonen网络自组织的聚类功能。
2 城市居民国内旅游需求分类指标选取
出游率是反映居民旅游需求的第一指标[6]。旅游消费水平是从经济和消费偏好方面对旅游需求的一种反映。旅游者停留天数则是从时间的角度反映旅游者的需求状况。而按不同目的的出游人数比例更是详细反映了旅游需求的相关信息[7]。因此,在对城市居民国内旅游需求进行分类时,选择了各城市居民的出游率、人均花费、平均在外停留天数、观光游比例、度假休闲游比例、探亲访友比例、交流旅游比例(商务、会议和文体科技交流三者比例之和)作为分类指标。
本文以国家统计局城市社会经济调查总队调查的39个城市为样本,各指标的原始数据主要取自《中国旅游统计年鉴》[8]和《中国国内旅游抽样调查资料》[9]。
3 构建城市居民国内旅游需求分类的Kohonen网络模型
3.1 网络算法步骤
(1)初始化
(7)令t=t+1,直到t=T,学习模式至此全部提供给网络。
最终,通过训练使得输出层中的获胜神经元g及其邻域内的权值向量逼近于输入矢量,实现模式分类。网络学习结束之后,转入工作状态,连接权值W[,j]不再进行调整。
3.2 模型构建和训练
将经过标准化处理的样本数据加载到所建立的神经网络,即可选取一定的训练参数对其进行学习。设置城市居民旅游需求分类所需的Kohonen网络模型:输入的模式样本数量为39个,根据输入模式样本变量指标数,设输入层神经元数为7个,设竞争层神经元数为6个,由于样本量不是很大,所以选择这样的竞争层是合适的。为了得到较好的分类结果,我们采用如下参数构建Kohonen网络模型(见表1)。Kohonen网络模型的全部算法由Matlab6.5仿真实现[10]。
把样本模式输入Kohonen网络,进行网络权值训练,网络竞争层各神经元竞争对输入模式的响应机会,优胜邻域在训练开始时覆盖整个输出线阵,以后随着训练次数的增加,邻域两端各收缩一个神经元直至邻域内只剩下获胜神经元,同时对那些与获胜神经元有关的各连接权朝着更有利于它竞争的方向调整,这一获胜神经元就表示对输入模式的分类。经过3000步训练,网络各权向量趋于稳定,网络训练终止。再采用距离图法计算每个获胜神经元间的权值距离(见表2),类内距离反映同类城市旅游需求的同质程度,其值越小,同质程度越大;类间距离反映不同类型城市旅游需求的差别,其值越大,差别越大。依据类内距离小于类间距离的原则,经过计算判断样本中39个城市可分为6类,各类所包括的样本见表3。
4 结果分析与讨论
4.1 结果分析
从分类结果及各类重心表(见表4)来分析城市居民旅游需求特征。从表4中可以看出除了类型4的特征不明显外,其他5种类型的城市都各有突出的方面主导了其类型归属。
类型1的城市居民出游率较高,人均花费较少,以观光游和度假休闲游为主,其中度假休闲游比例在各类型城市中所占比例最高,典型的代表城市是西南三市成都、贵阳、昆明,这种度假休闲游以郊区及乡村休闲旅游为主,消费低,属大众型的度假休闲,如成都郊区(县)的“农家乐”就是城市居民度假休闲的例证,说明以大众观光旅游为主体的市场结构正在向个性化的休闲旅游方向发展。
类型2的明显特征,是在所有的类型中,出游率和观光游比例最高,其中出游率远远高于其他类型的城市,人均花费较高,但出游时间最短,说明出游范围较近,主要是因为这4座城市均为我国热点旅游城市,一方面,这些城市本身及周围地区拥有丰富的旅游资源,居民在“家门口”的旅游活动既省时又省钱,自然就会有较高的出游率;另一方面,这些城市国际国内旅游活动开展较早,受多种外来文化的影响较为深刻,居民生活理念和方式多崇尚观光和休闲,因此普遍具有较为强烈的旅游需求。
类型3的城市与其他类型的城市相比,出游率最低,但人均花费较高,以观光游为主,度假休闲游及交流比例较低。在类型3的城市中,济南和青岛出现在同一类型中,此种情况同样出现在类型1中的沈阳和大连,说明省级区域中心城市居民旅游需求存在一定的一致性。
类型4的城市各项指标与其他类型城市相比,均接近全国平均水平,分类特征不甚明显,观光游和探亲访友比例较为接近。在类型4的城市中,东部城市占绝对比例,东部城市的旅游需求市场较西部的更显成熟,呈现出多元化的需求特征。
类型5的城市居民探亲访友比例最高,观光游、度假休闲游、交流为目的的旅游活动所占比例处于中等水平,说明该类型的城市居民旅游需求正在由单一的观光游向多元化旅游形式转变,具有较大的发展潜力。在类型5中包含了东、中、西部的城市,而值得注意的是一些重要的旅游目的地,如无锡、厦门、西安等的城市居民没有表现出特别的旅游偏好和消费。
类型6的城市以高消费为特征,同时出游时间和以交流为目的的旅游比例均处在峰值,该类型的分类特征较为突出。类型6所包括的城市无论是地理位置,还是经济发展规模和程度均具有明显的差异,但是不能排除它们具有同类型特征的表现,长春、哈尔滨、西宁、银川、乌鲁木齐等5个城市的居民国内旅游人均花费偏高,这与其地处边陲旅行交通费用偏高有关,因此人均花费高、停留时间长。
4.2 方法讨论
Kohonen网络是以多个神经元的输出状态来反映分类结果的,所以它的稳定性和抗干扰性都较好。在获胜神经元邻域内的各神经元连接权向量虽略有差别,但这些神经元的分类作用基本上是相同的,即其中任何一个神经元都可以代表分类结果或近似表示分类结果。如果某一个神经元失败,还有其他神经元来表示分类结果,所以它的可靠性较高。由于大多数经济、人文方面的研究很难获得完备的数据集,信息来源可能既不完整又含有假象,传统的聚类方法对所需数据的要求比较严格,因此难以胜任这些工作。而Kohonen网络则能够突破以上障碍,根据学习获得的知识经验对复杂问题做出合理的判断决策。
Kohonen网络的另一大优点是非监督学习客观性大、非线性问题求解能力强,可以避免人工确定每一指标权重的主观性。在Kohonen网络中,输入模式样本数据和事先设定的参数,经过网络自身的训练和学习,无须人为干涉,就能得到最终的聚类结果。但由于Kohonen网络的参数设计还没有一个成熟的标准,需要操作者根据实际情况加以判别、选择。同时,指标体系的合理选择和规范,样本的足量参与以及分类模式的确定也是网络分类成功的关键所在。
收稿日期:2006-08-14
标签:聚类论文;