改进PSO算法优化LSSVM模型的短期客流量预测
陆文星1,2,李 楚1
1.合肥工业大学 管理学院,合肥230009
2.智能决策与信息系统技术教育部工程研究中心,合肥230009
摘 要: 旅游客流量的准确预测为旅游目的地资源优化配置、景区战略计划制定提供有效依据。为了提高景区日客流量的预测精度,提出基于改进粒子群算法(Particle Swarm Optimization,PSO)优化最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)的预测方法,针对PSO算法的惯性权重在采取线性递减策略时不能满足粒子寻优非线性变化的缺陷,从种群中粒子的聚合程度以及种群进化中粒子适应度同惯性权重的关系出发,利用对数函数非线性变化的特性,提出基于对数函数的惯性权重自适应调整方法(Adaptive Logarithmic Particle Swarm Optimization,ALPSO)。通过改进的PSO算法优化LSSVM的参数,建立山岳型风景区日客流量的预测模型。以黄山风景区2012—2015年景区每日上山人数为例,实验结果证明,与基于标准PSO算法、正弦粒子群算法(Sinusoidal Particle Swarm Optimization,SPSO)和高斯粒子群算法(Gaussian Particle Swarm Optimization,GPSO)优化的LSSVM模型相比,ALPSO-LSSVM模型的预测性能更好,是准确预测景区日客流量的有效方法。
关键词: 粒子群算法;惯性权重;最小二乘支持向量机;客流量预测
1 引言
近年来,山岳型风景区客流量经常处于饱和状态,原因在于其独特的自然和人文景观吸引了大批游客前去观望,由此山岳型风景区成为人们出去游玩的目的地的首要之选。较高的客流量对风景区的各项工作安排带来了严峻考验。准确的客流量预测,尤其是短期客流量的准确预测可以为景区管理者提前制定工作计划和科学做出工作决策提供依据,从而提升景区目的地的服务。在短期客流量预测的研究中,与今日客流量预测相比,明日客流量的准确预测有助于景区管理者提前预知游客的规模,从而指导景区物资的合理使用、人员的科学调配以及景区交通运输规划的正确制定。因此,明日客流量的预测更加具有研究意义。
景区客流量样本呈现出复杂非线性的特征,景区明日客流量的变化同各影响因素之间的关系很难用简单的数学模型进行描述。早期的客流量预测方法主要是传统的时间序列预测方法,如指数平滑模型[1]、时间序列模型(ARMA、ARIMA)[2-3]等,这些模型缺少对样本学习的过程,难以实现对客流量的准确预测。随着机器学习理论的深入推进,一些新的智能算法在电力、交通等短期非线性性序列预测中得到了大量应用,如BP 神经网络[4]、支持向量机(SVM)[5]等。其中SVM以结构风险最小化为原则,适用于解决小样本、非线性、高维数等问题。但是SVM 在解决问题时运行速度较慢、模型求解效率较低。LSSVM是在SVM的基础之上进行改进,在数学原理上,LSSVM用等式约束替代SVM的不等式约束,使得LSSVM 在保留SVM 求解非线性、小样本等优点的同时,加快模型的求解速度,进而提高了算法运行效率。但是对于LSSVM 模型而言,惩罚函数γ 以及核函数参数σ 的选取尤为重要[6]。因此,提高LSSVM的预测性能关键在于选择合适的模型参数。如张文兴等[7]提出一种基于核极化梯度的特征选择的方法,通过选取最优的特征子集训练得到最优的参数,有效提高了LSSVM的算法的性能;江燕等[8]提出核主成分分析(KPCA)的方法,将提取的新的主成分样本输入LSSVM模型中,有效提高了LSSVM核函数参数的性能。这些方法均主要集中于数据预处理方面,通过样本的选取进而优化模型参数。除此之外,陈磊[9]采用遗传算法(GA)优化LSSVM参数,预测城市的用水量,虽然在一定程度上提高了LSSVM 模型的预测能力,但是GA 算法参数比较多,实现步骤较为复杂,且参数的选择对算法的寻优品质具有较大的影响。
PSO算法是由Kennedy和Eberhart提出的一种启发式算法,由于其具有简单容易理解、参数较少便于实现、收敛速度快、全局搜索能力强、适用于解决非线性问题等优点[10-11],在交通运输、地质工程[12]、电力预测[13]、模式分类[14]等领域得到了广泛应用。由此也证明PSO 算法适用于解决模型参数寻优的问题。但是标准PSO 算法易早熟收敛,陷入局部最优的问题,针对这一缺陷,许多研究根据PSO 算法的特点提出很多改进算法,如Yadav 等[15]在种群初始化策略上做出改进,提出一种正交初始化策略,增强粒子的寻优能力;石松等[16]提出PSO算法的拓扑结构是影响算法性能发挥的关键因素,进而提出一种层次环形拓扑结构的动态粒子群算法,并与其他几种基准算法进行对比,验证了所改进算法的有效性;Liu 等[17]比较分析了四种典型的惯性权重调整策略,并通过实验验证了正确的参数选择方法对算法的性能发挥具有至关重要的作用;Garg[18]提出PSO 与GA 混合的方法,用以解决约束类的优化问题,并且利用实验证明了方法的优越性。
上文中所介绍的改进粒子群算法虽然从不同方面对标准PSO算法进行了改进,但是改进策略存在一定的复杂性,为了进一步提高算法的求解精度,本文提出一种惯性权重动态调整的策略,即:利用常用的对数函数,依据迭代中种群适应度方差的差异以及粒子适应度值的大小对粒子的惯性权重进行自适应调整,并利用改进的粒子群算法来优化LSSVM 参数,并通过实例验证其可行性。
2 ALPSO-LSSVM原理
2.1 LSSVM原理
LSSVM将SVM中的不等式约束转化为等式约束,在采用误差平方和损失函数代替SVM的二次规划方法的基础上将二次规划问题转化为线性矩阵求解问题。具体原理如下:
给定一组数据集(xi,yi)i=1,2,…,N,xj 为第j 个样本的输入向量,yj 为对应的输出,N 为数据集所包含的样本数,通过非线性映射φ(x)将样本映射到高维空间。
其中,w 为权值向量,b 偏置向量。
1.2方法采用飞利浦iE33型彩色多普勒超声诊断仪和飞利浦EPIQ 7C,探头频率S8-3和S5-1,患儿镇静、安静状态下平卧扫查,经心底大动脉短轴切面,左室长轴切面,四腔心切面,胸骨上窝主动脉弓长轴、短轴切面,以及剑突下翻转的,左、右室流出道长轴切面,心室短轴等多个切面扫查,先对心脏进行全方位观察。
按照结构最小化原理,LSSVM模型可表示为:
其中γ 为大于0的惩罚系数,ξj为误差。在求解该最小化问题时,加入一个拉格朗日乘子λj,构成拉格朗日函数,并利用KKT条件,LSSVM模型转化为:
4.2.1 数据收集
2.2 标准PSO算法
PSO 算法的运行过程为:算法初始时期在D 维搜索空间中首先随机初始化n 个粒子,经过k 次迭代,粒子j 的位置为,以一定的速度在搜索空间中移动,粒子j 依据当前的速度追踪个体极值plbest和群体极值pgbest,然后进行种群的更新。在每一次迭代中,根据式(4)、式(5)粒子j 的速度和位置可更新为:
其中,为第j 个粒子第k 次迭代时在第d 维搜索空间中的速度,w 为惯性权重,c1,c2 为加速因子,rand 和Rand 为[0,1]的随机数,plbest 为第j 个粒子在第k 次迭代时历史最优位置,pgbest 为第k 次迭代时群体的历史最优位置。
2.3 ALPSO算法原理
标准PSO 算法中,随着种群迭代次数的增加,种群的多样性减小,粒子易陷入早熟收敛。文献[19]提出,依据种群适应度方差值的大小可以判别种群当前是否进入早熟,当种群适应度的方差小于某一阈值β 时,即可认为种群进入早熟收敛的状态。其定义的种群适应度方差为:
南方公司2018年8月宣布项目估计造价增加超过20亿美元,因此项目业主在9月底就该项目的未来进行投票表决。
能源消费增长的同时,能源转型持续推进。前三季度,水电、核电、风电、太阳能发电等清洁能源发电装机合计占总装机的36.4%,比去年同期提高1.4个百分点;清洁能源发电量同比增长8.9%,高于火电增速2.0个百分点。
但是文献[19]对于β 的合理取值并没有规定一个标准。此外,文献[20]提出当粒子发生早熟现象时,在连续的迭代中,σ2会保持一个相对稳定的状态。即,如果相邻迭代中σ2的差异很小(如小于eps=10-6),则可以认为种群进入早熟收敛的状态,需要对粒子进行扰动,增大种群的多样性,跳出局部最优点。
其次,PSO 算法中,惯性权重的设置决定了粒子的探索和搜索能力,对算法性能的发挥起到至关重要的作用。通过对w 的调整可以调节粒子全局搜索和局部搜索的能力的大小,达到二者平衡。若w 较大,则粒子的全局搜索能力强,反之,粒子的局部搜索能力强。惯性权重的设置通常采取随着迭代次数的增加在某个区间内线性递减的策略,计算公式如下:
其中wmax和wmin 分别为惯性权重的上限和下限,k 为当前迭代次数,maxgen 为最大迭代次数。
图3~图6表示各测试函数迭代优化的过程中,种群最优收敛值变化曲线的对比,横坐标代表迭代次数,纵坐标代表每次迭代所寻找的种群最优值取以10为底的对数。通过分析各图可得,对于所选择的4 个测试函数,ALPSO算法在迭代前期种群的多样性相对较高时,种群最优值仍保持一个相对较快的下降过程,这是因为粒子的惯性权重依据适应度值大小进行动态的调整,提高了种群的收敛速度。其次,在算法的中后期,粒子仍然保持较好的性能,能够有效地避免陷入早熟收敛的状态,找到更优的全局收敛值,原因在于随着迭代次数的增加,种群的多样性逐步减小,依据种群适应度方差的差异动态的调整粒子的惯性权重,使得粒子在进入早熟时,较大的惯性权重有利于突破局部最优的束缚,重新进入全局搜索的状态。
为了解决惯性权重采取线性递减的策略所带来的弊端,很多学者对惯性权重的非线性变化进行了相关研究,如文献[22]提出惯性权重随着迭代系数的增加按照某种非线性函数进行动态非线性调整的策略。常用的非线性函数有指数函数、三角函数、对数函数等,如文献[23]提出GPSO 算法,利用高斯函数实现惯性权重的非线性调整,惯性权重定义如下:
4.2.2 数据预处理
文献[24]提出一种惯性权重正弦调整的粒子群算法SPSO,惯性权重定义如下:
此外,刘文婧等[25]针对迭代后期粒子收敛速度较慢的问题,提出一种非线性递减指数的惯性权重取值方法;温黎茗等[26]利用Sin函数非线性变化的特征,进而提出一种惯性权重先增后减的自适应调整方法;罗华[27]引入聚集距离的概念,融合种群迭代次数,对惯性权重的自适应调整进行引导;黄利[28]引入种群进化速度和种群聚合度两个因子,考虑Sigmoid函数非线性变化的特征,提出一种基于Sigmoid函数的惯性权重动态调整的策略。
上述算法对种群中粒子的惯性权重均依靠某种方法实现了动态调整,满足了粒子非线性寻优的需求,但是这些非线性调整的策略与种群的迭代次数相关,使得在同一进化阶段的粒子具有相同大小的惯性权重,如上述所提的GPSO、SPSO 算法,在算法初期,赋予粒子较大的惯性权重,使之全局搜索的能力较强,算法后期,粒子被赋予较小的惯性权重,使之局部搜索能力较强,但是这种惯性权重逐步减小的策略会导致算法性能上的不足:首先,若在迭代早期粒子定位到了群体最优值某领域内,但是此时粒子的惯性权值较大,全局搜索能力较强,而局部搜索能力偏弱,粒子不能在所定位的群体最优值的领域范围内进行细致的搜索,从而减慢了粒子的收敛速度。其次,在算法迭代的后期,由于粒子的惯性权值较小,局部搜索能力较强,全局搜索能力较弱,使得粒子的搜索局限于目前所搜索到的局部最优值的周边区域,当种群的群体最优位置经过若干次迭代仍然不变时,由于粒子没有足够大的速度突破局部最优值的限制进入新的搜索空间中重新搜索最优解,种群就会陷入局部最优。针对以上研究不足,本文考虑种群适应度方差,提出一种惯性权重自适应调整的方法。在统计学中,对数函数可以表示为:
首先,前文提到,当惯性权重服从非线性变换时,粒子表现较优的性能。其次,粒子适应度值的大小反映了粒子当前位置的优劣程度。在最小化问题中,粒子适应度值越小,则表示当前位置较优。因此,本文依据粒子适应度值的大小,考虑相邻迭代种群适应度方差的差异,结合对数函数的表达式,提出一种惯性权重自适应调整的策略,即:
传染性法氏囊病毒主要对3~8周龄的雏鸡造成严重危害,育成后的鸡和14周龄的育雏鸡,通常感染该种病毒后,不会表现出明显的临床症状。鸡传染性法氏囊病一年四季均可发生,没有典型的季节性,但在每年的夏季流行最为严重。随着养殖数量的增加,该种疾病发生新的变化,呈现新的流行特点,发现鸡的日龄有所提前和延后,日龄较高的鸡群患该种疾病的概率增加。由于鸡传染性法氏囊病属于一种接触性、免疫抑制性传染性疾病,因此,需掌握鸡传染性法氏囊病的流行特点,并采取针对性措施进行防治。
式中w 的值随着相邻迭代中种群适应度方差的变化以及粒子适应度值的变化进行动态调整,若相邻迭代中σ2的差异较大时,可以认为当前粒子群在搜索空间中的分布较为松散,为了加快粒子收敛的速度,应该赋予种群中粒子以较小的惯性权重,加快粒子局部搜索的能力,快速定位最优解的位置。但是单纯赋予粒子以最小惯性权重无法满足种群中粒子的权重与种群的多样性密切相关的特性,对于求解极小化的问题,当种群中粒子的适应度值大于种群的平均适应度时,表示这部分粒子当前所处的位置不在最优解的领域范围内,此时应该赋予粒子适当大的惯性权重,加快粒子的全局搜索能力,重新定位最优解;当种群中粒子的适应度值小于种群的平均适应度时,由于粒子具有学习最优的特性,应该赋予适应度值小的粒子以较小的惯性权重,加强粒子局部搜索的能力,快速找到最优解。反之,当相邻迭代中种群适应度方差的差异极小,种群可能陷入早熟收敛,为了调整陷入局部最优的状态,重新寻找最优解,需要对种群中的粒子加以扰动,增加种群的多样性。对于适应度值较大的粒子,应该赋予较大的惯性权重,增加粒子的全局搜索能力,重新定位最优解的范围;对于具有较小适应度值的粒子,在增大全局搜索能力的同时,适当增加粒子的局部搜索能力,有利于快速找到最优解。这种惯性权重自适应调整的方法,与上述所提到的改进的粒子群算法相比,一方面使得处于同一阶段的粒子具有不同的惯性权值,在进化的初期,惯性权重随着粒子适应度值的变化动态的调整,此时适应度值较小的粒子取得的惯性权值也较小,从而有利于增加粒子局部搜索的能力,加速种群的收敛;同理,在进化的后期,粒子也有机会取得较大的惯性权值,进而获得较大的速度,冲破当前最优解的束缚,提高算法收敛的精度。另一方面,当算法经过一定次数的迭代进化后,往往会有大量的粒子聚集在群体最优经验位置的附近,此时这部分粒子的适应度值也极其的接近,因此粒子惯性权值也很接近。单纯依靠种群适应度值调节粒子的惯性权重并不能增加种群的多样性,引入相邻迭代种群适应度方差的差异对权重的调节进行引导,使得适应度值接近的粒子取得的惯性权重也是不同的,增加了种群的多样性,避免粒子提前进入早熟状态。
3 ALPSO-LSSVM预测算法
基于对数函数的惯性权重动态变化的粒子群算法优化LSSVM的主要思想是:利用PSO算法调整LSSVM的参数。即,将寻找到的全局位置传递给LSSVM 的γ和σ 参数进行计算;将LSSVM 的均方误差作为PSO 算法的适应度值,以此为依据进行种群的更新。具体算法流程如下:
步骤 1 初始化PSO的各参数:种群规模、最大进化次数、加速因子、惯性权重上下限、初始速度和位置等。
其中,wmax和wmin 分别为w 的上限和下限;f 为第k+1 代第j 个粒子的适应度值;为种群当前的平均适应度值; 为k+1 代种群的适应度方差;μ 为极小值。
步骤 2 定义LSSVM 的相关参数,将粒子的初始位置传递给LSSVM的γ 和σ 参数,作为LSSVM的初始参数,然后训练模型,以测试集的均方误差作为粒子的初始适应度值f,计算种群的平均适应度fˉ并寻找初始和初始pgbest。
步骤 3 根据式(11)计算惯性权重。
步骤 4 根据式(4)和式(5)进行粒子的速度和位置的更新,并判断更新后的速度和位置是否超过设定的界限,如果vjd=vmax,xjd>xmax则vjd=vmax,xjd=xmax;如果vjd<vmin,xjd<xmin则vjd=vmin,xjd=xmin。
图1 ALPSO-LSSVM预测模型流程图
表1 标准测试函数
步骤 5 重新计算粒子的适应度值,并进行plbest和pgbest更新。如果粒子当前位置的适应度值优于plbest,则将plbest更新为当前的适应度值。如果粒子当前的适应度值优于pgbest,则将pgbest更新为当前的适应度值。
做好购置程序的严格控制,针对耗资巨大的机械设备需要建立专门的审批制度对其进行控制。以保证机械在运转过程中产生故障时能够及时和生产商协商解决。此外,还要将日常检修工作和维护工作放在工作的首位,通过信息化技术的应用建立计算机检测机制,对机械设备进行实时监控,保证机械设备的运转正常。
一般而言,确定某个事象概念需要诉诸逻辑学中演绎、归纳等方法。一个概念的完整界定分为内涵和外延。前者是指某个概念所含括的思维对象的特有属性总和;后者是指该概念所含括的思维对象的数量或范围。二者的关系为,内涵越大越丰富,相应的外延则越小,反之亦然。人们在对世界的认识中,将事物、事件或事实划分成类和属,并确定它们之间的包含关系和排斥关系。根据逻辑学中“类层级结构”思维:任何事物都是世界事物结构中某一层级某一类中的一个单体。人脑在按照内涵、外延的“亲和性”层级归属进行分类建构的同时,还要依据它们之间历史运动的关系。
步骤 6 判断是否符合迭代停止的条件,若符合,输出并记录全局最优解。若不符合,则返回步骤3,直到找出全局最优解。
步骤 7 将寻找到的全局最优解输入LSSVM,重新训练预测。具体预测流程如图1所示。
4 实验分析
4.1 ALPSO算法性能测试
为了更好地观察ALPSO 算法的寻优能力,采用以下几种测试函数对文中所提到的标准PSO 算法,GPSO算法、SPSO算法以及本文所提出的ALPSO算法进行性能对比评价。其中,f1,f2为单峰高维函数,f3,f4 为多峰高维函数,表1 给出了这些测试函数的取值范围,最优位置以及最优值。
在测试中,为了验证本文所提出的算法,在粒子搜索前期能够快速锁定最优解的范围,加快粒子收敛的速度;在搜索后期,能够扩大粒子搜索的范围,避免陷入局部最优,采用ALPSO 算法及标准PSO 算法求解上述最小化问题,并记录两种算法在运行过程中粒子分布的情况,以求解Sphere函数为例,结果如图2(a)和(b)所示。
图2中(a)和(b)分别表示在迭代至第25代和第150代时两种算法搜索过程中粒子分布情况。从图2 中可以看出,在求解最优化问题中,首先,ALPSO 算法无论在粒子搜索前期还是中后期相比标准PSO 算法能够产生一个更广阔的搜索范围,说明ALPSO 算法种群的多样性较高,具有较强的突破局部最优的能力;其次,ALPSO 算法同标准PSO 算法比较,在搜索过程中有更多的粒子聚集在最优解的周围,说明ALPSO 算法能够快速锁定最优解的范围,收敛能力较强。
图2 ALPSO和PSO搜索过程中粒子分布情况
通过粒子在搜索过程中的分布图可以看出ALPSO算法表现出较高的种群多样性及收敛能力,为了进一步验证所提算法的性能,本文利用上文中所提到的4种算法对每个标准测试函数均进行50 次测试实验,粒子群算法参数设置如下:学习因子c1=c2=2,种群规模N=20,粒子维数sizepop=30,最大迭代次数maxgen=300。最终实验结果如表2所示。
表2 标准测试函数结果比较
从表2中的对比结果可以看出,ALPSO、GPSO、SPSO相比标准PSO算法性能更优,证明当惯性权重服从非线性变化时,粒子表现出较好的寻优能力;其次,本文所提出的ALPSO 算法较另外3 种方法来说平均收敛值最小,并且最优收敛值更接近于测试函数的最优值,说明ALPSO 算法能有效避免粒子陷入早熟的状态,跳出局部最优的能力更为突出。
这种线性递减的方法在初期阶段的值比较大,此时粒子的全局搜索能力比较强,而局部搜索能力较弱,有利于快速定位最优解的大致位置。然而随着迭代次数的增加,w 的值逐渐减小,后期种群收敛速度较慢,粒子局部搜索的能力较强,而全局搜索的能力较弱,由于粒子具有只向自身最好飞行位置和种群中最好粒子的飞行位置学习的特性,使得算法容易出现早熟现象。而且单纯地依靠线性变换,粒子的权重无法依靠种群的多样性精确地调节[21]。
图3 Sphere函数寻优过程比较
图4 Quadric函数寻优过程比较
图5 Ackley函数寻优过程比较
图6 Girewank函数寻优过程比较
4.2 实例研究
本文以我国黄山风景区为例进行实证研究,验证所提模型的可行性。黄山作为我国重要山岳型风景区之一,其独特的山岳景观吸引了大批的国内外游客,较高的游客增长率在促进地区旅游业蓬勃发展的同时也给景区的旅游管理和工作安排带来了诸多问题,如节假日、平常日的周末期间人数较多出现景点饱和,平常日的工作日期间人数较少出现人员、物资的浪费。因此,日客流量的准确预测对于管理者科学安排风景区内的工作具有至关重要的作用,尤其是平常日期间明日客流量的准确预测对于管理者提前预知游客的规模,合理调配景区人员、物资意义重大。
其中K(xi,xj)=φ(xi)T·φ(xj)为满足Mercer条件的核函数。
本文选取黄山风景区2012—2015 年客流量每日上山人数作为原始数据,共1 343个数据,将数据集分为训练集和测试集。需要指出的是数据集中仅包含平常日的数据,不包含法定节假日的数据,原因在于节假日期间每日上山人数一般均保持在较高水平,需要安排大量的人力、物质资源,而平常日的工作日期间,每日上山人数较少,因此明日客流量的预测有利于减少人员、物资的浪费。利用SPSS软件对历史客流量序列进行相关性分析,筛选出与明日客流量“y”相关性最大的三个变量,即今日客流量“x1”、上周同期明日客流量“x2”和去年同期明日客流量“x3”作为模型的输入变量。预测模型函数可表示为y=f(x1,x2,x3)。
为让团场居民文化生活更加充实,该团精心打造农家书星、“百日文化广场”等平台,利用团连骨干文化队伍,吸纳文艺爱好者,开展文化惠民演出、文化志愿服务等活动,以脱贫政策、脱致富典型事迹、移风易俗等为素材,编排群众喜闻乐见的舞蹈、小品、快板等文艺节自,不仅为各族群众送文化服务,更为各族群众种下了文化种子。□
低噪声放大器选用飞利浦的BGA2001,它是一款可应用于低电压情况的单片微波集成放大器,最大电源电压为4.5 V;在1~1.6 GHz频段内,即包含卫星导航信号的工作频段内,增益高达20 dB,噪声系数低至1.3 dB。图2是设计的低噪放电路。
(3)同一试验点同一作物同一试验类别播种垄数应一致。个别试验点垄距,垄长不一致,垄不直,还有出现楔子垄的现象。有的试验点步道是斜的,小区是平行四边形,可以用勾股定理来确定直角。
为了降低模型的预测误差,需要事先对原始数据序列进行处理。本文使用的归一化方法是基于MATLAB的mapminmax函数,具体公式如下:
其中y 为归一化后的数据,x 为归一化前的数据,xmax、xmin为序列中的变量的最大值和最小值,ymax和ymin为归一化的上限和下限,本文取ymax=1,ymin=0。
This manuscript deals with questionnaire survey on super-extended lymphnode dissection in patients with AGC. The conclusion of this manuscript seems to agree with the general consensus of current Japanese surgical oncologists,and could be acceptable for publication.
4.2.3 评价标准
本文实验以平均绝对百分比误差(MAPE)作为度量模型优劣的标准。当MAPE的值较小时,模型表现出较优的预测性能;反之,则差。具体计算公式如下:
其中,n 表示测试集样本总数,y^i为预测值,yi为实际值。
4.2.4 模型分析
式中,σ2 表示第k 次迭代种群的适应度方差,sizepop为种群中粒子的数目,f 是归一化因子,为了限制σ2的大小。
本文以Matlab2010(b)为仿真平台,根据实验需求,以黄山风景区2012—2014 年平常日数据集为训练集,2015年平常日数据为测试集,将上述数据归一化至[0,1]区间内,整个输入向量为3×1 343的矩阵。实验将PSOLSSVM、SPSO-LSSVM、GPSO-LSSVM模型作为ALPSOLSSVM 模型的对比方法。经过反复的调试,最终将模型的参数设置如下:粒子维数sizepop=50;种群迭代次数maxgen=150;惯性权重w 的取值范围为[0.3,0.8];参数γ 的取值范围为[0.1,100];σ 的取值范围为[0.01,1 000];学习因子c1=2,c2=2;μ=10-6;因初始粒子不存在上一代粒子适应度方差,所以在第一代粒子权重变更时只基于粒子适应度的比较。各模型下每个月的MAPE值如表3所示。
大规模的水利工程建设,如果工程现场缺乏专业技术督导人员进行现场监督、指导、管理,就容易出现问题。主要表现在不合格的建筑材料进入施工现场、施工单元质量不符合要求;施工过程中出现设计图纸与施工特性不匹配,施工人员擅自修改设计方案施工,造成后期设计图纸与前期完工工程严重不匹配等。
表3 各模型预测结果对比%
通过分析表3可以看出:
(1)从预测结果的分析可知,采用PSO-LSSVM 模型进行预测的最大预测误差为40.53%。黄山作为国家重点山岳型风景区之一,一般4月至10月为黄山旅游的旺季,1月至3月、11月和12月为旅游的淡季[29]。从各个月份的平均预测误差来看,采用PSO-LSSVM 模型,虽然总体上4月至10月各个月份的预测误差比1月至3月、11月和12月的预测误差低,但是对于5月份作为黄山旅游的旺季月份之一,预测误差仍达到35.28%,采用PSOLSSVM 模型进行预测时,PSO 算法的惯性权重采用的是随着迭代次数的增加线性递减策略,粒子的多样性随着迭代次数的增加逐渐降低,导致粒子陷入局部最优,从而导致预测模型预测误差较大。
(2)通过分析预测结果可知,SPSO-LSSVM 模型和GPSO-LSSVM模型预测结果基本接近,相比PSO-LSSVM模型,虽然年MAPE 有所降低,但是误差减少效果并不明显,模型的最大预测误差基本没有降低。从各个月份的预测误差角度来看,首先,SPSO-LSSVM 模型以及GPSO-LSSVM 模型同PSO-LSSVM 模型相比3 月份预测误差明显降低,原因在于SPSO算法、GPSO算法的惯性权重均采用随着迭代次数的增加非线性变化的策略,确保了粒子之间的差异,增大了种群的多样性,提高了模型的预测精度;其次,4 月至10 月各个月份的预测误差总体上仍比1 月至3 月、11 月和12 月的预测误差低。但是对于5 月份的预测误差仍达到32.83%、32.84%,虽然相比较PSO-LSSVM 模型,5 月份的预测误差虽有一定程度的降低,但是在旅游旺季,景区每日上山人数较多,较大的预测误差不利于景区工作的安排。
表4 不同算法下预测结果的比较%
(3)从ALPSO-LSSVM 模型的预测结果可以得出,ALPSO-LSSVM模型同其余三个模型相比,最大MAPE有一定程度的降低。从各个月份的预测误差分析,4月至10月各个月份的预测误差总体上比于1月至3月、11月和12 月的预测误差低,且对于预测误差较大的5 月份,ALPSO-LSSVM 模型的预测误差明显降低。黄山旅游旺季的月份的平均误差在20%左右,在旅游旺季准确的客流量预测有利于景区管理人员科学调度景区人员、物资资源,制定交通规划。对各模型年MAPE 进行统计,结果如表4所示。
从表4可以看出:
海上风电场真空断路器投入并联电抗器的过电压及防护//周文婷,唐文虎,辛妍丽,周九江,吴青华//(3):77
(1)SPSO-LSSVM、GPSO-LSSVM 模型的MAPE 值低于PSO-LSSVM 模型,说明SPSO、GPSO 算法惯性权重非线性调整的策略一定程度上克服了标准PSO 算法惯性权重采用线性递减策略时种群多样性降低,出现早熟收敛的现象,但是SPSO-LSSVM 模型以及GPSOLSSSVM 模型的预测误差同PSO-LSSVM 相比降低的并不明显,原因可能在于w 的变化同迭代次数有关,使得同一阶段的粒子所具有的惯性权值一样。迭代前期,粒子的惯性权重较大,粒子没有机会取得较小的惯性权值,局部搜索能力较弱;迭代后期,惯性权重较小,全局搜索能力较弱,无法突破当前经验最优解的束缚,重新扩大搜索空间,寻找新的最优解。
(2)ALPSO-LSSVM模型的MAPE值明显低于对比模型。ALPSO-LSSVM 模型同SPSO-LSSVM 模型以及GPSO-LSSVM模型相比,预测误差降低较为明显,说明ALPSO算法依据粒子适应度大小以及种群方差的差异非线性调整惯性权重的策略,满足了依靠种群多样性进行精确调节的需求,是进行模型参数寻优的有效方法。
通过建设生态城市,可以对生态环境进行有效的改善,因此要加强环境工程建设技术的应用水平与效果,将二者互相结合,才能加强生态城市的建设质量与效率,为人们的生活环境提供保护,最终促进我国的整体经济获得进一步发展。
综上,实验结果证明ALPSO-LSSVM模型同传统的PSO-LSSVM模型、SPSO-LSSVM模型以及GPSO-LSSVM模型相比更能有效地提高明日客流量预测的精度,说明ALPSO算法能有效地解决PSO算法的惯性权重在采用与迭代次数相关的策略时无法依靠种群的多样性进行精确调节的需求,提高LSSVM模型的预测性能,尤其在旅游旺季预测(4月至10月),ALPSO-LSSVM模型的预测效果更稳健。
5 结论
明日客流量预测作为短期客流量预测中的一部分,其预测精度的提升对于景区科学制定交通规划,合理安排调度景区的人员、物资具有重要意义。为了提升景区明日客流量的预测精度,本文在分析山岳型景区日客流量变化具有复杂非线性特点的基础上,针对标准PSO算法容易出现过早收敛,陷入局部极小的缺陷以及其他惯性权重依靠迭代次数非线性变化无法满足依靠种群多样性精确调节的缺陷,提出一种基于对数函数的惯性权重自适应调整的粒子群算法(ALPSO)同LSSVM算相结合的山岳型风景区日客流量预测模型(ALPSO-LSSVM),利用对数函数非线性分布的特点,将惯性权重的调整同粒子适应度的变化以及种群适应度方差的差异相结合,一方面确保了粒子之间的差异,增大了种群的多样性,另一方面引入种群适应度方差的差异对惯性权重的调节进行精确的引导,提高了算法的性能。利用改进的PSO 算法优化LSSVM 模型的参数,以黄山风景区2012—2015 年每日上山人数为例,实验结果证明:同PSO-LSSSVM、SPSO-LSSVM 以及GPSO-LSSVM 模型相比,ALPSO-LSSVM 模型的鲁棒性和预测精度更高,验证了ALPSO 算法参数寻优的有效性和可行性,说明ALPSO-LSSVM 是准确预测景区日客流量的有效方法。ALPSO-LSSVM 模型虽然整体降低了明日客流量的预测误差,但是在淡季各个月份的预测误差仍然比较高,如何提高景区淡季明日客流量预测的精度是下一步研究的重点。
参考文献:
[1]Corberán-Vallet A,Bermúdez J D,Vercher E.Forecasting correlated time series with exponential smoothing models[J].International Journal of Forecasting,2011,27(2):252-265.
[2]Chu F L.Forecasting tourism demand with ARMA-based methods[J].Tourism Management,2009,30(5):740-751.
[3]Al-Musaylh M S,Deo R C,Adamowski J F,et al.Shortterm electricity demand forecasting with MARS,SVR and ARIMA models using aggregated demand data in Queensland,Australia[J].Advanced Engineering Informatics,2018,35(C):1-16.
[4]Guo Z H,Wu J,Lu H Y,et al.A case study on a hybrid wind speed forecasting method using BP neural network[J].Knowledge-Based Systems,2011,24(7):1048-1056.
[5]Malvoni M,Giorgi M G D,Congedo P M.Data on Support Vector Machines(SVM)model to forecast photovoltaic power[J].Data in Brief,2016,9(C):13-16.
[6]Xue X,Xiao M.Deformation evaluation on surrounding rocks of underground caverns based on PSO-LSSVM[J].Tunnelling&Underground Space Technology,2017,69:171-181.
[7]张文兴,陈肖洁.基于核极化的特征选择在LSSVM 的应用[J].计算机工程与应用,2017,53(19):164-167.
[8]江燕,帅仁俊,张姝,等.基于KPCA-LSSVM的健康档案空腹血糖水平预测研究[J].计算机工程与应用,2018,54(13):241-245.
[9]陈磊.遗传最小二乘支持向量机法预测时用水量[J].浙江大学学报(工学版),2011,45(6):1100-1103.
[10] Kennedy J.Particle swarm optimization[C]//Proceedings of 1995 IEEE International Conference on Neural Networks,Perth,Australia,Nov 27-Dec 2011:1942-1948.
[11]Kannan S,Slochanal S M R,Subbaraj P,et al.Application of particle swarm optimization technique and its variants to generation expansion planning problem[J].Electric Power Systems Research,2004,70(3):203-210.
[12]Roushangar K,Saghebian S M,Mouaze D.Predicting characteristics of dune bedforms using PSO-LSSVM[J].International Journal of Sediment Research,2017(4).
[13]董红,石连生,赵鹏程,等.运用PSO-LSSVM模型的城市供电可靠性预测[J].电力系统及其自动化学报,2014,26(7):82-86.
[14]刘明珍.基于CPSO-LSSVM 的网络入侵检测[J].计算机工程,2013,39(11):131-135.
[15]Yadav R K,Banka H.A PSO with improved initialization operator for solving multiple squence alignment problems[C]//International Conference on Frontiers in Intelligent Computing:Theory and Applications,2015.
[16]石松,陈云.层次环形拓扑结构的动态粒子群算法[J].计算机工程与应用,2013,49(8):1-5.
[17]Liu Y,Tian X F,Zhan Z H.Research on inertia weight control approaches in particle swarm optimization[J].Journal of Nanjing University(Natural Sciences),2011(4).
[18] Garg H.A hybrid PSO-GA algorithm for constrained optimization problems[J].Applied Mathematics & Computation,2016,274(11):292-305.
[19]马小津,朱博,戴琳,等.基于改进PSO-LSSVM的短期电力负荷预测[J].自动化技术与应用,2016,35(3):5-9.
[20]董勇,郭海敏.基于群体适应度方差的自适应混沌粒子群算法[J].计算机应用研究,2011,28(3):854-856.
[21]李浩君,张广,王万良.一种惯性权重与种群多样性协同调整的二进制粒子群优化算法[J].小型微型计算机系统,2018,39(3):529-533.
[22] Chatterjee A,Siarry P.Nonlinear inertia weight variation for dynamic adaptation in particle swarm optimization[J].Computers&Operations Research,2006,33(3):859-871.
[23]张迅,王平,邢建春,等.基于高斯函数递减惯性权重的粒子群优化算法[J].计算机应用研究,2012,29(10):3710-3712.
[24]姜长元,赵曙光,沈士根,等.惯性权重正弦调整的粒子群算法[J].计算机工程与应用,2012,48(8):40-42.
[25]刘文婧,张鑫礼,王建国,等.基于速度扰动项的多目标粒子群算法研究[J].机械设计与制造,2015(7):124-127.
[26]温黎茗,彭力.用正弦函数描述非线性惯性权重的微粒群算法[J].计算机仿真,2012,29(5):235-238.
[27]罗华.一种惯性权重自适应的粒子群优化算法[J].电子科技,2017,30(3):30-32.
[28]黄利,杜伟伟,丁立新.基于Sigmoid 惯性权重自适应调整的粒子群优化算法[J].计算机应用研究,2012,29(1):32-34.
[29]梁昌勇,马银超,陈荣,等.基于SVR-ARMA 组合模型的日旅游需求预测[J].管理工程学报,2015,29(1):122-127.
Forecasting of Short-Time Tourist Flow Based on Improved PSO Algorithm Optimized LSSVM Model
LU Wenxing1,2,LI Chu1
1.School of Management,Hefei University of Technology,Hefei 230009,China
2.Ministry of Education Engineering Research Center for Intelligent Decision-Making&Information Systems Technologies,Hefei 230009,China
Abstract: The accurate prediction of tourist flow provides an effective basis for optimizing the allocation of tourism resources and the development of a strategic plan.In order to improve the forecasting accuracy of daily tourist flow,an improved prediction method of Least Squares Support Vector Machine(LSSVM)optimized by modified Particle Swarm Optimization(PSO)is proposed.In the improved PSO algorithm,considering the degree of aggregation of particles and the relationship between the value of particle fitness and inertia weight in population evolution,in the view of the nonlinear variation of the logarithmic function,an Adaptive Logarithmic Particle Swarm Optimization(ALPSO)is proposed since when the inertia weight adopts a typical linear decrement strategy can not satisfied the defect of non-linear variation characteristics of particle optimization.A prediction model of short-term tourist flow in mountainous scenic spot is established that the modified PSO algorithm is used to optimize the parameters of LSSVM.Given the daily tourist data of Mountain Huangshan from 2012 to 2015 as an example,the results of experiments corroborate that compared with those using LSSVM with standard PSO,LSSVM with Sinusoidal Particle Swarm Optimization(SPSO)and LSSVM with Gaussian Particle Swarm Optimization(GPSO),the ALPSO-LSSVM model presents better predictive performance which is an effective method for accurately forecasting daily tourist flow in scenic areas.
Key words: particle swarm optimization;inertia weight;least squares support sector machine;tourism flow forecasting
文献标志码: A
中图分类号: TP39
doi: 10.3778/j.issn.1002-8331.1807-0063
陆文星,李楚.改进PSO算法优化LSSVM模型的短期客流量预测.计算机工程与应用,2019,55(18):247-255.
LU Wenxing,LI Chu.Forecasting of short-time tourist flow based on improved PSO algorithm optimized LSSVM model.Computer Engineering and Applications,2019,55(18):247-255.
基金项目: 国家自然科学基金重点项目(No.71331002);国家自然科学基金青年项目(No.71601061)。
作者简介: 陆文星(1971—),男,副教授,硕士生导师,研究方向为项目管理、信息管理和信息系统、决策分析等;李楚(1993—),女,硕士研究生,研究方向为信息管理与信息系统、算法优化等,E-mail:192822345@qq.com。
收稿日期: 2018-07-12 修回日期:2018-08-24
文章编号: 1002-8331(2019)18-0247-09
CNKI网络出版:2018-12-03,http://kns.cnki.net/kcms/detail/11.2127.TP.20181128.1715.050.html
标签:粒子群算法论文; 惯性权重论文; 最小二乘支持向量机论文; 客流量预测论文; 合肥工业大学管理学院论文; 智能决策与信息系统技术教育部工程研究中心论文;