基于ARIMA模型的军事训练数据分析和预测
李 杰,彭晓明
(空军预警学院,湖北 武汉 430019)
摘要: 为更科学合理地使用军事训练数据,针对军事训练数据随时间变化的特点,探讨了在Python环境下基于差分整合移动平均自回归(ARIMA)模型进行分析研究的方法,目的在于发现军事训练内在规律,进行数据预测,以及时优化军事训练计划,促进战斗力生成。
关键词: 军事训练数据;ARIMA模型;分析;预测
0 引 言
随着军事训练信息设备移动化和各种传感器的大量使用,军事训练产生了海量数据,这些数据真实地记录了军事训练的过程。采取科学合理方法洞察这些数据背后有价值的信息,以用于优化军事训练实践,是军事训练信息化的重要一步。关于军事训练数据分析,文献[1]改进了基于相对密度的算法,有效地提高了检测军事训练数据噪声的精度。文献[2]提出了通过军事训练数据统计分析出部队实体作战能力的方法。文献[3]提出了利用主成因分析(PCA)与层次聚类算法对军事训练数据进行降维使用的方法。文献[4]探讨了使用灰色加权填充进行数据填充的方法。文献[5]通过构建元数据模型,希望解决军事训练数据集成和共享的问题。这些研究分析大都针对军事训练数据的静态特征,将军事训练数据看作时间序列的研究还比较少。
解决时间序列预测问题,差分整合移动平均自回归(ARIMA)模型是应用最广泛的线性模型。该模型建立后,一直有很多学者以此为基础进行了深入研究。近年,随着计算机性能的提高,对于ARIMA模型的研究方向大多都与机器学习、反向传播(BP)神经网络等方法结合,如文献[6]~[8]对建立ARIMA-BP组合模型进行了研究;另一方面主要是对参数选值进行控制优化,如文献[9]对公交数据的选值进行了系统实验并优化,提高了精度。针对军事训练数据的特性,本文在ARIMA模型分析的基础上进行了优化,经过仿真实现,方法有效。
1 时间序列和ARIMA模型
时间序列是某个数据在不同时间上的量值,按时间先后顺序组成的序列,当我们跟踪某些量在时间上的变化时,就是在处理时间序列[10]。其数学模型可以表示为:
{X t }={X t :t ∈T }
(1)
平稳与非平稳是时间序列分析中一个非常重要概念,直接影响到对时间序列进行处理的方法[11]。通常,我们认为时间序列只要满足下面3个条件,就是平稳的:
(1) 均值E (X t )=μ ,μ 为常数;
(2) 方差δ (X t )=σ ,σ 为常数;
对于非平稳时间序列处理,1970年Box和Jenkins在“Time Series Analysis:Forecasting and Control”中提出了ARIMA模型[12],可以表示为:ARIMA(p ,d ,q )。其中,p 为自回归参数,d 为差分阶数,q 为滑动平均参数。ARIMA模型可以用于表示平稳和非平稳时间序列,其中:ARIMA(p ,0,q )即为ARMA(p ,q )模型,ARIMA(p ,0,0) 即为AR (p )模型,ARIMA(0,0,q ) 即为MA (q )模型。
(3)γ (t ,s )=γ (t +h ,s +h ),即协方差只与时间间隔有关,与时间t 无关。
对于生鲜类冷冻冷藏产品,采用全程冷链关键。从供应商的出库到电商的冷库,中间不能离开冷藏,仓库在验收入库时要检查送货车辆以及温度是否达标。水果的新鲜度和成熟度也是验收时的重点关注内容,如果拟入库商品在短期内要出库或者销售状况好、市场需求大,就适合选择成熟度比较高的商品,但是如果拟入库商品有较长的销售期,就适合选择成熟度比较低的商品,这样才能避免配送到消费者手上的时候出现腐烂变质的情况。不过成熟度偏低的产品在口感和品质上会有一定程度的欠缺,所以在采购入库时要尽量避免这一类。
图1给出了数据的时间序列图,通过观察,可以初步判断序列不平稳。
为了去掉这个趋势,进行一阶差分,差分后结果如图2所示。
儿童画生动、活泼、稚拙、夸张,充满童趣和无限的想象力,有着独特的个性与魅力,不少西方美术大师如克利、米罗、毕加索等曾向儿童画学习,他们常常被儿童画的大胆创新所倾倒。儿童对世界的认知基本上是一张白纸,他们最真最纯的描绘是对美丽的大自然、社会和自己内心世界最真实的情感流露。作为教师,我们更应该在教学上去激发他们的创作兴趣与热情,发掘孩子的想象力和创造力,促进儿童的个性发展。
其次,通过时间序列图对平稳性进行观察,看是否有上升或者下降的趋势。如果希望实现计算机自动判定,可以使用单位根检验,即判断时间序列中是否存在单位根。若存在单位根,则序列是不平稳的[10]。本文使用单位根检验(ADF)方法检验,便于进行机器判定,减少人为工作量,如果检验值大于0.05,则判定该序列非平稳。对于非平稳时间序列,需要进行差分处理,直到形成平稳时间序列。差分过程如下:
X t =X t -X t-1
(2)
(2) 参数估计:建立ARIMA模型需要确定p ,d ,q 3个参数,差分阶数d 可以在(1)中确定。关于p ,q 值的确定:方法一是通过自相关系数(ACF)和偏自相关系数(PACF)图选定合适的模型,如表1所示。
表 1 ACF和 PACF判断 ARIMA模型依据
(3) 模型检验:验证残差是否为白噪声,即为纯随机过程[13],即残差的时间序列不存在任何趋势,均匀地分布在0值上下。使用Ljung-Box检验值大于0.05。
方法二是在现实问题中,通常p ,q 阶数较低,可以从低到高逐阶尝试。最后,采用贝叶斯信息准则(BIC),选取获得最小BIC值的p ,q 的值,建立合适的模型。
(4) 应用分析:使用模型进行预测,并将结果可视化,加以解释。
2 军事训练数据的特点
通过笔者多年的工作实践和对军事训练数据分析发现:与其它一般数据不同,军事训练数据,尤其是训练成绩在随时间变化方面有3点特性:一是总体趋于上升,原因是训练时间逐年递增、训练难度逐步增加、训练水平逐渐提高;二是周期性的起伏,原因是新老人员交替换代和定期比武考核导致;三是突发随机变化,原因是突发、临时任务或者其他随机因素导致。这3点特性都对ARIMA预测算法使用带来了挑战。而传统使用ARIMA模型存在2个不足之处:一是ARIMA模型是统计学模型,基于抽取样本的统计方法,无论采用怎样的优化选值方法,都会存在人为干预或者丢失信息,造成预测误差大,甚至预测错误的问题。二是ARIMA模型是数学模型,预测得到的是定量的数字结果,规律描述不够直观形象。针对这两方面的不足,本文主要利用python3.7环境中的numpy、matplotlib、pandas、statsmodels等开源库对军事训练数据时间序列进行处理:主要解决ARIMA模型参数选择中人工干预的问题,使用全数据样本,通过机器判定选择模型参数,客观公正,保证模型的可靠性;二是将数据处理过程、结果可视化,简单直观地传递信息。
随四季变换选择不同花卉,从而表达自己的审美情致,这是园林主人的共鸣,但具体花卉种类的好恶却因人而异。比如清代李渔自称“有四命”春之水仙、兰花,夏之莲,秋之秋海棠,冬之腊梅。“无此四花,是无命也”[3]。《花镜》中则用梅、柳、海棠、兰、梨、桃等花木喻春之繁华;用石榴、向日葵、荷花、竹、槐等花木喻夏之清凉;用桂花、梧桐、菊花、木芙蓉、枫、芦苇等花木喻秋之绮丽;用枇杷、腊梅、山茶等花木喻冬之寒香[8]。明清时,杏花的文化含义发生转变,少有园林使用,而文震亨对杏花却情有独钟。相反,向日葵被陈淏子认为是夏季代表,在他眼中则是“最恶”。
3 基于ARIMA模型分析军事训练数据
本文使用某单位记录的数据进行分析,共计30个数据点,以前24个数据为建立模型的数据基础。经过对数据时间和形式的模糊处理,形成了数据列表,部分数据如表2所示。
(1) 数据处理:首先对数据中的异常点进行处理,剔除异常值可以减少错误干预,增加预测的准确性。主要将时间序列值X i +1与平滑值之间的差值与方差δ 进行比较,如果则X i+1 为正常值,否则为异常值。
表 2某单位军事训练部分数据列表
利用ARIMA模型进行建模的过程主要有4个步骤:数据处理、参数估计、模型检验、应用分析。
图1 数据序列图
为了准确判定,进行ADF检测,表3给出了检验值为0.102 921,大于0.05。
表 3序列 ADF检测值
设输入的时间序列为X ,利用ARIMA模型进行分析的步骤如下:
图2 一阶差分后数据序列图
再次进行检验,其p 值为1.478 2e-07,远远小于0.05,可以认定一阶差分后,时间序列平稳,如表4所示。
表 4一阶差分后 ADF检测值
通过观察图3,根据表1,可以得出p =1,q =0。
再采用BIC准则进行检验,将p ,q 的值分别取0~3,取BIC值最小的模型。通过表5可以看出应选择ARIMA(1,1,0)模型。
对残差进行分析,从图4可以看出,残差的时间序列在0附近,且没有趋势;如表6所示,Ljung-Box检验值大于0.05,残差正态性良好。总体来说,可以接受ARIMA(1,1,0)模型。
图3 ACF、PACF图
表 5 BIC准则检测值
图4 残差序列ACF、PACF图
表 6残差序列 Ljung- Box值
使用ARIMA(1,1.0)模型对接下来6组进行预测并与真实值进行比较,通过对比,从表7可以看出,预测结果与接下来3组真实值拟合度较高,可以真实反映军事训练数据未来的发展趋势,最终得到图5预测图。
依据“全国学生体质健康调查检测细则”要求,两侧视力均不低于5.0者为正常,凡有一侧视力低于5.0者为视力不良。参照中国肥胖工作组制定的BMI标准[2]对学生进行超重、肥胖的筛查,超重组 BMI为(24.0~27.9)kg/m2,肥胖组 BMI≥28kg/m2。
图5 残差序列Q-Q图
表 7预测值
图6 预测图
4 结束语
基于ARIMA模型,本文探讨了一种针对时间序列特性对军事训练数据进行分析和预测的方法,使用全数据进行研究,避免基于样本统计数据丢失信息,最后将结果进行可视化处理,可以通过复杂抽象的军事训练数据,发现军事训练的规律,预测未来的趋势,及时进行干预,利于战斗力的增长。
高校思想政治教育中融入中国传统文化能够有效向大学生传递正确价值观念,从而促进大学生在日常生活中加强精神文明建设,提升大学生爱国思想。通过中国传统文化的融入,能够使大学生在接受思想政治教育时更深刻理解国家对自身的重要性,从心底产生爱国情感,并积极主动投入社会传统文明建设中,从而加强我国社会传统文明建设,满足我国现代社会发展需求。
浙江金融职业学院智慧图书馆,空间预约、电脑登录、活动报名与考勤都已经实现了人脸识别,是全国高校首家将人脸识别技术应用到图书馆所有业务流程,实现一站式服务的图书馆。
在低油价下,应把握战略机遇购买和并购油气田资产,壳牌通过并购以非常规资源为主的BG公司来实现天然气一体化,不仅LNG液化生产能力大幅度提高,还实现了公司资产的战略转移。在高油价时期,应抓住“溢价”时机抛售油气资产,在高度多元化基础上,优化资产结构,聚焦核心优势资产,提高资产盈利能力。
参考文献
[1] 王伟一,郝文宁,赵水宁,蒋维.基于相对密度的军事高维数据噪声点检测方法[J].计算机工程,2009,35(5):50-52.
[2] 张有亮,张宏军,王洪大.部队实体作战能力计算流程和方法[J].指挥信息系统与技术,2015,6(4):19-24.
[3] 韩曜权,毕增军,李广强,王敏.利用PCA与层次聚类算法的军事训练数据分析方法[J].空军预警学院学报,2018,32(2):132-136.
[4] 王泽,程恺,董坤,王家腾.基于动态窗口的灰色加权填充算法及应用[J].指挥控制与仿真,2016,38(2):43-47.
[5] 陈兴建,郝文宁,刘庆河,韩宪勇.基于CWM构建军事训练元数据模型[J].电脑知识与技术,2010,6(10):2498-2450.
[6] 尧姚,陶静,李毅.基于ARIMA-BP组合模型的民航旅客运输量预测[J].计算机技术与发展,2015,25(12):147-151.
[7] 陈小玲.基于ARIMA模型与神经网络模型的股价预测[J].经济数学,2017,34(4):30-34.
[8] 王成,胡添翼,顾艳玲,张磊,姓海涛.大坝安全检测的ARIMA-BP组合预测模型[J].三峡大学学报,2018,40(1):20-24.
[9] 李文正,姜海.使用ARIMA模型预测公交到站时间[D].北京:清华大学,2017.
[10] JANERT P K.数据之魅:基于开源工具的数据分析[M].黄权,陆昌辉,邹雪梅,费柳凤译.北京:清华大学出版社,2012.
[11] 王立柱.时间序列模型及预测[M].北京:科学出版社,2018.
[12] BOX G E,JENKINS G M.Time Series Analysis:Forecasting and Control[M].San Francisco:Holden Day,1976.
[13] 吴喜之,刘苗.应用时间序列分析R软件陪同[M].北京:机械工业出版社,2017.
Analysis and Forecasting of Military Training Data Based on ARIMA Model
LI Jie,PENG Xiao-ming
(Air Force Early Warning Academy,Wuhan 430019,China)
Abstract :In order to use military training data more scientifically and rationally,this paper discusses the methods of research and analysis based on autoregressive integrated moving average(ARIMA) model in Python environment pointing at the characteristics that military training data change with the time,and the purpose is to find the inherent regularities of military training and perform data forecasting,thereby the military training scheme is optimized in time and the combat effectiveness generation is promoted.
Key words :military training data;autoregressive integrated moving average model;analysis;forecasting
中图分类号: TP311.13
文献标识码: A
文章编号: CN32-1413(2019)05-0098-04
DOI :10.16426/j.cnki.jcdzdk.2019.05.024
收稿日期: 2019-03-12