基于数据驱动的迭代学习算法在导弹 突防能力评估中的应用
邹 慧
(中国船舶重工集团公司第七二三研究所,江苏 扬州 225101)
摘要 :突防能力是导弹的一项重要指标。根据导弹的特点和作战应用,对其突防能力进行了建模研究,针对目前导弹突防能力评估存在的局限性,采用基于迭代学习算法的指数标度法,对导弹突防能力进行了评估,对导弹作战效能评估有重要的意义。结果表明该评估方法具有有效性和实用性。
关键词 :突防能力评估;迭代学习算法;指数标度法
0 引 言
保证可靠的发射和稳定的飞行,是实现导弹有效攻击的前提条件。迅速地突破各种阻击和干扰,最后实现战斗部爆炸损伤目标,是武器作战能力的重要体现。导弹突防能力又称导弹空中生存能力,指导弹能够穿透敌方拦截系统而不被损伤的能力。根据导弹的特点和作战应用的实际情况,对其突防能力评估进行了建模研究,对导弹作战效能评估有重要的意义。
基于数据驱动的迭代学习算法[1]表示仅使用输入和输出数据得到系统最优跟踪性能,可以避免费
时的辨识试验,通过多次反复执行就能改善系统性能。指数标度法完全适用韦伯-费希纳心理学定律,应用指数标度法进行导弹突防能力评估的主要任务是合理构建主观感觉判断矩阵N ,并计算客观差异判断矩阵M 的排序权值。
本文在构建导弹突防能力评估的递阶结构模型上,利用(0,2)标度法[2]构造客观差别判断矩阵,采用数据驱动迭代学习算法同时优化矩阵中相邻2层的客观重要度,并检验矩阵的一致性和计算矩阵的排序权重。结果表明,基于数据驱动的迭代学习算法在用于导弹突防能力的评估中简单通用,具有较高的应用价值。
1 突防能力指标评估体系的递阶层次模型
1.1 基于迭代学习算法的指数标度法
基于迭代学习算法的指数标度法包括下面5个步骤[3]:
步骤1:建立分层递进模型,它包括零优选目标层X 、准则层Y 和方案层Z 。准则层Y 包括要考虑的准则、子准则,这些准则和子准则可由若干层组成。
13段第2句,句式比较简单,但需要区分两个介词to的用法和含义,to whom he was faithful和to the day of his death,两者的含义不同,前者是prep+关系代词,词组be faithful to忠实于某人某物,后者prep表示直到某个时间为止。
将u k 、y k 、e k 存储到存储器中,可知系统第k +1次控制项u k+1 是由第k 次控制项(u k )以及误差项(e k )经过映射后得到。从以上可以看出,迭代学习控制基本规律的经典数学描述为:
步骤3:将主观感觉判断矩阵N 转化为客观差别判断矩阵M 。计算矩阵N 中各个元素的重要性排序指数:
2.5 环境温度对按蚊吸血影响 环境温度从21℃上升至39℃期间,按蚊的吸血率从53.8%下降到30.1%。其中,环境温度达到27℃及以上时,按蚊的吸血率趋于稳定并维持在30%左右,见图4。
四十二岁那年,李白游到了京城,拜见了文坛高士贺知章。贺知章出于礼貌,随手翻阅着李白呈上的诗文。读到《蜀道难》时,老头登时被惊住,连呼“天纵奇才,下凡的谪仙!”。
(1)
计算矩阵B ={b ij |i ,j =1,…,n }n×n ,其中:
b ij =a ri -r j
(2)
式中:a (a >1)为相邻两级的比率。
根据上述干扰系统中分析的影响地地导弹突防能力的主要因素,建立了导弹突防能力的评价指标体系,构建了较为简化的地对地导弹突防能力评价指标体系的层次模型,如图3所示。
(3)
由此可知,应用迭代学习控制技术的目的是在可控的时间[0,T ]中,搜索出控制项u k ,使得该控制项作用于被控系统时,系统输出项y k 可以迅速追上期望轨迹y d ,并且最终顺利实现任务。
(4)
(5)
政治领导力是党的十九大报告提出的新概念、新命题、新课题,与党是最高政治领导力量、把党的政治建设摆在首位、增强政治领导本领等重大论断一起,鲜明揭示党永葆旺盛生命力和强大战斗力的秘诀和要求,科学指明提高政治能力、坚持党的全面领导的方向和路径,构成习近平党建思想的重要组成部分。全面提升新时代政治领导力,需要对其自身逻辑以及由此产生的重大影响进行价值审视,从而清晰把握其在加强党的全面领导、实现中华民族伟大复兴中的重要地位和作用。
(6)
(7)
在公式(7)中,一致性指标函数CIF(n ),w k (k =1,…,n )作为排序权值向量,比率参数a 是优化变量。公式(6)是一个线性优化问题并且很难用传统方法求解,然而解决该问题的一个简单但有效的方法是迭代算法。如果CIF(n )<0.1,则矩阵M 具有令人满意的一致性,并且用这种方法计算的每个元素的排序w k 和参数a 是可接受的。
步骤5:Z 层各个方案的总排序权值(即综合重要度)为:
(8)
越大,则第i 个方案越优先,据此可对各方案进行优劣排序,选出最佳方案。
仅可通过线性化误差模型辨识的误差包括仅可过测量辨识的误差包括δl21,δl23,δl33,δl43;仅可通过间接计算所得的误差项包括δλ2x,δλ2z,δλ3z,δλ4z;可通过线性化误差模型和测量辨识的误差包括δl13,δθ13y,δθ13x,δθ21z,δθ21y,δθ23y,δθ23x,δθ33y,δθ33x,δθ43y,δθ43x。
1.2 迭代学习算法
迭代学习控制具有严格的数学描述和详细的理论分析,它是智能控制领域的一个重要分支。迭代学习理论自诞生以来,经过国内外学者的研究,其理论体系不断完善。该算法的基本原理如图1所示。
图1 迭代学习控制技术理论基本原理图
由图1可知,系统的第k 次控制项u k作用于被控系统,并输出y k 。因此,假定要跟踪的系统信号期望轨迹为y d ,可以得到第k 次输出误差公式为:
e k =y d -y k
(9)
步骤2:利用上个层次的要素为准则对Y 层(涵盖子准则层)的各要素两两比较,利用(0,2)标度构建Y 层的主观感觉判断矩阵N ={c ij |i ,j =1~n },在矩阵N 中c ij =2,如果i 元素比j 元素重要,写1;如果i 元素与j 元素重要度相同,写0。
阿勇表示,他咨询过律师,律师认为,法律没有规定罚金非要一次交清不可,实际上,对于罚金数额较多,罪犯无力一次缴纳的情况,是可以限期分期缴纳的。这么做,也有利于罚金刑的执行。但审判长林灿岗拒绝了他分期缴纳罚金的请求。
u k+1 =F (u k ,e k )
(10)
式中:F ()表示映射关系。
考虑图1的迭代学习控制基本原理,工作流程可详细表示为:
(1) 设置u 0为系统的初始状态控制项序列,y d 为跟踪信号期望轨迹。
(2) 当第k 批次控制项序列u k 作用于被控系统时,对应于系统输出项的序列为y k 。
(3) 此时系统跟踪误差项序列e k 将根据控制算法自动计算,控制项u k 、输出项y k 和误差项e k 等将由系统自动存储,根据迭代学习控制律可以计算出u k+1 。
通过上述模型,迭代学习控制的学习规律设计如下:
如果矩阵M 满足公式(3),那么矩阵M 具有完全一致性,于是有:
虽然传统的迭代学习控制有较好的性能,然而它在学习律的增益参数选择方面仍然有严重的对设计者的依赖。另一方面学习律的增益在系统控制中起着不可替代的作用,所以国内外的很多研究学者将优化理论引进这一领域中,设计并优化满足特定要求的性能指标,最终得到最优学习律。以下就是最为经典的迭代学习控制技术优化理论——迭代学习控制牛顿优化算法。
迭代学习控制牛顿优化算法具有较快的收敛速度,它通常用于求解复杂的非线性方程组。求解该算法的基本思想是对非线性方程进行线性化,并通过线性方程求解,可以得到近似零点[4],基本方程为:
从上面可以看出,公式(5)左侧的值越小,矩阵M 的一致性就会越高。若公式(5)等号成立,那么矩阵M 就具有完全的一致性。鉴于此,将Y 层中每个因素的单次排序和一致性检查的问题归结为以下问题:
(11)
国外学者Konstantin设计了Newton 法求解连续非线性系统的迭代学习控制器[5],y k =F (u k )为该方法的系统模型。其中u k ∈U ,y k ∈Y ,且U
和Y 均为Banach空间,映射关系F ()在 Banach 空间满足F :U →Y 。
(4) 迭代学习控制律结束条件为:如果跟踪误差精度系统结束迭代学习;如果不满足,令k =k +1跳转至(2),如果k >k max,则停止迭代学习。其中k max是迭代次数的最大值,ε max是系统跟踪的最大允许误差。
多媒体技术作为一种辅助的教学工具,自然有其好的辅助效果,只要老师不滥用多媒体技术,在小学语文阅读课堂上合理运用多媒体技术,对于提高学生的阅读能力来说还是很有帮助的。老师可以通过多媒体技术当中的图片和视频的形式将一些阅读材料展示给学生,让学生能够通过动感的画面来真实地感受阅读的魅力,从而也愿意进行阅读学习。多媒体技术当中的图片和视频的形式是一种更加形象和直观的方式进行阅读练习,这样可以增加学生的阅读兴趣,让学生更加热爱阅读学习,从而提高阅读的速度和质量。
u k+1 =u k -[F ′(u k )]-1(y d -y k )
(12)
1.3 递阶层次模型
突防能力是导弹的重要性能指标,也是影响导弹系统作战效能的最重要因素之一。 在导弹武器系统的演示中,评估导弹突防能力具有十分重要的意义。为提高导弹突防能力,需进一步针对一体化的突防干扰体系(如图2所示)进行分析。
图2 导弹突防干扰体系组成
步骤4:使用迭代学习算法优化矩阵M 中的a ,并且计算排序权值ω i ,i =1,…,n 。又因为矩阵M 的定义为:
图3 导弹突防能力的递阶层次结构
2 应用分析
本节应用基于迭代学习算法的指数标度法对甲、乙2种型号的地地导弹突防能力进行评估。
网络研究采用的手段共有3种:分析法、实验法及模拟仿真.分析法的有效性和精度常常受限于假设条件,实验法的缺陷在于实验成本较高,而模拟仿真则弥补了分析法及实验法的不足,是一种既经济又高效的网络研究手段[5].
2.5 989名孕妇中对口腔健康知识需求途径情况 希望从口腔专业人员获取知识的孕妇811名,占82.00%;希望从妇产科专业人员获取知识的孕妇476名,占48.13%;希望从广播电视科普读物等媒体获得知识的孕妇101名,占 10.21%。见表4。
采用基于数据驱动的训练方法对输入的样本进行训练,构造出B 层上的各要素,如表1所示。
表 1训练样本
数据网络训练结果如下:
采用基于迭代学习算法的指数标度法,可以得到以X 层为判据的主观感觉判断矩阵M 。各评价指标的权重分别为W 1=0.157、W 2=0.478 9、W 3=0.274 2、W 4=0.089 9、参数a =1.321 5,相应的一致性指标函数值是0.000 069。得出子准则层主观感觉判断矩阵M 11、M 13、M 14的评价指标的权值见表2。
试验使用的9种辣椒品种,其感官评定结果见表4。9种辣椒其感官辣度分为3个范围:不辣、微辣、辣,其中,不辣和辣这2个区域,感官评定者划分较为稳定,但微辣区域有所差异。
表 2主观感觉判断矩阵 B 11、B 13、B 14的 各评价指标的权值计算结果
假设机动变轨能力B 12、红外隐身能力C 11、雷达隐身能力C 12、微波隐身能力C 13、红外诱饵能力C 14、电子诱饵能力C 15、电磁防护能力C 16、抗破片损伤能力C 17和抗激光损伤能力C 18分别为W B 12、W C 11、W C 12、W C 13、W C 14、W C 15、W C 16、W C 17、W C 18,利用上述GA-ESM得到的结果,计算每个合成的权重,如表3所示。
足球场地、器材是开展足球运动的硬件设施,足够的场地,充足的器材是提高体育教学质量、吸引学生主动参与足球运动、实现体育活动目标的物质保障。横店影视职业学院有一块标准足球场地,但利用率较低,器材设施也不是很充足,影响了高职院校足球运动的发展。从调查情况来看,场地质量,器材缺乏的主要原因是相关经费有限,其次是领导对足球的重视程度不够,缺乏有力的支持。
表 3合成权重计算结果
甲、 乙2种地地导弹各项指标值如表4所示。
表 4甲 、乙 2种地地导弹的各项指标值
根据上述指标,导弹甲和导弹乙的突防能力可以分别计算为X 1=0.489,X 2=0.510,又因为X 1<X 2,所以可知导弹乙的突防能力大于导弹甲的突防能力。
3 结束语
针对现有导弹突防能力评估系统的局限性,建立了地对地导弹突防能力评估的分层模型,采用基于迭代学习算法的指标标度法优化矩阵中相邻2层的客观重要度,检验矩阵的一致性,计算矩阵的排序权重,对导弹突防能力进行了评估。结果表明用本文方法进行评估,将定性分析与定量分析相结合,是有效和可行的。
参考文献
[1] 李思源.基于数据驱动的离散系统迭代学习控制与强化学习控制的研究[D].沈阳:辽宁科技大学,2016.
[2] 徐泽水.AHP中构造判断矩阵的指数(0,2)标度法[J].曲阜师范大学学报,1999,25(1):48-50.
[3] 杨军辉,王晟.基于GA-ESM的AHP及其在导弹突防能力评估中的应用[J].科学技术与工程,2017,7(17):4451-4453.
[4] 丁锋.系统辨识新论[M].北京:科学出版社,2013.
[5] TOGAI M,YAMANO O.Analysis and design of an optimal learning control scheme for industrial robots: a discrete system approach[C]//Proceeding of 24th Conference on Design and Control.Florida,USA,1985:1399-1404.
Application of Iterative Learning Algorithm Based on Data Driving to The Evaluation of Missile Penetration Capability
ZOU Hui
(The 723 Institute of CSIC,Yangzhou 225101,China)
Abstract :Penetration capability is an important index of the missile.This paper performs the modeling and research into its penetration capability according to the characteristics and operation,aiming at the boundedness existed in the current evaluation of missile penetration capability,adopts the index scale method based on iterative learning algorithm,evaluates the missile penetration capability,which is of important meaning for the operational effectiveness evaluation of the missile.Results show that the evaluation method has effectiveness and practicability.
Key words :penetration capability evaluation;iterative learning algorithm;index scale method
中图分类号 :TJ761
文献标识码: A
文章编号: CN32-1413(2019)01-0042-04
DOI :10.16426/j.cnki.jcdzdk.2019.01.010
收稿日期: 2018-10-08