基于攻防博弈的多波次导弹发射路径规划
王中伟1裘杭萍1王智学1邓巧雨1
摘 要 针对多波次导弹发射路径规划问题,基于不完全信息博弈理论,建立了多波次导弹发射路径规划的目标优化模型,综合考虑了路网节点的攻防博弈、整体暴露时间、单车最大暴露时间和路线的分散机动等方面.基于Floyd 最短路径算法,引进启发式搜索策略,实现了模型的实例验证求解,研究结果对于实际中导弹发射路径规划具有很强的参考意义.
关键词 纳什均衡,Floyd 算法,启发式搜索,路径规划
随着导弹装备的不断更新换代,导弹在未来信息化战争中将发挥越来越重要的作用,未来战争成败很大程度上取决于导弹系统的成功运用与否.当今世界,对一个大国来说,导弹部队是决定其国际地位和国际影响力的有效支撑.对我军来说,随着火箭军的成立以及阅兵仪式上展现的高尖端导弹武器系统,我军已具备强大的导弹作战部队和武器装备.如何将这些作战部队和武器装备的效益发挥到最大化,提高导弹作战部队的机动打击和隐蔽生存能力,是一个极具意义的研究课题[1-3].
季青梅等基于Dijkstra 算法研究了多波次导弹打击任务分配问题[4],给出了路径规划模型; 宋志华等基于多阶段网络最小费用流设计了多车多波次导弹火力打击行动规划问题的动态规划算法[5];王梓行等基于聚类分析建立了战时导弹火力打击任务分配与运输决策模型[6]; 王桐等基于马尔可夫链研究了多波次导弹火力打击的模型,从状态转移概率矩阵的角度计算了不同作战波次对敌方目标剩余概率的影响[7].通过这些研究可以看出,目前我军对于多波次导弹发射问题研究集中于路径规划方面,而对于敌我双方攻防博弈背景下的路径规划问题研究较少.本文在上述研究的基础上,综合考虑敌我双方对抗博弈,提出了基于不完全信息博弈理论的纳什均衡博弈模型,并在此基础上,采用Floyd 算法设计了路径规划优化模型.
1 问题描述及假设
为了提高导弹作战部队的机动打击和隐蔽生存能力,各国导弹作战部队一般会选择使用车载发射装置进行常规导弹的发射.在没接到任务时,发射车会在待机地域隐蔽待机.当接受到任务后,每辆发射车会从待机地域搭载导弹沿路网机动到各自分配好的发射点位发射.当需要进行多波次导弹发射时,发射车完成了上一波次的发射任务后,需要及时机动到相应的转载地域装弹,再机动到下一波次分配的发射点位实施发射,且为了防止我方作战力量目标暴露,每个发射点位不能重复使用,最多可以使用一次.考虑到实际情况,转载地域弹药储量有限,可接待重装填访问次数不超过十次.
为方便该问题的实际研究,现假设有以下问题模型:某导弹部队共有24 台车载发射装置参与某一作战行动,并可以分为A、B、C 3 种型号,其中A、B、C 3 种型号的发射车数量分别为6 台、6台、12 台,没接到任务时平均隐蔽在2 个待机地域(D1,D2).所属作战区域网络拓扑图如图1所示,内有6 个转载地域(Z01 Z06)、62 个道路节点(J01 J62)、60 个发射点位(F01 F60).图1中主干道路可以双车通行,其他道路只能在各道路节点处会车.A、B、C 3 种发射车在主干道上的平均机动速度分别是70 km/h、60 km/h、50 km/h,在非主干道上的平均行驶速度分别是45 km/h、35 km/h、30 km/h.
图1 发射地域路网拓扑图
道路节点受到敌方破坏打击后会导致发射车不能按时机动到指定发射点位,增加发射车的机动时间,进而会增加发射车的暴露时间,降低发射车的安全性.本文考虑敌我双方的对抗博弈,针对道路节点建立合理的评价指标,为各发射车规划每个发射波次的机动路线和发射点位,以达到该条件下的整体暴露时间最短,又使得发射车机动路线尽可能分散隐蔽.为方便问题研究,先做如下假设:1)暂不考虑发射装置在发射点位必要的技术准备时间和发射后发射装置的撤收时间.2)连续两波次发射时,每个发射点位使用不超过一次.3)假设敌方可以观测到发射地域路网的拓扑连接、节点的位置,但对各节点的具体信息并不知情.4)暂不考虑发射车辆在道路上行驶时的会车所用时间.
2 博弈模型构建及分析
考虑到实际作战任务中,敌方会对我方的作战行动进行监测侦察,并会对我方作战行动进行阻拦,现假设敌方会选择我方作战地域上3 个重要的道路节点进行破环打击,这就需要首先建立相应的节点重要程度评价指标,对道路节点进行评估.
各处理水稻各部位镉/砷含量见表3。施加零价铁未对稻米镉含量产生明显影响;施加腐殖质、复合调理剂则明显地降低了水稻各部位镉的含量。与对照相比,施加腐殖质和复合调理剂后,早稻稻米镉含量分别下降14.3%和35.5%;晚稻稻米中镉含量分别下降33.3%和57.4%,差异显著(P<0.05)。施加复合调理剂,早稻稻米镉含量达到食品安全国家标准(GB 2762—2012)。
衡量网络拓扑节点重要性的常用指标有接近度中心性、介数中心性、节点的度、平均路径长度影响率等等,考虑到我方最为关心的是由于敌方对道路节点的破坏,增加了我方导弹运输的整体暴露时间,即解决该问题所需要优化的目标.因此,本文选用平均路径长度影响率为评价指标.平均路径长度指的是拓扑网络中所有节点对之间距离的平均值,公式表示为:
式中,dij 为从节点i 到节点j 的最短距离.节点v 的平均路径长度影响率ηv 是去除了该节点后对平均路径长度的影响程度.
3)Psa :表示状态转移概率.Psta 表示的是经过at ∈A 作用后,发射装置由当前st ∈S 状态到t +1 时刻转移到s x∈S 状态的概率分布情况.在本问题中,状态转移概率是确定的.
由于实际作战任务的机密性,大多情况下敌我双方作战信息不会完全透明,考虑了不完全信息博弈[10],即假设敌方可以观测到我方发射地域路网的拓扑连接和节点的坐标位置,但对各节点具体是什么类型、有何作用并不知情,仅能根据路网特点打击破坏3 个重要的道路节点.因此,该问题博弈模型的局中人应是敌方和我方.我方博弈策略集为{M 1=“经过最重要的3 个节点”,M 2 =“经过次重要的3个节点”},敌方博弈策略集为{D 1=“破坏最重要的3个节点”,D 2=“破坏次重要的3 个节点”}.现假设,我方经过最重要的3 个节点成功发射的赢得为A 1,我方经过次重要的3 个节点成功发射的赢得为A 2,实际情况中应该存在A 1 >A 2,相应的赢得矩阵如表1所示:
经济市场的发展也势必会给各个行业和领域都带来巨大的挑战,整个行业的格局都遭受到了各种危机的影响,有一部分的企业面临着严峻的金融危机。尤其是金融行业,由于改行业的特殊性,一旦出现了危机,那产生的影响就是巨大的,在金融会计业务中,其中比较具体的风险表现形式就是金融会计风险,因此需要提高金融会计管理水平,加强金融会计的风险方法,从而为金融工作提供有益的思路。
表1 敌我双方赢得矩阵
针对该模型,应该选择混合策略纳什均衡[8]进行分析.现假设我方选择策略M 1 的概率为x ,敌方选择策略D 1 的概率为y .为了使收益最大化,应该在对手选择不同策略的时候我方的收益都相等,否则在这个对抗中,对方可以改变不同策略出现的概率让我方的期望收益减少,由此列出方程:
其中,rij 的含义是经过节点rij 从vi 到vj 的最短路径.每计算出一个D (k )的时候,更新R (k ):
解得
进一步可以算出我方不同策略的期望收益:
南疆脱贫攻坚成为新疆全面建设小康社会的底线任务和标志性指标,随着扶贫工作的进展,农村通电、通广播电视、通网络宽带、通路、通水已逐步实现,村镇经济发展在电力保障下,各种电器设备的安装、使用、维护需求日益凸显,其中不乏新技术、新工艺、新设备的应用,如果不能适应新环境下对电工提出的新需求,从业人员必将在今后竞争中处于劣势。
敌方不同策略的期望收益:
通过对比敌我双方的期望收益以及不同重要程度的道路节点的附加支付不同,最终在该博弈模型中,会达到一个纳什均衡,即敌我双方都会以的概率选择最重要的3 个道路节点,以的概率选择次重要的3 个道路节点.
3 路径规划模型构建
通过博弈分析可知,该问题的优化目标不仅仅是整体暴露时间,还要考虑缩短单台发射装置的最长暴露时间,并且采取适当分散机动的策略来规避敌方的侦察和打击.这是一个多目标优化问题,需要选取合适的指标将目标量化,用来定量分析优化策略的效果[9].同时,由于优化目标之间的相互制约关系,需要找到一个适用于实际的平衡.
(3)最大位移出现在码头面层中心区域。最大位移为8.55mm,整个钢管桁架平均位移为2.75mm。根据相关规范可知,最大位移不应大于L/600,其中L为计算跨度,取60m。可见最大位移远小于100mm的位移距离要求。
综合以上因素,多目标优化的目标函数为:
1)S :表示状态集,有st ∈S 表示时刻t 的状态.发射装置在时刻t 的状态用“节点-动作”序列刻画,如(D1,pause)-(D1,to J2)-···-(F3,launch)-··· 记录了发射装置在时刻t 以前经过的节点,以及在节点上做的动作.
综上所述,输卵管梗阻性不孕症患者采用妇产科腹腔镜手术治疗可以有效的提高患者输卵管的再通率,缩短治疗时间,效果显著,安全性高。
2)A :表示动作集,有at ∈A 表示时刻t 的动作.发射装置仅在各类节点上有动作,一般的节点动作有“驶往某邻节点” 和“停留”,在发射点位上还有“发射”动作,在转载地域上还有“装载”动作.
其中,Lv 表示删除节点v 后网络的平均路径长度.通常,平均路径长度影响率越大,表明该节点在交通网络中越重要.需要注意的是,3 个单影响力最大的节点其组合效应不一定会最大.因此,应该综合考虑整体节点,选择组合效应最大的3 个节点,而非单个影响力最大的前3 个节点.
4)R 是回报函数,意思是当前状态st 下执行动作a 的回报,记为r (st ,a ),例如,时刻t 下发射装置的当前状态为st ,执行“驶往某邻节点”,得到的回报是“增加了暴露时间”,此时可为r (st ,a )赋值一个与增加的暴露时间成反比的负数.
在某个状态下执行哪个动作是发射装置的策略,记为π :S →A .如π(st )=a 表示发射装置在时刻t 下状态为st 时的策略为执行动作a .在确定发射装置的策略后,可计算发射装置在策略π 下当前状态为s 时的值函数:
大型仪器设备作为科研工作的重要基础条件,是衡量一个国家科技发展水平的重要指标。因此,推进大型仪器设备管理创新和开放共享是合理利用资金促进科研工作健康稳定发展的需要,也是科技管理改革的重要组成部分。但是,一方面受经济水平的限制,我国大型仪器设备资源严重不足,无法满足需求;另一方面各单位之间又缺少交流共享,造成重复购置、配置不合理、管理混乱的现象,造成资金巨大浪费,阻碍了科研水平的提高。因此,有必要学习国外特别是发达国家的先进经验,结合我国的实际情况,最大限度地提高资源使用效率。
每个发射装置的马尔可夫决策过程为:初始时刻t 0的状态为st 0,从A 中挑选动作a 0执行,执行后,发射装置转移到了下一个时刻的st 1状态.接下来再选择一个动作a 1执行后转移到状态st 2,···
其中,当任何两点间的最短路径加入节点vk 后,R (k )会记录下来.通过顺序求R (v )来求出相应的D (v ),R (v )中会记录每一节点对之间的最短路径.
将r (st ,a )代入确定策略下值函数的计算公式,即可计算出该发射装置在任意状态s 下的值函数V π(s ).再将所有发射装置的暴露时间求和,得我方博弈的收益函数,即优化模型的目标函数:
式中,Vi πi (sit )表示时刻t 下第i 个状态为sit 发射装置在策略πi 下的总体回报值.
进一步分析问题的条件和要求:
有一件事显示祖父聪明过人。当时上海正在修建外白渡桥,工程遇到一个难题:外白渡桥建在苏州河上,建桥时打下大量木桩需拔掉,由于苏州河淤泥深厚,拔桩十分不易,主持建桥的英国人采纳了一位年轻木工的建议,退潮时在木桩上绑上大油桶,涨潮时借助浮力轻易地拔起木桩。这个年轻木工就是我的祖父。
5)要求各发射装置实现两个波次的导弹发射,因此,任意发射装置的动作序列都包含了两个“发射”动作和一个“装载”动作,动作序列以“发射”动作结束,“装载” 动作在两个“发射” 动作中间.换一种表达方式,假设终止时刻为T ,则对于发射装置Lvi 的策略πi ,∃0 <t ′<t ′′<T ,有πi (si ,t ′) =′且
6)各发射装置的发射方式是齐射.因此,¬∃t ′使得但
7)地域空间限制,包含道路空间(会车冲突、超车冲突)和转载地域最多容纳2 辆发射装置的限制.对于地图路网上每个点(x ,y )都定义一个空间阈值τ(x ,y ),在主干道路上τ(x ,y )= 2,在非主干道路上τ(x ,y )= 1,在转载地域节点上τ(x ,y )= 2,其他道路节点τ(x ,y )= ∞.根据策略σ =<π1,π2,···πm >计算时刻t ,路网上点(x ,y )的发射装置数φσ,t (x ,y ),如果φσ,t (x ,y )>τ(x ,y )表示地域空间限制得不到满足.
8)发射点位使用限制.每个发射点在2 个波次的导弹发射中最多只能使用1 次.用µ(Fk )表示发射点位Fk 的使用次数,则µ(Fk )≤1.
综合上述分析可得该问题的数学模型:
ZITHROMAX(阿奇霉素)是一种大环内酯类抗菌药,用于治疗下列特定疾病中明确的微生物敏感菌株引起的轻、中度感染的患者。在这些指征中,推荐的成人和儿童患者群的治疗剂量和持续时间各不相同。[见用法用量(2)]
由于信号中含有随机噪声,为了滤除噪声,提取信号特征,系统采用小波分析方法降噪。在选定阈值后,采用软阈值处理的方法。[5]图3是采用基于10阶Daubechies极大极小值软阈值去噪方法对信号分别进行一阶、二阶和三阶去噪后的波形图。
上述模型中,表示敌方的道路节点攻击策略,θ(σ)表示在总体策略σ 下24 台发射装置路线的总体分散程度.
4 路径规划仿真实验
4.1 优化目标
根据问题分析,要兼顾整体暴露时间、单车最大暴露时间和分散机动考虑路径规划.这里对于分散机动给出定义:机动路线分散是避免24 台发射装置过多地选择同一路段,即尽量让装置行驶更多的路段.用路段利用率θ 量化表示为:
一般来说,路段利用率越接近1,机动路线越分散.
对于每个发射装置的建模可借助马尔可夫决策过程.一个马尔可夫决策过程由一个四元组构成M =(S ,A ,Psa ,R ),其中:
其中,texposei 表示发射装置i 的暴露时间.
3.1.2 普适模块中,无论自评还是家长代评,社会功能得分均为最高,学校功能得分最低。这说明化疗患儿的社会功能未受到疾病的强烈影响,可能基于家长对疾病的掩盖及孩童年幼无知,对疾病缺乏认识及社交圈相对较小且稳定,不易受到变动冲击有关,所以在担忧等方面患儿也未出现强烈的反应。与社会功能正常相比,由于疾病本身或者看病的需要,患儿大多休学在家,并且由于患病,父母降低了对儿童学业的期望,很少在学业上对他们督促、辅导,导致了患儿学校功能偏低,这与相关报告一致[7-8]。
4.2 优化策略
为了使得机动路线尽可能分散,我们设置了重选惩罚.记惩罚系数为ω,每条路段的初始值均为其实际长度,任何路段每被使用一次后,其长度就乘以惩罚系数,即其逻辑计算长度变大,该路段再次被选中的几率会随之相应减小.下面的两轮选路均遵循重选惩罚策略.
该路网所有路段中,最大长度l max 为40.262 km,最小长度l min 为8.485 km,平均长度为lave 为21.025 km.根据经验,ω 值的设置满足lave · ω3=l max,l min·ω3=lave 最佳.经过计算,设置ω 值为1.3.
4.3 Floyd 算法
Floyd 算法[11-12]采取邻接矩阵数据结构作为图的存储结构,通过关系矩阵表示每对节点间的最短路径.当每增加一个新的节点时,如果该节点可以作为中间节点,就重新计算每对节点间最短路径长度.通过多次迭代计算,直到遍历了网络中所有节点为止,最终得到每对节点间的最短路径.
1)对于作战区域内发射车会经过的v (= 130)个点,定义距离矩阵D [130][130],把邻接矩阵W 作为距离矩阵的初值,即:
2)继续迭代得到:
其中是以v 1作为中间点从节点vi 到节点vj 的最短路径长度.
2018年,《齐鲁周刊》用4期封面故事(重构乡村、小镇.COM、艺术复兴乡村、新乡贤),以及大量相关报道,将视线对准乡村。
3)以此类推得到:
其中是以v 1、v 2作为中间点从节点vi 到节点vj 的最短路径长度;
4)而后再逐个加入v 3,v 4,··· ,v 130,得到:
其中, 是插入某一中间节点后从节点vi 到节点vj 的最短路径长度,其中D (v )是距离矩阵.
5)在建立距离矩阵的同时可建立路径矩阵R :
进一步的简单效应检验发现,在低收入组,低近邻信任组的平均k值(M=0.28,SD=0.02)会显著高于高近邻信任组而在高收入组,不同信任水平群体间的时间折扣不存在显著差异,另外,分别以对陌生人、亲戚、朋友的信任水平替换近邻信任进行方差分析,均未发现显著交互作用。研究结果支持了研究假设。
证明 (1) 对任意(x,x)Δ, (x→x)⊗(x→x)=1≥α,从而(x,x)[α]。由x的任意性知Δ⊆[α]。而对任意的Uα,有[α]⊆U,从而Δ⊆U。
式中,T 表示终止时刻,表示在策略π 下,状态为sti 时的回报.对于各发射装置而言,将回报函数r (st ,a )定义为时刻t 下发射装置从状态st 转变为st +1时的暴露时间的负值,则值函数V π(s )被定义为在策略π 下从状态s 开始,后续总体的暴露时间的负值.此时最优的策略即对应总体暴露时间最短的动作序列.
6)若则点p 1是点i 到点j 的最短路径上的中间节点.而后通过同样的方法向两端搜索,向点i 搜素得:
向点j 搜索得:
7)最终,得到点i 到j 的最短路径为:
根据得到的最短路径可以计算出最短路径长度:
其中,
式中,i 取值为出发点编号,j 取值为发射点编号.点m 的坐标为(xm ,ym ).
4.4 两轮选路
第一轮选路包含转载均衡策略和路线长度均衡策略.转载均衡策略旨在让每个转载地域至少接纳2 台发射装置.规划路线时,首先计算出待机点D 1、D 2 到6 个转载地域的12 条最短路径Di →Z j (i =1,2j =1,2,···6),将这12 条路径按长度从长到短排序,取最长的一条,记为Dm →Zn ,通过Floyd 算法求解两个波次的发射点Fp 和Fq ,使得路径Dm →Fp →Zn →Fq 最短.接着,选择Di →Z j 中次长的一条来求解两波次发射路径.以此类推,直至算出始于D 1、D 2,每个转载地域都被使用2 次的一共12 条路线.最后,依据惩罚系数更新所有路段逻辑计算长度.上述选路规则让前往转载地域实际距离更长的路优先匹配距离近的发射点,体现了路线长度均衡策略,使得各发射装置的机动路线总长度差异不会过大,从而减小了单车最大暴露时间.
在第一轮选路后,由于重选惩罚,路网中各路段的逻辑计算长度会改变.更新所有路段的逻辑计算长度后,将两波次打击作为整体,利用Floyd 算法求解一条Dm →Fp →Zn →Fq 的最短路径,再更新惩罚后的路径逻辑计算长度,求解第2 条两波次打击整体路径.以此类推,每选择一条路线,便更新一次路段长度,直至选出12 条路线为止.这轮选路中,每条路线的规划都是越短越好,目的是降低整体暴露时间[13-15].
4.5 优化结果
两轮选路后,按照长路配快车、短路配慢车的规则进行路线分配,可以使得整体机动时间和最小[16-17].得到的点位及路径分配结果如图2所示.
和单纯考虑整体暴露时间最短相比,如图3所示,此时路网中被使用的路段数量明显增多,在图中大致呈均匀分布,且上方和左方的发射点得到了充分利用.具体路径规划方案如表2所示.
表2 路径规划方案
图2 多目标优化后的点位及路径分配结果
图3 单目标优化后的点位及路径分配结果
进一步,将进行多目标优化后的结果与单目标优化后的结果对比,各指标的变化情况如表3.
表3 多目标优化效果
结果表明,采取分散机动策略后,道路利用率显著提高,但正因为发射装置为了分散选择了更远的路,在整体暴露时间和单车最大暴露时间上有所牺牲.整体暴露时间增加了527.8 min,单车最大暴露时间增加不明显,仅3.1 min.综合考虑这3 个因素,本文的优化策略是可取的.
5 结论
针对多波次导弹发射的路径规划问题,通过博弈分析,建立了基于不完全信息博弈的路径规划模型,综合考虑了整体暴露时间、单车最大暴露时间和分散机动等因素,对路径规划方案进行了优化,并进行了仿真实验验证了模型有效性,确保了实战化环境中导弹发射任务中路径规划的合理性、安全性和时效性,对于实际作战任务具有很强的指导意义.
References
1 齐大伟,贺筱媛,等军事通信路径规划动态模型研究[J].指挥与控制学报,2015,1(2):203-207.
2 张明星,程光权,黄金才,等基于作战模式驱动的巡航导弹协同作战任务规划研究[J].指挥与控制学报,2018,4(1):69-72.
3 张明星,程光权,刘忠,等多武器协同作战发射时序规划方法[J].指挥与控制学报,2017,3(1):10-18.
4 季青梅,辛文芳.多波次导弹火力打击任务研究[J].信息技术与信息化,2017,1(2):122-128.
5 宋志华,张晗.多车多波次导弹火力打击行动规划问题的网络流模型及动态规划求解[J].军事运筹与系统工程,2017(3):15-19.
6 王梓行,姜大立,杨李,等.战时导弹火力打击任务分配与运输决策模型[J].后勤工程学院学报,2017(4):77-85.
7 王桐,杨萍,欧阳海波.基于马尔可夫链的多波次导弹作战研究[J].战术导弹技术,2011(4):20-22.
8 陈晓东.纯战略纳什均衡理论及应用[J].商场现代化,2008(3):377-378.
9 博赛卡斯.网络优化:连续和离散模型[M].王书宁,牟晓牧,李星野,译.北京:清华大学出版社,2003.
10 GIBBONS R.A primer in game theory[M].New York:Harvester Wheatsheaf,1992.
11 ZHANG D Q,XIAN Y,WANG M H,et al.The research on path planning method for alternate target based on Floyd algorithm[J].Journal of Projectiles,Rockets,Missiles and Guidance,2011,31(6):55-58.
12 徐达,蔡满春,陈悦.基于改进Floyd 算法的城市交通网络最短路径规划[J].电子科技,2017(7):17-20.
13 张培林,魏巧云.物流配送中心选址模型及其启发式算法[J].交通运输工程学报,2003,3(2):65-68.
14 SCHYNS M.An ant colony system for responsive dynamic vehicle routing[J].European Journal of Operational Research,2015,245(3):704-718.
15 TOTH P,VIGO D.Vehicle routing:problems,methods,and applications[M].Philadelphia:Society for Industrial and Applied Mathematics,2014.
16 苑光明,翟云飞,丁承君,等.基于改进遗传算法的AGV 路径规划[J].北京联合大学学报,2018(1):65-69.
17 杨志勇,叶冯彬,冯艳辉,等.有向非负权图中经过必经节点集最短路径算法[J].电子设计工程,2017,25(16):32-38.
Multi-Shot Missile Launching Path Planning Based on Attack-Defense Game
WANG Zhong-Wei1 QIU Hang-Ping1 WANG Zhi-Xue1 DENG Qiao-Yu1
Abstract Based on incomplete information game theory,a target optimization model for multi-shot missile launching path planning is established.In this model,the attack-defense game of road network nodes,overall exposure time,maximum exposure time of single vehicle and decentralized maneuver of the route are considered comprehensively.Through Floyd shortest path algorithm and heuristic search strategy,the model is verifie and solved.The research results have a strong reference significanc for missile launching path planning in practice.
Key words Nash equilibrium,Floyd algorithm,heuristic search,path planning
引用格式 王中伟,裘杭萍,王智学,邓巧雨.基于攻防博弈的多波次导弹发射路径规划[J].指挥与控制学报,2019,5(1):63-68
DOI 10.3969/j.issn.2096-0204.2019.01.0063
收稿日期 2018-05-09
Manuscript received May 9,2018
1.陆军工程大学指挥控制工程学院江苏南京210007
1.School of Command and Control Engineering,Army Engineering University,Nanjing Jiangsu 210007,China
Citation WANG Zhong-Wei,QIU Hang-Ping,WANG Zhi-Xue,DENG Qiao-Yu.Multi-shot missile launching path planning based on attack-defense game[J].Journal of Command and Control,2019,5(1):63-68
王中伟 (1994-),男,硕士研究生,主要研究方向为指挥信息系统工程.本文通讯作者.E-mail:646480442@qq.com
裘杭萍 (1965-),女,教授,主要研究方向为指挥与控制理论.
王智学 (1961-),男,教授,主要研究方向为指挥与控制系统体系结构.
邓巧雨 (1996-),女,硕士研究生,主要研究方向为需求工程.
标签:纳什均衡论文; Floyd算法论文; 启发式搜索论文; 路径规划论文; 陆军工程大学指挥控制工程学院论文;