空陆攻防博弈的动态武器目标分配论文

空陆攻防博弈的动态武器目标分配*

张先剑

(国防科技大学 智能科学学院, 湖南 长沙 410073)

摘 要: 大规模作战具有高动态、非完全信息和不确定性,在分析归纳目前解决动态武器目标分配问题的一系列方法的基础上,尝试构建基于双方动态博弈的攻防对抗综合数学模型,并利用纳什均衡和帕累托最优算法进行分阶段求解。结果表明,该数学模型和博弈论方法结合能够有效解决武器目标动态分配问题。

关键词: 动态武器目标分配;指挥决策;纳什均衡;帕累托最优

武器目标分配是现代大规模攻防作战的核心问题,它的最终目的是期望通过最优的武器目标分配方案,充分发挥武器系统的整体效能,以实现攻防作战的最佳结局。传统研究主要利用动态规划算法、粒子群优化、蚁群优化、类电磁算法等方法解决静态或动态武器目标分配问题,但大部分研究[1-8]均把目标设想为无智慧、无对抗能力的被动防御对象,单一从己方角度考虑武器目标分配问题,忽略对手的策略和利益,没有充分考虑实战中的动态博弈特征——作战双方行动和策略的关联性。攻击与防御是互相对立的双方,共存于博弈的统一体中,相互制约、相互激励,没有考虑对抗双方动态博弈特性的攻防决策难以应用于实战。具体到武器目标分配问题研究,必须同时兼顾作战双方的战术策略[9-10]、效能指标等重要因素,这正是使用博弈论方法的优势之处。

独立学院的大学英语教师要充分意识到现代信息技术在语言教学中的重要性,及时更新教学理念,不断提高自身的信息教学能力,将现代信息技术融入大学英语听力教学之中,改变现有的、单一的听力教学模式,采用“线上”和“线下”相结合、“课上”和“课下”相结合的混合型教学模式,“合理地设计教学活动,有效地实施教学方案”[7]。具体如下:

针对动态武器目标分配问题,本研究将重点聚焦对抗建模,构建了基于双方动态博弈的综合数学模型,并利用纳什均衡和帕累托最优算法进行求解。

高中生普遍已经度过了叛逆期,已经开始了青春期的后段,生理上已经初步发育完全。但是高中生的心理发育缓慢,由于很少有高中生经历过社会上的人情冷暖,缺乏阅历与生活经验,所以在遇到打击或是挫折的时候,很容易产生消极的心态。尤其是高中时期学生的学习压力大,如果不及时进行疏导,很可能会造成严重的后果。而高中体育课程能够帮助学生排忧,抒发心中的感情,从而调节心态,促进心理成长。而且在休闲运动项目当中很多项目都适合于学生进行感情抒发,同时部分项目非常具有挑战性,都是高中生在日常生活当中难以接触的,可以锻炼学生的勇气与胆量,从而增强自身的心理承受能力,帮助学生建立起良好的心理根基。

1 基于纳什均衡的武器目标分配

1.1 双方博弈

博弈中竞技者(决策主体)都是理性的,在选择决策的时候都有着明确的“使自己的利益最大化”的目标。博弈论就是专门研究博弈现象中各方是否存在最合理的行动方案,以及如何找到合理的行动方案即均衡解的数学理论和方法。而这里的均衡解,就是一个能够得以维持的结果,或者说是所有竞技者不得不接受而又不可能更好的结果[11]

定义 1 博弈可以描述为式(1)所示数学形式[12]

Γ =[N ,P ,{S K },J ,{J (x K )}]

(1)

式中:N 为任意的竞技者集合;P 为联合组织(机构)的集合;K 表示具有共同行动和利益的竞技者小组;S K 为联合K ∈P 的任意策略集合;J 为在P 上的所有博弈结果的任意集合;J (x K )为如果联合K 采取策略x K ,那么在P 上可能的结果集合。

热浸镀是一种用途极广的金属材料表面改性技术。它可显著提高金属材料表面的耐蚀性,提高耐高温气蚀,抗氧化或者耐磨性,还可使金属制品表面均匀光洁,具有良好的装饰作用[1]。关于热浸镀铝,德国人在 1893年发表了论文,随后人们相继发明了多种钢材热浸镀铝工艺。1939年,美国阿姆科钢铁公司首先采用森吉米尔法实现了带钢连续热镀铝硅合金的工业化生产。1952年,美国通用汽车公司又实现了熔融熔剂法热浸镀铝的工业化生产,到 60年代,热浸铝钢材的生产与应用几乎遍及所有工业发达的国家。由于镀铝钢材可应用于含硫和含氯的气氛中,可代替某些不锈钢,因此,近年来热浸镀铝钢材的应用日益广泛[2]。

1.3.4 寻找最优策略

Γ =[N ,S ,J ]

(2)

式中,N =[1,2,…,n ],S =[S 1,S 2,…,S n ],J =[J 1,J 2,…,J n ]。

定义 2 策略q r =(q r,1 ,…,q r,m k )是指标函数J 的纳什均衡解,如果对于任意的q i ∈S i ,有

(3)

式中,M K 为指标向量J 的索引集合,

一般而言,非OPEC国家的原油产量相对稳定,原油供给缺口主要来自OPEC国家。供给缺口主要分为3类:1)受战争、内乱等不可抗力减产的利比亚、尼日利亚等;2)受美国制裁、经济崩溃而被动减产的伊朗、委内瑞拉;3)主动减产的沙特、伊拉克、科威特等国。

1.2 武器目标分配模型

损失函数有这样的思想,即每一方都期望敌方主、被动目标最终数量最小,而使己方主、被动目标数量最大化,并且通过权重系数控制敌方主动武器数量的衰减速度。那么有J →min,J →min。

(1)一篇新课文,要标好每个自然段的序号,通读一遍,边读边画出不理解的词语,并试图通过查词典、联系上下文或结合生活实际等方法进行理解,将意思写下来。

命中率与作战双方组态特征因素有关:其中,为初始命中率,为斜距,为不动点θ 和ψ 间的方位角,t ij 为飞近时间。初始命中率有以下选择范围:

基于方位角η 的可以表示为:当|η |≤η k ,P 0≤P (η )≤0.9时,当η k ≤|η |≤2η k , 0≤P (η )≤P 0时,

贯通培养项目致力于培养具备扎实的基础知识和一定的实践能力与创新能力的高端技术技能人才。相比于普通高中的学生,贯通培养项目高中阶段的学生摆脱了应试教育的藩篱,教师可以更多地关注如何培养学生的语言交际能力,因此他们的学习内容要更加突出实用性和实践性。同时,贯通培养项目的学生经过两年的高中阶段学习后将升入大专,比普通高中的学生更早面临专业和职业的选择。因此,贯通培养项目高中阶段的英语视听说选修课的教材编写和课程设计必须兼顾专业性和职业性。

(2)次生地质灾害严重,道路、电力、通讯全面受阻,救援生命线修复艰难。云南地震带与河谷叠合,地震区多为高山峡谷区,地震常造成巨型次生地质灾害,道路打通极为困难。余震、降雨又会诱发新的地质灾害,造成交通再次阻断,伤员转运困难,滞留在重灾区转运不出去。生活物资因地震被毁,而救援物资又难以进入灾区,造成交通大堵塞,大量救灾物资停留在重灾区10 km左右,而灾区物资又十分缺乏,且救援的核心之一医护人员难以第一时间到达灾区。

某时刻拦截武器位于点A ,坐标为(x A,y A,z A),向量(O 为探测点)坐标为(θ ,ψ ),拦截目标位于点B ,坐标为(x B,y B,z B),向量坐标为(φ ,χ ),A 、B 点间的方位角η 满足:

cosη =

并且有

考虑距离因素,如

(4)

我院2016年9月至2017年9月收治的66例心律失常患者为本次临床观察资料,将其平均分为两组,单纯使用胺碘酮治疗的33例患者命名为对照组,其中男性患者19例,女性患者14例,年龄在52岁至76岁,平均(61±2.3)岁;使用美托洛尔联合胺碘酮治疗的33例患者命名为观察组,其中男性患者21例,女性患者12例,年龄在50岁至75岁,平均(60±1.8)岁。对比两组患者的性别、年龄等一般资料,差异无明显的统计学意义,P>0.05,可对比观察两组患者的临床治疗效果。

那么,被击中的第j 类目标平均数量为:

其中:ν ij 表示第i 类武器攻击第j 类目标的配额,表示第i 类武器当前数量;表示1至n 中的任何一个数;为指派矩阵,并有如式(5)所示含义。

创新推行“一记两卡三规范”工作法,筑牢监管防线。“一记”即监管人员客观、完整登记每天监督检查发现的问题、处理情况。“两卡”即食品药品安全信息报告一卡通和便民服务一卡通,每次下到村屯就把“两卡”分发给监管对象和村民,既能获取食品药品安全信息又方便业务咨询。“三规范”即规范个人形象、规范档案材料、规范索票索证制度。

(5)

在第战斗时刻结束后未被击中的目标数量为:

可是,武汉这么大,上哪儿去找李大头?他年前回村子,说他在城里当包工头,说他在武汉买了房。他经常说的地方,有前进一路,前进二路,六渡桥,偶尔也提一下中山公园。我向一个抄着汉口口音的人问路,他反问我,你到底要到前进一路还是前进二路还是六渡桥?我想,前进一路前进二路有两条路,而六渡桥只有一个,那就上六渡桥吧。

(6)

那么目标损失函数可以表示为:

定义a es 为权重系数,表示甲方(乙方)攻击乙方(甲方)被动目标的战术优先级,有

式中,t k-1 →t k 为多个导弹发射装置单次齐射周期。

J e (ν )=∑a es J es

1.3.2 计算命中率

设甲乙两方进行攻防对抗,甲方有N 类目标参与作战,N ={1,2,…,n },乙方有M 类目标参与作战,表示位于θ 点的第i 个目标攻击位于ψ 点的第j 个目标的命中率,它取决于使用的武器类型和攻击的目标类型与射击条件

1.3 武器目标动态分配算法

使用纳什均衡的武器目标分配算法共分四个阶段:在第一阶段获取作战双方的目标信息,如数量、速度、距离、飞近时间、方位等;在第二阶段根据目标信息和命中率函数计算命中率;在第三阶段构建策略空间和策略收益;在第四阶段寻找最优策略。

1.3.1 获取作战双方武器目标信息

在作战期间,侦察预警探测系统全天候实时监测各种飞行目标,并获得如出发位置、数量、速度、距离、实时空间位置、方位等信息,对获取的敌方信息进行鉴别,如判断是否佯攻、使用欺骗手段和制造假象等。分析敌方作战行动意图、策略和可能攻击目标区域。

在获取目标信息后,可以利用层次分析法(Analytic Hierarchy Process, AHP)等方法根据目标速度、高度、距离和方位角等因素进行多因素综合威胁排序。

其中,索引i ,j 分别代表主动武器和被动目标。

当P (η )≤P (r max)≤0.9时,

基于1.2节中获得的距离、方位等信息,根据式(4)计算命中率。在计算命中率时,还应综合考虑电子对抗环境对于导弹命中率的影响,比如地面防御系统电子干扰装置会对空袭目标的命中率产生直接积极影响,也可能会对己方拦截导弹产生微弱消极影响。电子对抗影响因素主要跟电子干扰装置的功率有关。

P ij =P ijmax ·ei ·λ d ·ej ·λ k

(7)

1.3.3 构建策略空间和策略收益

策略空间与控制参数的数量和取值步长有关,设步长为l ,控制参数ν ij 数量为q ,则单次齐射目标分配策略空间数为(1/l )q

一般情况下,博弈可以简化为包含竞技者、策略和盈利(损失)函数的表达形式。

司伟、李雷利用Nerlove供给反应模型估计了东北、黄淮和其他产区的供给弹性,分别为0.98、0.44和0.32。由于查找的文献中,只有司伟和李雷的研究结果涉及目标价格试点区和非试点区的价格弹性,因此本文将他们的研究结果作为大豆供给弹性的基准值[13]。

首先获得所有符合策略收益的策略解集合,然后根据纳什均衡解定义,在有效解的集合中选取符合作战双方目标损失函数的均衡解。在均衡解的选取过程中应注意,纳什均衡解可能有一个或多个,此时应根据极大极小原理进行筛选(基于最坏情况考虑,争取最好的结果)。

2 实例分析

2.1 基本想定

作战想定:攻击方首先使用陆、海、空平台发射若干战术导弹打击防御方地面防御系统,企图瘫痪或消灭防御方防空力量,然后指派战斗机编队护航轰炸机编队对防御方重要目标实施打击。防御方实施分层分段拦截,轰炸机的威胁指数最高,战术导弹其次。

所研究的目标动态分配是指在连续动态作战中不同阶段的目标分配,阶段划分是由地面拦截导弹的射程决定的,比如首先是远程拦截,而后进行中近程拦截(如图1所示)。

图1 阶段划分示意图
Fig.1 Illustration of stage division

2.2 模型构建

设甲乙两方参与攻防作战,甲方为空袭系统,组成包括轰炸机、导弹、战斗机和电子战飞机;乙方为地面防御系统,组成包括导弹发射装置、雷达站、电子对抗装置和指令站等。

图2 甲乙双方对抗关系示意图
Fig.2 Illustration of A-B counters relationship

甲乙双方对抗关系如图2所示。图中:X 1(t 0)为反辐射导弹的数量,攻击地面电子对抗装置、雷达站等目标;X 2(t 0)为来袭巡航导弹的数量,攻击地面所有目标;X 3(t 0)为电子战装置的数量,它们会对导弹命中率产生影响;X 4(t 0)为轰炸机、空中指挥机等的数量,它们对地面防御目标威胁最大;X k (t 0)为战斗机携载干扰弹数量,它们可以保护轰炸机;X 5(t 0)为地空导弹发射装置数量,X 51(t 0)为中近程导弹数量,X 52(t 0)为远程导弹数量;X 6(t 0)为电子对抗装置的数量,它们会对来袭导弹和拦截导弹的命中率产生影响;X 7(t 0)为多功能相控阵雷达站的数量,雷达站可以同时跟踪多个空中目标;X 8(t 0)为指挥所雷达站数量。其中,为当前初始数量。X i 给出了每种类型目标的数量,ν ij 表示第i 类武器以标准命中率p ij 打击第j 类目标的配额。

首轮(远程拦截防御阶段)双方对抗过程如图3所示,空袭系统首先发射导弹打击地面防御系统,防御系统远程导弹实施拦截打击。

图3 首轮甲乙双方对抗关系示意图
Fig.3 Illustration of A-B counters relationship in the first round

综合数学模型有:

(8)

(9)

次轮(中程拦截防御阶段)双方对抗过程如图4所示,首轮拦截打击之后,由中近程导弹负责对成功突防的导弹和轰炸机进行拦截。

图4 次轮甲乙双方对抗关系示意图
Fig.4 Illustration of A-B counters relationship in the second round

综合数学模型有:

重大水务工程建设扎实推进。大伙房水库输水入连南段工程于2013年9月底正式向长兴岛临港工业区供水;北段工程2013年年底前基本完工,具备通水条件。长海县跨海引水工程基本完工,具备通水条件。

(10)

(11)

2.3 实验分析

假设初始条件如下:X 1=14,X 2=14,X 3=12,X 4=14,X 5=8,X 51=24,X 52=32,X 6=2,X 7=4,X 8=2;a 11=0.25,a 12=0.25,a 13=0.45,a 14=0.05,a 21=0.35,a 22=0.35,a 23=0.25,a 24=0.05,Р521=0.5,P 522=0.5,P 524=0.5,P 3521=0.5,P 3522=0.5,P 3524=0.5。

首轮对抗结果如表1~3所示。

表 1首轮对抗后数量变化

Tab.1 Quantity variation after the first round combat

表 2首轮打击配额

Tab.2 The first-round strike quota

表 3首次对抗损失和收益

Tab.3 Countering losses and gains of the first round

从表1~3中可以看出,基于纳什均衡和帕累托最优方法的实验结果较为相近,攻击方共有13个目标被拦截。从打击配额来看,两种方法的打击策略略有差异,纳什均衡方法分配了79%的火力(高于权重期望系数0.7)用于拦截导弹类目标,而分配了21%的火力(低于权重期望系数0.3)用于拦截轰炸机和空中指挥机;帕累托最优方法分配了76%的火力拦截导弹类目标,分配了24%的火力拦截指挥机和轰炸机。帕累托最优方法更接近决策意志。在实际作战中,由于指挥机、轰炸机的威胁相对更大,往往会优先重点拦截轰炸机和指挥机,从这个角度来看帕累托最优算法相对更优,更符合打击策略分配需求。从攻击方的角度来看,由于轰炸机、指挥机的价值更大,所以投入更多的干扰弹进行防护(37%>21%),帕累托最优方法获得的策略显然优于纳什均衡方法。因此,在首轮对抗中,双方的最优策略分别是

次轮对抗结果如表4~6所示。

表 4次轮对抗后数量变化

Tab.4 Quantity variation after the second round combat

表 5次轮打击配额

Tab.5 The second round strike quota

表 6次轮对抗损失和收益

Tab.6 Losses and gains of the second round

从表4~6可以看出,地空导弹全部耗尽,在纳什均衡算法下轰炸机仍然剩余1架,而在帕累托最优算法下分配了59%的导弹拦截轰炸机,轰炸机被完全击毁,地面防御系统受到轰炸机威胁最小(帕累托最优算法占优)。同时,从攻击方角度来看,在纳什均衡下把全部配额都用来打击多功能雷达站,却又未将其完全击毁,而在帕累托最优算法下将84%的配额用来打击指令站是相对较优的选择,指令站已经全部被击毁。因此,在次轮对抗中,双方的最优对抗策略是最后,地面防御方指令站被全部击毁,地空拦截导弹消耗殆尽并丧失拦截能力,攻击方没有了空中轰炸能力,损失巨大。

3 结论

本文指出了国内现有针对武器目标分配问题研究的优势和不足之处,重点阐述使用基于双方动态博弈的思想解决大规模作战武器目标分配问题的科学性和合理性,构建了基于双方博弈的攻防对抗综合数学模型,并以实例证明使用纳什均衡、帕累托最优方法可以有效解决动态武器-目标分配问题。

试验组45例患者中,显效26例(57.8%),有效16例(35.6%),无效3例(6.7%),临床总有效率为93.3%(42/45);对照组45例患者中,显效18例(40.0%),有效16例(35.6%),无效11例(24.4%),临床总有效率为75.6%(34/45),组间对比,差异具有统计学意义(χ2=5.413 5,P=0.019 9<0.05)。

1)基于博弈论方法综合考虑作战双方的策略和行动方案,保证了决策方案在实战应用中的科学有效性。

2)提出新颖的建模思维,通过引入状态变量、控制参数和权重系数来构建策略空间和策略收益,对武器目标分配问题进行了求解,获得了作战双方各自最优战术策略。

参考文献

[1] 刘振林, 唐苏妍, 葛伟. 创造性思维粒子群优化的武器目标分配[J]. 火力与指挥控制, 2012, 37(3): 4-9.

LIU Zhenlin, TANG Suyan, GE Wei. Particle swarm optimization based on creative thinking four solving weapon target assignment problem[J]. Fire Control & Command Control, 2012, 37(3): 4-9. (in Chinese)

[2] 方卫国, 石小艳. 多层防御模式下武器目标分配决策的群体智能优化算法[J]. 数学的实践与认识, 2013, 43(7): 76-84.

FANG Weiguo, SHI Xiaoyan. Swarm intelligence optimization algorithms for weapon target allocation problem in multilayer defense scenario[J].Mathematics in Practice and Theory, 2013, 43(7): 76-84. (in Chinese)

[3] 杨晓凌, 邱涤珊, 彭黎, 等. 改进类电磁算法在武器目标分配问题中的应用[J]. 国防科技大学学报, 2011, 33(6): 150-153.

YANG Xiaoling, QIU Dishan, PENG Li, et al. Application of modified electromagnetism-like algorithm in weapon-target assignment problem[J]. Chinese Journal of National University of Defense Technology, 2011, 33(6): 150-153. (in Chinese)

[4] 张涛, 于雷, 魏贤智, 等. 改进遗传算法的超视距协同多目标攻击决策[J]. 火力与指挥控制, 2013, 38(5): 137-140.

ZHANG Tao, YU Lei, WEI Xianzhi, et al. Decision-making for cooperative multiple target attack based on adaptive pseudo-parallel genetic algorithm[J]. Fire Control & Command Control, 2013, 38(5): 137-140. (in Chinese)

[5] 刘传波. 基于Memetic算法的动态武器目标分配问题研究[J]. 舰船电子工程, 2012, 32(10): 34-37.

LIU Chuanbo. Research on dynamic weapon target assignment problem with a kind of Memetic algorithm[J]. Ship Electronic Engineering, 2012, 32(10): 34-37. (in Chinese)

[6] 雷兴明, 邢昌风, 吴玲. 基于分布式约束优化的武器目标分配问题研究[J]. 计算机工程, 2012, 38(7): 128-130.

LEI Xingming, XING Changfeng, WU Ling. Research on weapon target assignment problem based on distributed constraint optimization[J]. Computer Engineering, 2012, 38(7): 128-130. (in Chinese)

[7] 彭星光, 高晓光. 基于记忆辅助动态UMDA的UCAV编队动态目标分配[J]. 系统工程与电子技术, 2010, 32(10): 2166-2170.

PENG Xingguang, GAO Xiaoguang. Dynamic target assignment method for UCAV feet using memory enhanced dynamic UMDA[J]. Systems Engineering and Electronics, 2010, 32(10): 2166-2170. (in Chinese)

[8] 杨山亮, 黄健, 刘洋, 等. 基于遗传算法的联合火力WTA 问题研究[J]. 计算机仿真, 2012, 29(3): 61-63, 136.

YANG Shanliang, HUANG Jian, LIU Yang, et al. Analysis of weapon target assignment problem in joint fire strike solving by genetic algorithm[J]. Computer Simulation, 2012, 29(3): 61-63, 136. (in Chinese)

[9] 马飞, 曹泽阳, 刘晖. 基于博弈论的目标分配策略空间构建与搜索[J]. 系统工程与电子技术, 2010, 32(9):1941-1945.

MA Fei, CAO Zeyang, LIU Hui. Construction and search of strategy space of target assignment based on game theory[J]. Systems Engineering and Electronics, 2010, 32(9): 1941-1945. (in Chinese)

[10] 张毅, 姜青山, 陈国生. 基于模糊-灰色非合作Nash博弈的多组动态武器-目标分配方法[J]. 云南大学学报(自然科学版), 2012, 34(1): 26-32.

ZHANG Yi, JIANG Qingshan, CHEN Guosheng. An approach of basing-on fuzzy-grey noncooperative Nash games to multi-team dynamic weapon-target assignment[J]. Journal of Yunnan University(Natural Sciences), 2012, 34(1): 26-32. (in Chinese)

[11] 熊义杰. 现代博弈论基础[M]. 北京: 国防工业出版社, 2010.

XIONG Yijie. The foundation of modern game theory[M]. Beijing: National Defense Industry Press, 2010. (in Chinese)

[12] Чжан Сяньцзянь. Конфликтно-оптимальное управление ресурсами многообъектных систем летательных аппаратов наземного и воздушного базирования [D]. Москва:Московский государственный технический университет имени Н.Э. Баумана, 2013.

ZHANG Xianjian. Conflict optimal resource management of ground and air-based multi-object aircraft[D]. Russia: Bauman Moscow State Technical University, 2013.(in Russian)

Land defense weapon versus target assignment against air attack

ZHANG Xianjian

(College of Intelligence Science and Technology, National University of Defense Technology, Changsha 410073, China)

Abstract : Considering the high-dynamics, incomplete information and uncertainty of massive operations, on the basis of the analysis and induction of a methods was proposed to solve the problem of dynamic weapon target assignment, a comprehensive mathematical of dynamic game based on both sides was made in structure, a phased solution was provided based on Nash equilibrium algorithm and Pareto optimization. The results validate that combining the mathematical model with the game theory method can effectively deal with the problem of dynamic weapon target assignment efficiently.

Keywords : dynamic weapon target assignment; command and decision-making; Nash equilibrium; Pareto optimization

doi: 10.11887/j.cn.201902027

http://journal.nudt.edu.cn

*收稿日期: 2018-01-28

基金项目: 中国博士后科学基金资助项目(2014M562571,2015T81131)

作者简介: 张先剑(1984—),男,辽宁瓦房店人,讲师,博士,E-mail:ruszxj@163.com

中图分类号: E911

文献标志码: A

文章编号: 1001-2486( 2019) 02-185-06

标签:;  ;  ;  ;  ;  

空陆攻防博弈的动态武器目标分配论文
下载Doc文档

猜你喜欢