小样本数据缺失状态下DBN舰艇编队防空目标威胁评估方法
孙海文, 谢晓方, 孙 涛, 张龙杰
(海军航空大学, 山东 烟台 264001)
摘 要: 针对海上编队防空目标威胁评估过程中样本数据量较少且易缺失、已有评估方法过多依赖专家经验以及难以进行时间序列上动态评估的问题,提出了基于约束参数学习的动态贝叶斯网络(dynamic Bayesian networks, DBN)威胁评估方法。采用AR(p )模型预测时间序列上的缺失数据,从而获得完备的小数据集样本;在此基础上,根据专家经验构建合理的参数约束模型;进一步利用贝叶斯估计进行参数学习;将学习得到的参数代入DBN中,推理求出威胁评估结果;引入效用理论对威胁评估结果进行排序。仿真实验表明该评估方法在小样本数据缺失状态下目标威胁评估的结果合理,准确性高。
关键词: 动态贝叶斯网络;约束模型;参数学习;AR(p )模型;小样本数据缺失;威胁评估及排序;效用理论
0 引 言
威胁评估[1]是舰艇编队防空作战指挥决策中的重要组成部分,它是指挥员定下作战决心和进行目标分配的基础。
目前,常用的空袭目标威胁评估方法有多属性决策方法[2-4]、模糊理论方法[5-6]、粗糙集理论[7]、贝叶斯网络[8-9]等。由于舰艇编队防空中影响来袭目标威胁评估的因素较多,评估体系较复杂,而多属性决策方法和模糊理论方法通常不能很好地呈现出各评价指标的实际情况,使得评估结果不准确;同时,来袭目标速度较快,留给武器系统的反应时间较短,对威胁评估的实时性要求较高,而粗糙集理论需要建立庞大的知识库来支持相关规则的构建,会造成处理速度慢,难以保证实时性。
威胁评估涉及的因素较多,而且这些因素存在不完整、不确定的特性。贝叶斯网络(Bayesian network,BN)能够有效处理不确定问题,但存在以下问题:一是条件和转移概率选取上大多依赖于专家经验,可靠性较差,文献[10-13]采用BN进行目标威胁评估,但文献中贝叶斯网络参数的选取过多依赖专家知识,并未从样本数据中获取参数;二是大多参数学习方法只适用于拥有大量样本数据的情况下,小样本数据下其参数学习精度较低,文献[14]利用期望最大及文献[15-16]利用梯度法进行参数学习,这些方法在大样本数据的情况下,参数学习精度较高;三是实际过程中获取的样本数据量较少,且存在一些定量指标(如目标高度、速度和距离等)数据丢失问题,如果抛弃缺失数据会引起数据集变小,造成统计样本不足,无法反映实际情况,因此需要对缺失的样本数据进行修补,文献[17]利用支持向量机对样本数据进行修补,由于威胁评估指标较多、相互之间关系较复杂,支持向量机最优核函数宽度和惩罚因子等参数较难确定,修补过程较复杂。
为解决上述问题,提出了基于约束参数学习的动态贝叶斯网络(dynamic Bayesian network,DBN)威胁评估方法。针对目标属性中的定量数据缺失问题,采用自回归AR(p )模型,结合贝叶斯信息准则(Bayesian information criterion, BIC)以及最小二乘估计,进行自适应快速数据修补;根据编队防空威胁评估各指标之间及与威胁度之间的相互关系,构建一阶马尔可夫模型;实际过程中威胁评估的样本数据获取代价大,数据量较少,为了提高小样本数据下的参数学习精度,根据专家经验建立参数约束模型,将网络结构中的参数约束到合理区间内,然后结合贝叶斯估计进行参数学习;引入效用理论对贝叶斯网络推理的威胁评估结果进行排序;仿真实验表明,该方法能充分有效地利用数据库中的样本信息,准确地进行舰艇编队防空目标威胁评估及排序。
1 建立评估指标
建立编队防空中来袭目标威胁评估指标如图1所示。
[7]陈宝生:《坚持以本为本推进四个回归--建设中国特色、世界水平的一流本科教育》,http://news.cslg.edu.cn/index/read/id/77521.
图1 编队来袭目标威胁评估指标
Fig.1 Indexes of formation incoming target threat assessment
为了便于指挥员进行编队舰空导弹拦截指挥决策,对敌方来袭目标按照威胁程度进行划分,分为3个等级[18],分别为:Ⅰ级威胁(高)、Ⅱ级威胁(中)、Ⅲ级威胁(低)[19]。
1.1 目标类型
在编队防空作战中,不同的目标类型对舰艇的威胁程度也不相同,随着编队防空作战范围的增大,其面临的目标也更复杂。根据目前对目标的识别能力,可将目标区分为导弹(A类)、小飞机(B类)、直升机(C类)、大飞机(D类)和空中不明目标(E类)等5类[19]。
演唱会音乐,一般均拥有一定的人数规模,并在观众面前进行现场音乐表演。演唱会对于音乐爱好者而言,是一个狂欢的活动。在现场,他们的情绪可以得到尽情的释放,如激动、悲愤等。据资料显示,近年来,演唱会音乐已逐渐发展为音乐产业中重要组成部分,且门票销售收入一直呈持续增长的趋势。此外,由演唱会演变的音乐节,成为音乐产业中的一匹黑马脱颖而出。音乐节的出现,对音乐和表演者而言,将重新包装提升其价值,从而获取更多的利润。到目前为止,已举行百余场音乐节,预计未来将会达到更多。
1.2 目标高度
目标高度是指目标距海平面的垂直距离[20]。这里根据舰载雷达对探测目标的高度要求,对高度进行分类分为“超低空”“低空”“中空”“高空”。
1.3 目标径向速度
目标径向速度是指目标相对要攻击舰艇的相对速度[19]。根据现有海上空中目标的速度特点,将速度划分为“低速”“亚音速”“跨音速”“超音速”。
1.4 目标攻击意图
在海上编队防空作战中,受攻击舰艇的重要性对评估来袭目标威胁程度有影响,受攻击舰艇的重要性越高,则来袭目标威胁程度就越高。编队内各舰艇的重要性要根据编队当前所执行的任务性质、编队内各舰艇在完成该任务的能力大小以及舰艇本身的重要性来确定[19],这里将舰艇重要性类型为“低”“中”“高”。企图攻击编队内重要性越高的舰艇,攻击意图的威胁属性类型就越高。攻击意图的威胁属性类型分别按照舰艇的重要性类型划分为“高”“中”“低”。
中学阶段,孩子的独立性更强,具备生活、学习自理能力,学习习惯基本养成。尤其是进入高中,成绩成为家长和老师关注的焦点,孩子们日益增大的学习压力带来的心理问题容易被忽视。所以,在中学班级群里,老师与家长除了沟通基本的学习信息外,更要帮助家长正视孩子的成长问题,与孩子一起面对,共同成长。如相互交流和分享“处于青春期的孩子有哪些特征”“如何引导孩子进行职业生涯规划”“如何和谐有效地与孩子进行沟通”“如何帮助孩子克服学习上的困难”等。孩子心理健康了,目标明确了,方法找到了,成绩自然就上去了。
1.5 目标距离
目标距离是指目标相对要攻击舰艇的距离[19]。根据舰载防空武器发射区远近界对距离进行分类,分别为“近”“较近”“中”“较远”“远”。
1.6 目标电磁信号
各传感器捕获的敌方电磁信号,能够在某种程度上反映出目标实时的威胁,对来袭目标威胁评估有着重要影响[20]。主要包括:导弹末制导雷达信号b 1、导弹制导雷达信号b 2、搜索雷达信号b 3、导航雷达信号或敌我识别器信号b 4等电磁信号。
2 基于AR(p )模型的数据修补
2.1 基于AR(p )的小样本数据修补
舰艇编队防空过程中,来袭目标的定量观测数据是通过传感器在时间序列上进行等间隔采样获取的,数据之间存在一定的依附关系。这里可以采用AR(p )模型[21]对数据进行预测。AR(p )模型定义为
X t =a 1X t-1 +a 2X t-2 +…+a p X t-p +u t
(1)
式中,X t 为第t 时刻的观测数据;a =[a 1,a 2,…,a p ]T为自回归参数向量;u t 为白噪声,其阶数为p 。在利用AR(p )模型进行数据预测过程中,要求数据在时间序列上是平稳随机过程,因此假设传感器在测量数据的过程中不考虑人为误操作和设备波动等粗大误差的影响,传感器测量的数据满足平稳随机过程的要求。
2.2 基于BIC准则确定AP(p )阶数
BIC是模型拟合优良性的一种标准,用其来确定p 值,其定义为
12月25日晚间,三七互娱公告称,代理董事长李卫伟提议公司回购股份,回购资金总额不低于3亿元,不超过6亿元,回购价格不超过15元/股。若全额回购且按回购总金额上限和价格上限测算,预计可回购约4000万股,回购比例约占公司总股本的1.88%。
(2)
式中,p 为模型的阶数;N 为时间序列的个数;为拟合残差方差。
从p =1开始对观测数据进行自回归拟合,获取然后逐渐增大阶数p 的值重复进行拟合,随着阶数增加,BIC的函数值逐渐减小,这时起决定作用,当增大到某一阶数p 0时,BIC的函数值达到极小值,随后随着阶数的增加,残差方差的变化量非常小,模型阶数起决定性作用,BIC的函数值逐渐增大。此时,取p 0为最佳回归模型阶数。
2.3 基于最小二乘法的参数估计
利用最小二乘法对自回归模型中的参数向量a =[a 1,a 2,…,a p ]T进行估计。
(3)
令∂S (a )/∂a =0,可得到正规方程组
(4)
由式(4)运算得
(5)
分别构建BN模型和DBN模型,如图6和7所示。
(6)
进一步得到矩阵方程
(A T·A )·a =A T·φ
(7)
则得到a 及σ 2的最小二乘估计及分别为
(8)
(9)
将得到的代入式(2)中求取p 值,从而得到适合的AR(p )模型。
综上,采用AR(p )模型进行数据修补过程中,可以根据不同的时间序列个数和不同的样本数据值,通过BIC和最小二乘方法求解出最优的AP(p )模型参数,具有自适应修补能力。
3 约束贝叶斯参数学习
3.1 构建一阶马尔可夫模型
一阶马尔可夫模型的功能在于能够根据已有时间片(time slice,TS)上的观测变量序列,估计对应的隐藏变量状态,具有时间关联性;同时,该模型的状态转移概率是在给定上一时刻的变量状态时下一时刻相关变量的条件分布,其运算过程中参数相对较少,结构简明合理,可利用前向后向算法进行快速推理,被广泛使用[22]。构建如图2所示一阶马尔可夫模型,它的每一个TS是由一个隐藏状态变量X 和若干观测变量组成,其中隐状态变量是指无法直接观测到的变量,观测变量顾名思义是指可以直接观测到的变量;从编队防空威胁评估指标体系中可见,威胁评估等级可作为隐状态变量,威胁评估指标(如目标类型、目标高度等)可作为观测变量,从而构建具有时间关联性的一阶马尔可夫模型,进行动态威胁评估。
图2 一阶马尔可夫模型
Fig.2 First order Markov model
3.2 构建约束条件
以目标高度数据为例进行缺失数据修补。传感器从发现目标时刻开始,等间隔对目标数据进行采样,在此过程中由于电磁干扰或目标大幅机动导致目标高度数据丢失,随着时间的推移,丢失数据将会增多,进而影响贝叶斯网络参数学习的准确性。当采样间隔足够小时,目标任何高度变化趋势都将反映在数据序列中。小样本数据中来袭目标高度值如表1所示。
唐飞霄闻言脸色微变,对方拿臭虫与自己相提并论,已是不善。他心中恼火,却仍以一副笑脸回道:“何必呢?大师与我唐门的宿怨,早已是陈年旧事,小生那时尚未临世,无缘其中瓜葛,还望大师不要与小生为难。”
假设第t 个TS中一个由n 个观测节点组成的贝叶斯网络设节点共有m 个状态,其父节点X t 有l 个状态。
条件概率
(10)
转移概率
(11)
当父节点状态固定为某一状态时,条件概率的约束关系
(12)
当状态转移的前一状态X t-1 固定为某一状态时,状态转移的约束关系
p (X t =k 1|X t-1 =j )<p (X t =k 2|X t-1 =j )<
p (X t =k 3|X t-1 =j )<…
(13)
假设根据专家经验得到参数约束条件
(14)
同理状态转移概率也符合式(14)所述约束条件。
3.3 先验分布中超参数的确定
设样本数据集为D ,在计算P (D |θ )时需对先验概率P (θ )进行假设:
假设 1 各参数之间相互独立。
假设和都是狄利克雷分布,因此,假设先验分布p (θ )是狄利克雷分布D [α 1,α 2,…,α r ][23],即
(15)
式中,
狄利克雷分布D [α 1,α 2,…,α r ]的边缘分布是β 分布B [α 1,α 2],设参数θ 表示或即每个参数θ 服从B [α 1,α 2],其期望为α 1/(α 1+α 2)。
由贝叶斯估计可得
研究区白音高老组火山岩与大多数A型花岗质岩石的地球化学特征一致,且A型花岗岩的形成与张性环境相联系(Eby,1990;王德滋和赵广涛,1995;吴才来等,1998)。额仁高比地区在早白垩世处于岩石圈伸展减薄的作用阶段,表明本区白音高老组火山岩形成于板内拉张的大地构造环境。
P (θ |D )=hP (D |θ )P (θ )=
h ′(θ )d1 (1-θ )d-d 1·beta[α 1,α 2](θ )=
beta[α 1+d 1,α 2+d -d 1](θ )
(16)
即θ 期望值为
(17)
式中,α 1、d 1分别为满足所假设θ 值的虚拟样本数量和实测样本数量;α 2为不满足所假设θ 值的虚拟样本数量;d 为实测总样本数量。从式(14)可见在实测样本数量较少的情况下,参数精度主要依赖约束模型下获得的虚拟样本,随着实测样本数量增多,参数精度取决于实测样本。
当我们意识到,浅阅读作为一个阅读初始阶段的方法,是每个进入阅读的人都要遇到的。它其实是有着非常积极而重要的价值。
由约束条件给出了参数的取值范围,在无任何先验条件的情况下,可认为参数均匀分布在区间内,设参数θ 服从U [θ 1,θ 2],则
(18)
利用B [α 1,α 2]去等效U [θ 1,θ 2]来获取β 分布中超参数α 1和α 2的值。
(19)
采用二阶矩阵法进行拟合
(20)
(21)
将得到的虚拟样本α 1、α 2代入到式(17)中,求解得到网络参数。
4 仿真实验
设由一艘驱逐舰(K 1)、两艘护卫舰(K 2、K 3)组成舰艇编队。假设经专家对舰艇重要性进行评定,3艘舰艇的重要性为K 1为高、K 2为中、K 3为低,假设在过去作战或演习中记录保存了某一时间段采集的样本数据,用其进行仿真实验。
4.1 缺失样本数据修补
小样本数据不能反映总体的客观规律,为了提高小样本数据下参数学习精度,需要根据专家经验建立参数约束模型,将参数约束到合理的区间内,具体约束模型的建立如下。
在TS3,此时目标1仍以超音速、超低空向我方舰艇进行攻击,威胁值达到最大。目标2进一步接近为我方舰艇编队,威胁值增大。目标3提高飞行速度,其威胁值增大。目标4降低高度,且离我编队距离拉近,其威胁值增大。目标5相比TS1的状态,其变化较为合理,正逐渐接近我舰艇编队,威胁等级为中,其威胁值有所增大。由此可见本文所用方法的评估结果符合实际情况。
表1 小样本数据中来袭目标高度值
Table 1 Incoming target height in small sample data
求取最佳回归模型阶数如图3所示。
图3 不同阶数下模型BIC的值
Fig.3 Value of the model BIC under different orders
从图3中可知从p =1开始逐渐增大p 值,当p =2时BIC值最小,根据BIC准则,模型阶数p 为2。确定模型阶数后,利用最小二乘估计得到参数估计为
(22)
建立预测模型
(23)
由此可得t 10目标预测高度为93.47 m,从表1中高度数据可见,随着时间的推移,目标高度下降趋势明显增大,对我方的威胁也不断提升。
在以往数据样本获取中,均假设样本数据是完备的,但在实际样本获取中,由于电磁干扰或目标机动等情况样本数据信息可能会部分丢失,采用AR(p )模型可以有效地预测缺失数据,为贝叶斯网络参数学习提供完备的样本数据,从而提高参数学习的准确性。
商业银行债务受让期间的以物抵债业务应当按照会计准则及税法要求进行会计税务核算,整个过程需以业务实质为出发点,按照实质重于形式的原则,准确把握会计准则及税收制度的要求和内涵,确保科学全面、合理合法、控制风险,不断提升会计核算及税务处理工作水平,结合自身实际制定对应方案,确定商业银行股东利益最大化。
4.2 约束参数学习算法仿真
以目标高度H 为例,将目标高度值按照舰载雷达对探测目标的高度要求进行分类。在仿真之前按照专家经验给出对应参数的约束模型
(24)
假设给出条件概率P (H |W )如表2所示。
表2 条件概率
Table 2 Conditional probability
通过计算P (H =超低空|W =高)、P (H =低空|W =高)、P (H =中空|W =高)、P (H =高空|W =高)与最大似然估计[24]进行比较,分别在样本数量为10、30、50、70、90的条件下进行对比实验,结果如表3所示。
表3 不同样本量下的统计计算结果
Table 3 Statistical calculation results under different sample numbers
从表3中可以粗略看出在小样本数据下约束贝叶斯估计参数学习精度较高。为了更直观比较两个方法的参数学习精度,引入Kullback-Leibler Divergence (KL)距离,也叫相对熵,可以用来衡量两概率分布差异。
(25)
图4为不同样本数量下两种方法的KL距离,由图4可见,在样本量小于90的情况下,约束贝叶斯估计参数学习精度比最大似然估计高。
为了进一步明确目标威胁程度,进行威胁排序,引入效用理论[25]。效用是一个将定性抽象概念映射到定量实数的函数,针对评价指标包含多个状态的情况下,根据专家知识和经验,取各状态权值,将各状态概率进行加权求和,获取的值即为威胁度。
数据收集方面可以应用大数据技术达成目的,在该过程中,投资者通过大数据平台对有投资意向的中小企业进行研究,通过大数据技术对中小企业运行中产生各类票据进行收集和记录,另外收集的信息也包括中小企业的员工评价、员工离职率等内容,最终将获取的数据进行记录。另外通过大数据技术也能够实现对整个供应链数据的获取,积极探求中小企业运行和发展中整个产业链对企业的影响程度,以及相关辅助措施的完善情况,从而为后续的数据分析过程打下基础。
在公共消防安全服务供给环节中,基层政府通过各种优惠政策扶持消防中介组织,通过购买中介组织的服务,并对其进行监督管理,保证服务质量。 消防中介组织接受政府的购买,对社区委员会的居民进行教育、培训,提供服务。 社区委员会则建立起了政府和民众沟通的桥梁,在落实政策、沟通和监督居民维护消防设施的行为上发挥重要作用。 公共安全消防供给应该是联动的,建立政府、社会组织、居民之间的联动机制是公共消防服务供给在适应新时代形势下的新出路。
4.3 DBN与BN目标威胁评估仿真对比分析
假设某3个连续TS 1、2和3的观测节点变量状态如表4所示,相邻2个TS之间的时间间隔为4.0 s。
图4 不同样本数量下两种参数学习方法的KL距离
Fig.4 KL distance of two parameter learning methods under different sample numbers
图5 样本量为10时10次试验的KL距离
Fig.5 KL distances of the 10 tests in the sample number 10
表4 网络结构中各观测指标信息
Table 4 Information of each observation index in the network structure
这里令
图6 BN模型
Fig.6 BN model
图7 TS1到TS3的隐马尔可夫模型
Fig.7 Hidden Markov model of TS1 to TS3
按照图6和图7所示的BN模型和动态贝叶斯网络(dynamic Bayesian network,DBN)模型,分别对3个TS中的5个目标进行威胁评估,评估结果如表5和表6所示。
表5 BN模型和DBN模型在TS1和TS2上的推理结果
Table 5 Reasoning results of the BN and DBN models at TS1 and TS2
续表5
Continued table 5
续表5
Continued table 5
表6 BN模型和DBN模型在TS3上的推理结果
Table 6 Reasoning results of the BN and DBN models at TS 3
由于采样是随机的,一组样本数据不能表明方法的优劣。这里进行10次实验,每次实验获取10组数据。计算10次采样的KL距离如图5所示。
利用效用函数获取目标威胁值
M k =P (W k )E ′(W k )
(26)
式中
从图5中可见,在小样本数据下约束贝叶斯估计参数学习精度比最大似然估计要高,且其稳定性较好。
P (W k )=[P (W k =高),P (W k =中),P (W k =低)]
根据专家知识取效用值为E (W k )=[1,0.5,0.25]。
根据式(26)分别求不同TS、不同模型推理下的5个目标威胁值如表7所示。
表7 目标威胁值
Table 7 Target threat values
根据表5~表7分析可得,在TS1,舰载传感器发现目标1~5。其中目标1为导弹类,正以跨音速、低空接近我方舰艇,攻击意图明显,威胁评估等级为高。目标2为大飞机类,该目标正在高空、远距离、低速进行搜索侦察,威胁等级为低。目标3为不明飞行物,该目标正以亚音速,低空接近我方舰艇,但其攻击意图不明显,威胁等级为中。目标4为直升机类,该目标攻击意图较明显,威胁等级为中。目标5为歼轰机类,目标正以亚音速、低空、较远距离接近我方舰艇,且攻击意图明显,威胁等级为中。
在TS2,仍可发现目标1~5。此时目标1末制导雷达开机,速度提高,高度下降,正超音速、超低空向我方舰艇进行攻击,威胁值增大。目标2正缩小搜索范围,高度下降,离我编队距离拉近,威胁值增大。目标3速度和高度基本不变,但目标可能进行航路规划,其威胁意图提高,且距离缩短,威胁值增大。目标4由于直升机速度低、机动性差,在短时间内威胁变化较小。目标5的威胁等级为低,在较短的时间内,威胁值变化较大,与TS3中的数据比较可知,其在TS2的探测过程中出现粗大误差。
由图可知,当产生15000个参数样本后,刘家河站AM抽样的ES值大约稳定在2.5左右,且抽样次数不足5 000次时曲线便已稳定,DR抽样的ES值在2.0附近波动,而MH抽样的ES曲线仍呈上升趋势,说明马尔科夫链尚未收敛到参数的后验分布;EM曲线趋势与ES曲线相同,其余各站情况类似,即在同等抽样次数下,AM抽样的ES值最早达到稳定,收敛最快,DR抽样的结果次之,MH抽样在试验次数内无法收敛到参数的后验分布。对于理论频率和经验频率的拟合结果,由图可知,三种抽样方法的结果基本相同,可认为不同抽样算法对参数样本的频率拟合效果没有影响。
PCT及ESR是全身炎症反应的标志,PCT>0.5 ng/ml,临床常提示有较为严重的细菌感染。本研究病例均在收入院24 h内抽取静脉血进行PCT及ESR检查,故可能是采血时间早未能完全反应机体的炎症水平,导致PCT及ESR值较低。
进一步分析,根据表7可知,TS1时刻目标威胁排序为:1>3>5>4>2;BN模型推理下,TS2时刻目标威胁排序为:1>3>4>2>5,TS3时刻目标威胁排序为:1>3>5>4>2;DBN模型推理下,TS2时刻目标威胁排序为:1>3>4>5>2,TS3时刻目标威胁排序为:1>3>5>4>2。目标5在BN模型推理下的威胁值变化较大。为了更直观表现各目标在不同TS、不同模型推理下的威胁值变化,绘制如图8和图9所示的柱形图。
根据图8分析比较可知,利用BN模型估计目标5在TS1和TS2下的威胁值,变化较大,在BN模型估计得到的威胁值下降较快,其威胁值小于目标2(D类)威胁值。实际过程中目标5(B类)由于速度快、可携带反舰导弹,对我方仍具有较大威胁,而BN模型估计该威胁值下降幅度很大,且低于直升机类目标(目标2)威胁值,这与实际不符。利用DBN模型估计的结果变化较平稳。在实际过程中目标5的数据出现了粗大误差,由于DBN具有较强的滤波能力,在出现粗大误差时,其评估结果具有一定的容错能力,能够保持较高的准确性。
试验原料为四川会理地区红土镍矿,主要成分见表1,矿中铁以三氧化二铁、针铁矿等形式存在。将红土镍矿与硫酸铵进行混合焙烧,焙烧后铁以可溶性硫酸铁盐形式存在于熟料中。
图8 TS1、TS2(BN)和TS2(DBN)下的威胁值
Fig.8 Threat values under TS1, TS2 (BN) and TS2 (DBN)
图9 TS2(BN)、TS3(BN)和TS3(DBN)下的威胁值
Fig.9 Threat values under TS1, TS2 (BN) and TS2 (DBN)
进一步分析图9,利用DBN模型估计目标5在TS3上的状态,其威胁值相比TS2变化较大,这是因为当前时间片是结合TS1和TS2上的目标数据,而目标5在TS1和TS2(DBN)上的威胁值相对较大,进而使得目标5在TS3获得较大的威胁值。这说明当在TS3上目标5的数据恢复正常的情况下,采用DBN模型估计同样可得到较为合理的威胁值。进而可得,DBN能够有效结合之前时间片上的数据对当前威胁度进行综合评估,评估结果较为可靠。
5 结 论
仿真实验证明所采用的AR(p )模型在平稳随机过程中能够有效进行数据预测修补;在修补过程中,可以根据不同的时间序列个数和不同的样本数据值,通过BIC准则和最小二乘方法求解出最优的AP(p )模型参数,具有一定自适应修补能力。
仿真实验证明了在小样本条件下利用约束模型进行贝叶斯估计参数学习,其参数学习精度优于传统的最大似然估计,且具有较好的稳定性,进而提高了贝叶斯网络推理的准确性。
采用一阶马尔可夫模型进行DBN推理,相比于静态贝叶斯网络具有较强的滤波能力,仿真实验证明了在观测数据出现粗大误差的情况下,DBN推理结果具有较好的鲁棒性,其评估结果更符合实际情况,准确度高。
参考文献:
[1] 徐浩,邢清华,王伟,等.基于改进结构熵权法的目标威胁灰色综合评估[J].信息工程大学学报,2016,17(5):620-625.
XU H, XING Q H, WANG W, et al. Threat assessment based on improved structure entropy and gray theory[J]. Journal of Information Engineering University, 2016, 17(5): 620-625.
[2] 潘科,潘宣宏,郭新奇.基于多属性决策的水面舰艇防空威胁判断分析[J].计算机与数字工程,2014(5):802-804,821.
PAN K, PAN X H, GUO X Q. Target threat judgment in surface antiaircraft based on MUDP[J].Computer and Digital Engineering,2014,42(5): 802-804, 821.
[3] 李春芳,赵虹,巴宏欣,等.基于多属性分类决策的空中目标威胁评估模型[J].指挥信息系统与技术,2011,2(6):55-58.
LI C F, ZHAO H, BA H X, et al. Aerial target evaluation model based on multiple attribute decision making[J]. Command Information System and Technology, 2011, 2(6): 55-58.
[4] XU Y J, WANG Y G, MIU X D. Multi-attribute decision making method for air target threat evaluation based on intuitionistic fuzzy sets[J]. Journal of Systems Engineering and Electronics, 2012, 23(6): 891-897.
[5] 雷英杰,王宝树,路艳丽.基于自适应直觉模糊推理的威胁评估方法[J].电子与信息学报,2007,29(12):2805-2809.
LEI Y J, WANG B S, WANG Y. Techniques for threat asses-sment based on intuitionistic fuzzy reasoning[J]. Journal of Electronics and Information, 2007, 29(12): 2805-2809.
[6] AZIMIRAD E,HADDADNIA J. Target threat assessment using fuzzy sets theory[J]. Advances in Intelligent Information, 2015, 1(2): 57-74.
[7] 范翔宇,王红卫,索中英.基于粗糙集-信息熵的辐射源威胁评估方法[J].北京航空航天大学学报,2016,42(8):1755-1760.
FANG X Y, WANG H W, SUO Z Y. Radiator threat evaluating method based on rough set and information entropy[J]. Journal of Beijing University of Aeronautics and Astronautics, 2016, 42(8): 1755-1760.
[8] OKELLO N, THOMS G. Threat assessment using Bayesian networks[C]∥Proc.of the 6th International Conference of Information Fusion, 2003:1102-1109.
[9] SUSHIL K, BIPIN K T. Modelling of threat evaluation for dynamic targets using Bayesian network approach[J]. Procedia Technology, 2016(24):1268-1275.
[10] 孟光磊,龚光红.基于混合贝叶斯网的空域目标威胁评估方法[J].系统工程与电子技术,2010,32(11):2398-2401.
MENG G L, GONG G H. Threat assessment of aerial targets based on hybrid Bayesian network[J]. Systems Engineering and Electronics, 2010, 32(11): 2398-2401.
[11] 王玉惠,韩占朋,陈哨东,等.防空态势评估系统分析及新型评估模型研究[J].南京航空航天大学学报,2014,46(4):558-565.
WANG Y H, HAN Z P, CHEN S D, et al. Analysis and mo-deling of threat evaluation system in air defense operations[J]. Journal of Nanjing University of Aeronautics and Astronautics, 2014, 46(4): 558-565.
[12] 姚跃亭,赵建军,万宇.贝叶斯网络下考虑攻击企图的目标威胁评估[J].火力与指挥控制,2012,27(5):63-67.
YAO Y T, ZHAO J J, WANG Y. Threat assessment with attack attempt of target based on Bayesian network[J]. Fire Control and Command Control, 2014, 39(2):16-20.
[13] 刘振,彭军,胡云安.一种新型动态贝叶斯网络及其在威胁评估中的应用[J].火力指挥与控制,2014,39(2):16-20.
LIU Z, PENG J, HU Y A. A new kind dynamic Bayesian network and application to threat assessment[J]. Fire Control and Command Control, 2014, 39(2):16-20.
[14] GRAHAM C G, JUAN C A. Approximate EM algorithms for parameter and state estimation in nonlinear stochastic models[C]∥Proc.of the 44th IEEE Conference on Decision and Control, and the European Control Conference, 2005: 12-15.
[15] FU S Y, GUO S Y, HOU Z G. Multiple kernel learning from sets of partially matching image features[C]∥Proc.of the 19th International Conference on Pattern Recognition, 2008:1-4.
[16] LIAO W H, QIANG J. Learning Bayesian network parameters under incomplete data with domain knowledge[J]. Pattern Re-cognition, 2009, 42(11): 3046-3056.
[17] 任佳,高晓光,茹伟.目标数据缺失下离散动态贝叶斯网络的参数学习[J].系统工程与电子技术,2011,33(8):1885-1890.
REN J,GAO X G,RU W.Paramenter learning of discrete dynamic Bayesian network with missing target data[J]. Systems Engineering and Electronics, 2011, 33(8): 1885-1890.
[18] 代进进,李相民.舰艇编队网络化防空作战空袭目标威胁评估[J].系统工程与电子技术,2013,35(3):532-538.
DAI J J, LI X M. Threat evaluation of air strike targets for warship formation networked air-defense operation[J]. Systems Engineering and Electronics,2013,35(3):532-538.
[19] 孙海文,谢晓方,孙涛,等.基于DDBN-Cloud的舰艇编队防空目标威胁评估方法[J].系统工程与电子技术,2018,40(11):126-134.
SUN H W, XIE X F, SUN T, et al. Threat assessment method of warships formation air defense based on DDBN-cloud model[J]. Systems Engineering and Electronics,2018,40(11):126-134.
[20] 李大鹏,谭乐祖,李漫斯.舰艇编队超视距反导威胁评估指标主观权重确定[J].电光与控制,2013,20(11):21-25.
LI D P, TAN L Z, LI M S. Subjective weight determination of warship formation in over-the-horizon anti-missile threat estimation[J]. Electronics Optics and Control,2013,20(11):21-25.
[21] 唐鑫, 杨建军, 冯松, 等. 数据缺失状态下目标威胁评估的AP(p )动态突变排序法[J].系统工程与电子技术,2017,39(5):1059-1064.
TANG X, YANG J J, FENG S, et al. AR(p) dynamic catastrophr ranking method of target threat assessment under the loss of data[J]. Systems Engineering and Electronics, 2017, 39(5): 1059-1064.
[22] 高晓光,陈海洋.离散动态贝叶斯网络推理及其应用[M].北京:国防工业出版社,2016:44-63.
GAO X G, CHEN H Y. Discrete dynamic Bayesian networks inference and its application[M]. Beijing: National Defense Industry Press, 2016: 44-63.
[23] UENO M. Learning likelihood-equicalence Bayesian networks using an empirical Bayesian approach[J]. Behaviormetrika, 2008, 35(2): 115-135.
[24] 吴永广,周兴旺.布尔型贝叶斯网络参数学习[J].兵器装备工程学报,2015(5):155-158.
WU Y G, ZHOU X W. Parameter learning of Boolean Bayesian networks[J]. Journal of Weaponry and Equipment Engineering, 2015,36(5): 155-158.
[25] RUSSELL S J, NORVIG P. Artifigial intelligence a modern approach[M]. Cambridge: Pearson Publishing Ltd, 2010: 509-528.
Threat assessment method of warships formation air defense based on DBN under the condition of small sample data missing
SUN Haiwen, XIE Xiaofang, SUN Tao, ZHANG Longjie
(Naval Aeronautical University ,Yantai 264001 ,China )
Abstract: On threat assessment of marine formation air defense target, the sample data are less and easy to be missing, and existing evaluation methods rely too much on expertise and are difficult to carry out dynamic assessment on time series. In order to solve these problems, a threat assessment method based on dynamic Bayesian networks (DBN) of constraint parameter learning is proposed. The AR(p ) model is used to predict the missing data on the time series, so as to obtain a complete sample of small data sets. On the basis of this, a reasonable parameter constraint model is constructed according to expertise experience. The parameter learning is carried out by Bayesian estimation under the parameter constraint model. The learning parameters are brought into DBN to get the threat evaluation results. The utility theory is introduced to sort the results of threat assessment. The simulation results show that the evaluation method is reasonable and more accurate in the condition of absence of small sample data.
Keywords: dynamic Bayesian networks (DBN); constraint model; parameter learning; AR(p ) model; small sample data missing; threat assessment and ranking; utility theory
中图分类号: E 273, TJ 761, TP 274, E 919
文献标志码: A
DOI: 10.3969/j.issn.1001-506X.2019.06.18
收稿日期: 2018-08-24;
修回日期: 2019-01-06;
网络优先出版日期: 2019-03-18。
网络出版地址: http:∥kns.cnki.net/kcms/detail/11.2422.TN.20190318.0938.020.html
基金项目: 中国博士后科学基金(2013T60923)资助课题
作者简介:
孙海文(1990-),男,博士研究生,主要研究方向为武器系统建模与仿真、舰空导弹综合控制技术。
E-mail:842904820@qq.com
谢晓方(1962-),男,博士研究生导师,教授,硕士,主要研究方向为武器系统建模与仿真、火力指挥与控制。
E-mail:xiexfl06@yohoo.com.cn
孙 涛(1980-),男,讲师,博士,主要研究方向为武器系统建模与仿真、火力指挥与控制。
E-mail:tgzydz@163.com
张龙杰(1983-),男,讲师,博士,主要研究方向为武器系统建模与仿真、火力指挥与控制。
E-mail:ljcx1213@163.com
标签:动态贝叶斯网络论文; 约束模型论文; 参数学习论文; AR(p)模型论文; 小样本数据缺失论文; 威胁评估及排序论文; 效用理论论文; 海军航空大学论文;