基于K-Means聚类算法的空中态势威胁挖掘
谷玉荣,黄耀雄,高 艳,郭 静
(北方自动控制技术研究所,太原 030006)
摘 要: 战场环境复杂多样,各种探测手段层出不穷,空中威胁属性指标种类繁多,增大了指挥员对空中态势威胁分析难度。正确、快速地对空中态势进行威胁分析,将给战场部署提供有效的决策依据。建立基于K-Means聚类算法的空中目标威胁等级聚类模型,通过对空中目标威胁属性特征的数据进行分析,对威胁目标聚类进行深度挖掘,将目标威胁等级问题转化为最优聚类问题。实例分析表明该算法在对威胁目标等级聚类中有效,提高了目标威胁等级聚类的可靠性、精确性。
关键词: 威胁属性指标,空中态势威胁,K-Means聚类算法,目标威胁等级
0 引言
现在航空与航天一体化预警、侦查、探测技术的飞速发展和以微电子技术、计算机技术、网络技术、人工智能技术、通信技术等为基础的信息技术在防空对抗领域的广泛运用,形成了空、天、地一体化的情报信息。面对这些海量的数据,战场指挥员如何高效分析战场态势数据,快速、精确地判断出空中潜在威胁目标,将成为影响战争全局的极其重要的因素。本文利用数据挖掘中的K-Means均值算法对空中态势信息进行深度聚类分析,及时准确地判明敌方行动意图,可使指挥员全面、准确地掌握战场态势,快速找出威胁度高的目标,从而更好地保护重要作战目标。
该机组汽封2010年进行了1次改造,高中压缸叶顶汽封改造为可退让式汽封;高中压缸隔板汽封、前后轴封、高中压间(过桥)汽封改造为铁素体刀齿蜂窝汽封和铁素体接触式蜂窝汽封。2016年机组揭缸检查发现汽封已磨损严重,调节余量难以满足要求,为适应节能技术的进步、提升机组性能,本次A修决定将高中压缸隔板汽封、前后轴封、高中压间(过桥)汽封、高中压缸叶顶汽封全部进行了更换。经招标,选用汽封结构形式为铁素体汽封和铁素体接触式汽封。
1 空中态势威胁挖掘
随着防空对抗领域作战节奏加快和作战手段增强,敌方空中作战部署对我方空中态势的威胁越来越大。为了使指挥员不成为战场态势感知的“瞎子”和“聋子”,需要对空中态势威胁因素进行深度挖掘,分析出威胁度最高的敌方目标。空中态势威胁挖掘是从大量的战场数据中获取与空中态势威胁有关的数据,利用属性约简的方法,合理选取威胁属性特征并对其进行量化处理,结合数据挖掘的算法建立挖掘模型,确定敌方目标对我方阵地构成的威胁程度。目前,空中态势威胁挖掘的研究成果主要集中在以下两个方面[1],如图1所示。
图1 空中态势威胁挖掘
其中,定性推理是战场指挥员通过作战指挥经验和主观能动性,对敌方具有威胁能力目标的状态和行为进行细致观察和分析,从而给出评价的方法,缺乏对客观数据的分析;定量计算主要将威胁属性特征的客观数据进行数据探索和数据特征分布分析,通过离散化、标准化、归一化等处理,建立数学挖掘模型,分析空中态势目标威胁等级,具有客观化、特征化、精确化等特点[2]。
被动式热释电红外探头的工作原理及性能:人体正常温度为37℃,发出的红外线波长大概为10.0um。人体红外探头能探测到人发出的大于这个范围值的波长的红外线,所以该仪器就能工作。该探头具有如下特点。
2 K-Means聚类算法原理
Means聚类算法是在没有给定目标分类的情况下,根据目标类内误差最小化的距离相似度进行分组,是一种基于距离的非监督学习算法。即两个目标之间的距离越近,相似度越大,聚为同一类的概率越大。在防空对抗作战的态势威胁挖掘中,敌方目标威胁的相似程度用目标之间的距离来描述,常用欧几里得距离[3]作为K-均值聚类算法中相似性度量的准则。假如有n个敌方目标,每个目标对应的威胁属性特征有m个,可以得到一个数据矩阵S。
4)与前一次计算得到的L个聚类中心得到比较,如果聚类中心发生变化,转2),否则转5);
1)从雷达探测到的威胁属性特征数据集中随机选取M个样本数据,从样本数据中随机抽取L个对象作为初始的聚类中心;
用K-Means聚类算法建模的主要算法过程如下[4]:
其中,xik表示第i个目标的第k个属性,dij表示第i个目标到第j个目标间的距离,则可得到两目标之间的欧几里得距离。
本报讯8月13日,安徽六国化工股份有限公司公布7月份各单位环保考核结果,其中磷酸车间获环保管理千分制考核奖励100分,在考核结果通报中显得分外亮眼。
3)所有目标分配完成后,重新计算L个聚类的中心;
随着市场形势变化和业务转型需要,2017年以来,国际大石油公司对销售终端的布局策略正在转变,2017年共新增1800座加油站,同比增长1.6%。此外一些公司2018年还宣布了宏大的扩增计划,例如:壳牌提出计划在2025年前将加油站数量增加1/4达到5.5万座,重点在中国、印度和墨西哥等地发展;BP也宣布将通过大力发展终端,快速抢占墨西哥、中国等新兴市场国家燃油业务的零售份额,未来5年将在中国新增1000座加油站。国际大石油公司对销售终端发展战略的转变,除了要抢占新兴市场的零售业务,也在为油、电、氢综合服务站的中长期业务转型提前布局。
2)分别计算每个样本到各个聚类中心的距离,将目标分配到距离最近的聚类中;
5)当质心不发生变化时停止并输出聚类结果。
2)目标速度V。实际作战中,同一目标的速度会随着时间而变化,目标速度越快,给指挥员反应的时间越短,对我方要保护的目标杀伤力越大;反之,目标速度越慢,杀伤力越小。
根据图纸要求,焊后需用热处理的方式消除残余应力,所以制定带有焊后热处理工艺的焊接工艺评定试验。按照ASME BPVC IX—2013焊接及钎接工艺评定标准要求,结合以前抗裂试验、热处理试验结果,对40 mm厚B780CF钢进行手工电弧焊(SMAW)工艺评定试验,试验结果见表5、表6。
目标函数H可以表现出空中态势威胁聚类分析结果的特征,其值越小,则表示该类别中越相关、越独立。聚类的过程就是使函数H拥有最小值。将式(2)和式(3)可得聚类结果公式:
都说文人相轻,可我觉得无论是圈里、群里大家都是客客气气、彬彬有礼。有的还称兄道弟亲热得很。你如果晒晒自己的文章或诗词,马上就能引来一片赞扬声。
3 模型建立
随着防空对抗战场环境日益复杂,作战目标类型多样化,指挥员很难以主观经验对来袭目标作出较为合理的判断,因此,对威胁属性因素进行挖掘研究显得越来越重要。文献[5]将神经网络理论用于防空指挥系统的威胁值分析中,经过仿真验证,将专家评估的威胁值和通过神经网络算法得到的威胁值进行了对比,得出利用神经网络算法可以提高威胁估计算法性能的结论;文献[6]提出了将熵权灰色关联法与D-S证据理论结合起来的空中威胁评估方法,确定了指标权重的Mass函数,从客观上提高威胁评估的不确定性。文献[5-6]的威胁评估都是在已知敌方目标威胁值的情况下对算法进行改进,提高威胁评估的准确性,没有对威胁目标进行聚类分析,判断威胁等级的情况。在实际战场中,由于战场情况复杂多变,受保护的目标众多,并且面临的威胁源的种类和数量也会随着时间在变化,因此,对敌方目标威胁程度进行聚类很有必要。空中态势目标威胁挖掘模型如图2所示。
图2 空中态势目标威胁挖掘模型
3.1 数据抽取
对防空战场上所有原始数据进行收集,将这些数据进行融合,抽取出和空中态势威胁属性因素有关的数据,并将数据的格式转换成数据挖掘需要的CSV格式。
3.2 数据探索
其中,x为缺失值对应的下标序号,Ln(x)为缺失值的差值结果,xi为非缺失值yi的下标序号。
3.3 数据预处理
经过数据探索处理后的数据,保留的是敌方空中目标威胁属性因素的数据。这些数据从质量上分析,难免存在一些空缺数据、噪声数据、异常数据等“脏数据”,不能很好地反应整体数据的特征,在建模的过程当中,可能对最后挖掘结果的精度产生很大影响。因此,需要对数据进行预处理,主要包括缺失值和异常值的处理[7]。缺失值处理是利用删除法、替换法和插补法等方法对无法知道或没有搜集的数据进行处理。异常值处理是利用删除法、平均值修正法和插补法等方法对明显偏离的数值进行处理[8-9]。
本文的空中态势目标威胁挖掘模型建立中,缺失值处理采用拉格朗日插值法进行插补。首先确定因变量和自变量,取出敌方态势威胁属性因素缺失值前后的若干数据,将取出的这些数据组成一组,利用拉格朗日多项式式(5)和式(6)对全部缺失数据进行插补。异常值视为缺失值,也利用拉格朗日插值法进行插补。
对固定CSV格式的空中态势威胁属性因素的数据,进行分布特征探索分析,得到我方目标和敌方目标的分布特征,排除掉我方空中目标的数据。
3.4 数据规约
对预处理过后的空中态势威胁属性因素进行分析,得出威胁挖掘指标体系,主要从作战意图、作战效果和作战能力3个方面进行描述,如图3所示。
图3 空中目标威胁挖掘指标体系
从空中目标威胁挖掘指标体系中可以看出,一方面由于威胁因素种类繁多,因素之间的关联性复杂,若要把所有的威胁因素考虑进去,得出目标威胁程度与所有因素之间的关联关系,容易产生组合爆炸,使计算量增加,问题变复杂,导致挖掘结果不易实现;另一方面在激烈紧张的实际防空对抗战场环境下,时间对于指挥员来说是很宝贵的,因此,选取对威胁评估影响较大的威胁因素进行挖掘。本文选取目标速度、目标距离、目标高度、编队数量的定量指标和目标类型、敌我识别、抗干扰能力的定性指标进行聚类挖掘。
2016年1-4月间两次到实地调研,通过观察、游客访谈和收集图片等方式获得丰富的一手资料,期间共访谈18人,访谈对象包括顺德逢简水乡内游客、附近商铺经营者、增城万家旅舍民宿住客和民宿经营者。
1)目标类型T。目标类型体现出目标的攻击能力,在实际防空对抗作战中,不同目标类型对我方同一阵地的威胁程度是不一样的。同一目标类型,由于受到目标的速度、航向角、携带武器数量和被保护区域的重要程度等因素的影响,威胁程度也是不同的。一般情况下,导弹等小型目标威胁程度最大,轰炸机等大型目标威胁程度次之,直升机目标威胁程度最小,加油机、运输机等辅助作战飞机无威胁度。
防空对抗态势中敌方威胁属性特征的样本空间也可表示为 S=[x1,x2,…,xn],将 S 分成 L 类,聚类中心为 Z={z1,z2,…,zL},则样本空间内所有样本点与所属聚类均值距离的总和用函数H表示,表达公式为:
3)目标距离D。目标距离我方要保护的军事设施越近,威胁程度越大。
4)目标高度H。目标高度越低,对我方目标发起的突然攻击率就会越高,相应的威胁程度就会越大。
5)编队数量N。敌方目标的编队数量越多,对我方军事设施的威胁程度越大。
6)干扰特性M。敌方目标干扰性越强,越不利于我方雷达的探测,更容易对我方保护重地造成突然袭击,增大威胁程度。
根据以上选取的6项威胁因素,建立的目标威胁公式为:
3.5 数据变换
数据变换是进行空中态势威胁程度挖掘关键的一步,由于威胁因素取值范围不同,数值变化很大,对威胁因素进行相关性分析时,需对数据进行归一化处理,使威胁因素的取值处于相似区间。上述各威胁因素取值范围如表1所示。
术后即刻及术后24个月侧凸和后凸Cobb角与术前相比均显著改善,差异有统计学意义(P < 0.05,表1)。术后冠状面及矢状面偏移与术前相比稍有改善,但差异无统计学意义(P > 0.05,表1)。尽管侧凸和后凸Cobb角均有显著改善,部分患者术后仍残留冠状面或矢状面失衡,可能与骨盆倾斜等原因有关[15]。术后24个月SRS-22问卷各项得分及总分与术前相比均显著改善,差异有统计学意义(P <0.05,表2)。
对威胁因素的数值采用G.A.Miller进行9级量化论的归一化处理。目标类型定义4种属性,分别为大型目标(9)、小型目标(6)、直升飞机(3)、援助飞机(1);敌我识别定义2种属性,分别为敌、友(0、1);目标速度按0 m/s~2 700 m/s等间隔量化为1-9;距离按0 km~540 km等间隔量化为9-1;高度按1 km~54 km等间隔量化为9-1;编队数量按1-18等间隔量化为1-9;干扰能力定义4种属性,分别为强(9)、中(6)、弱(3)、无(1)。
4 仿真实验
本文选取的是经过一定处理后的45组空中态势威胁属性因素的真实数据,将威胁度分为低、中、高3个等级,用R进行仿真实验。其中,一部分数据如图4所示。
表1 威胁因素取值范围
图4 空中态势威胁属性因素值
按照建模步骤,对空中态势威胁属性因素进行数据探索、预处理分析和数据规约和数据变换,可得下页图5所示数据。
用K-Means聚类算法进行聚类分析后,可得聚类结果如图6和图7所示。从图6可以看出,空中态势威胁等级聚类分成3大类。从图7可以看出目标威胁程度为 1、2、3 的聚类个数分别为 2、12、3。其中,威胁程度为1的飞行高度的聚类中心为1.000 000 km,发现距离的聚类中心为3.500 000 km,飞行速度的聚类中心为5.000000m/s。威胁程度为2的飞行高度的聚类中心为7.583 333 km,发现距离的聚类中心为6.250 000 km,飞行速度的聚类中心为1.500 000 m/s。威胁程度为3的飞行高度的聚类中心为4.000000km,发现距离的聚类中心为7.666 667 km,飞行速度的聚类中心为6.333 333 m/s。从图7中也可以看出敌方目标的威胁等级排序,将导弹等小型目标聚类成一类,轰炸机等大型目标聚类成一类,加油机、预警机等聚成一类。
娄山学派之学,不事著作,不主一家之言,他主张“折衷群言”,反对理学方面的门户之见,宗派之分,唯汇辑古今嘉言强行以教学者。 范鄗鼎认为,“从来理学不一人,学亦不一类”,“前圣后贤之论,互有发明,小有异者,不害其为大同,而非背驰不相入焉”。 他认为,“理学即是经济,经济即是文章。 外经济而言文章,则文章无用; 外理学而言经济,则经济无本”,试图将理学与“经济”统一起来。 徐世昌《清儒学案》云:“三晋理学最称敬轩、复元。 李氏实衍其绪,娄山祖、父皆游辛门,渊源既有所自,复能颛精壹意,讲学不倦,巍然为清代山右儒宗。 《理学备考》一书,亦夏峰《宗传》之亚也。”
图5 变换后态势威胁属性因素数据
图6 空中态势威胁聚类
图7 空中态势威胁等级聚类结果
5 结论
本文通过利用K-Means聚类算法对空中态势威胁进行了聚类分析,将定量指标和定性指标相结合,利用客观数据和专家经验,确定聚类中心值,较合理地判断出敌方目标的威胁等级,适用于大规模数据、数据类型丰富和数据价值巨大的情况,为作战指挥员进行实时决策提供有力支撑。虽然K-Means聚类算法理论严谨,处理数据实时性强,但聚类中心值的选择及真实情况中不明目标因素的存在,将对算法结果准确性产生较大影响。本文后续将进一步研究K-Means算法在聚类中心值选取和不明目标因素存在情况下的聚类分析,优化完善K-Means算法在空中态势威胁挖掘中的应用。
参考文献:
[1]代进进,李相民.舰艇编队网络化防空作战空袭目标威胁评估[J].系统工程与电子技术,2013,35(3):532-538.
[2]刘敬蜀,姜文志.动态火力接入下要地防空作战目标威胁评 估 [J]. 北 京航空 航 天 大 学 学 报 ,2016,42(7):1422-1431.
[3]孟佳伟,孙红.基于Hadoop平台的K-means算法优化综述[J].软件导刊,2017,16(6):208-211.
[4]张晓倩,曲福恒.一种高效的基于初始聚类中心优化的K-means算法 [J]. 长春理工大学学报,2015,38(4):154-158.
[5]高尚.基于神经网络威胁判断模型[J].系统工程理论与实践,2000,20(7):49-51.
[6]李特,冯琦.基于熵权灰色关联与D-S证据理论的威胁评估[J].计算机应用研究,2013,30(2):380-382.
[7]孙源泽.朴素贝叶斯算法及其在电信客户流失分析中的应用研究[D].长沙:湖南大学,2008.
[8]孟庆操,杨光.航母编队防空作战编成评判方法[J].火力与指挥控制,2017,42(6):51-55.
[9]胡利平,梁晓龙,张佳强,等.航空集群系统构建机理研究[J].火力与指挥控制,2017,42(11):142-145.
Aerial Situation Threat Mining Based on K-Means Clustering Algorithm
GU Yu-rong,HUANG Yao-xiong,GAO Yan,GUO Jing
(North Automatic Control Technology Institute,Taiyuan 030006,China)
Abstract: The battlefield environment is complex and diverse and various detection methods emerge in an endless stream.There are various types of air threat attribute indicators,which increase the difficulty of the commander to analyze the threat situation in the air.Analysis of the air threat situation correctly and rapidly will provide effective decision-making basis for battlefield deployment.This paper builds an airborne target threat hierarchical clustering model based on K-Means clustering algorithm.Through the analysis of the data of the air target threat attribute,the deep mining of threat target clustering is conducted and the target threat level problem is transformed into the optimal clustering problem.The example analysis shows that the algorithm is effective in clustering the threat target level and improves the reliability and accuracy of the target threat level clustering.
Key words: threat attribute indicator,air situation threat,K-Means clustering algorithm,target threat level
中图分类号: TJ02;TP301.6
文献标识码: A
DOI: 10.3969/j.issn.1002-0640.2019.04.019
引用格式: 谷玉荣,黄耀雄,高艳,等.基于K-Means聚类算法的空中态势威胁挖掘[J].火力与指挥控制,2019,44(4):92-96.
文章编号: 1002-0640(2019)04-0092-05
收稿日期: 2018-03-14
修回日期: 2018-04-28
作者简介: 谷玉荣(1989- ),女,山西太原人,在读研究生。研究方向:战场态势数据分析。
Citation format: GU Y R,HUANG Y X,GAO Y,et al.Aerial situation threat mining based on k-means clustering algorithm[J].Fire Control&Command Control,2019,44(4):92-96.
标签:威胁属性指标论文; 空中态势威胁论文; K-Means聚类算法论文; 目标威胁等级论文; 北方自动控制技术研究所论文;