小样本下装备平均修复时间的非统计估计模型论文

小样本下装备平均修复时间的非统计估计模型

柯宏发1, 祝冀鲁1, 孙云辉2

(1. 航天工程大学航天保障系, 北京102206; 2. 北京亚美联技术有限公司, 北京100080)

摘 要: 针对小样本下装备平均修复时间的参数估计问题,提出了一种基于离散GM(1,1)模型和未确知有理数的新方法。首先,对原始数据序列进行等概率可放回地随机再抽样,通过离散GM(1,1)模型挖掘生成较多的样本数据;然后,使用未确知有理数对自助样本集合进行描述,构建其表达模型和阶数优化模型;最后,分别构建了平均修复时间基于未确知有理数的点估计和区间估计模型,并通过与GJB2072—94建议的估计模型进行参数估计与对比,验证了该非统计方法的有效性和可行性。

关键词: 平均修复时间; 参数估计; 小样本; 离散GM(1,1)模型; 未确知有理数

武器装备维修性是指装备在规定的条件下和规定的时间内,按规定的程序和方法进行维修时保持或恢复其规定状态的能力[1]。对装备维修性进行计算、验证和评估[2],通常必须选用一系列定性和定量的维修性参数[3]。由于装备平均修复时间直接影响装备的可用性、战备完好性,且与维修保障费用有关,因此成为描述装备维修性的一个主要参数。

目前,对装备平均修复时间进行估计与验证的常用方法为:在自然故障或模拟故障条件下进行试验,根据试验数据分析判定维修性是否达到标准要求。这种验证方法的理论基础是经典数理统计学,需要假设样本的概率分布特征,且需要较大的样本量才能得到较高的估计精度。针对小样本处理的Bayes方法[4-6]属于一种概率统计方法,需要利用验前信息并确定其概率分布形式,且非常依赖于验前信息的融合正确性[7]。然而,随着武器装备的复杂化、网络化、体系化发展,获取较多装备维修性验证试验样本量的难度越来越大,成本也越来越高,亟需解决未知概率分布前提下小样本数据的扩展生成、参数估计等技术难题。

在未知概率分布前提下,小样本数据处理通常基于以下2种模式:1)基于不确定理论相关方法的直接估计方法[8],但这种方法难以给出参数估计的置信度;2)基于GM(1,1)模型等不确定理论相关方法的间接估计方法[9-13],如灰自助生成方法。均值GM(1,1)模型具有一定的适用范围,对非指数增长或振荡数据序列的均值GM(1,1)模型拟合误差偏大,而装备维修时间虚拟样本原始数据序列往往呈现振荡特征。对于非指数增长或振荡数据序列,应优先选择离散形态的原始差分、均值差分或离散GM(1,1)模型[14-15]

笔者借鉴灰自助的样本生成思想[10-13],提出通过离散GM(1,1)模型产生虚拟总体样本的新方法,并通过未确知有理数[16-17]对总体样本进行相应的点估计和区间估计,最后对算例进行了对比验证。

1 小样本数据的离散GM(1,1)模型生成

在武器装备试验活动中,由于试验条件和费用的限制,很多测试指标得到的数据样本量很小,其数据集合可以描述为

T ′={x (t ′),t ′=1,2,…,N },

(1)

式中:x (t ′)为第t ′个测量数据;N 为测量数据总数,通常情况下N ∈[5,10]。对于此类小样本指标数据,难以确定其概率分布特征,即使假设其服从正态分布,其参数估计的置信度也难以保证。灰色系统理论认为:这N 个小样本数据所携带的信息不足以确定测试指标的真实状态和数量关系,但已经部分地反映了测试指标的真实状态。通过“已知部分”推断“未知部分”正是灰色系统技术与方法的优势。

1.1 离散GM(1,1)模型

假设原始数据序列为X (0)={x (0)(1),x (0)(2),…,x (0)(n )},其中x (0)(k )≥0(k =1,2,…,n );定义X (0)的1-AGO序列为X (1)={x (1)(1),x (1)(2),…,x (1)(n )},其中则称

x (1)(k +1)=β 1x (1)(k )+β 2

(2)

为GM(1,1)模型的离散形式,简称离散GM(1,1)模型。式中:β 1,β 2均为待估计参数。

在中国经济发展的征途中,民营企业始终活跃在第一线。这次进博会,他们带着“广结良缘”的诚意而来,带着寻觅的眼光在每一个品牌间流转,怀揣着各自的采购清单与合作意向,在这次盛会上与异国他乡的企业“喜结良缘”。而随着一张张合作意向采购订单的签出,中国的国家形象也在悄然而变。

三是有序向东盟进一步开放教育等服务产业。可在防城港城区由中国企业与东盟企业合资建设中国—东盟联合大学,面向中国与东盟各国招聘教师和招收学生,将中国—东盟联合大学办成中国与东盟各国,尤其是各国年轻人文化沟通、学术交流、教育合作的大平台,并申请将其作为推进与落实“一带一路”文化相通的关键项目,作为中国软实力构建与文化整体输出的核心载体。

由最小二乘法(β 12)T=(B TB )-1B TY ,得到β 1、β 2的值。由

(3)

(4)

并结合初始条件x (1)(0)=x (0)(1),即可得到离散GM(1,1)模型的时间响应序列

(5)

再将式(5)累减还原,得到X (0)的预测模型为

k =1,2,…,n 。

(6)

在装备维修时间的实际建模过程中,可以取初始序列为X (1),对其一阶累减生成序列X (0)建立离散GM(1,1)模型,从而直接对X (1)进行模拟。

4) 针对上述h 阶未确知有理数的可信度熵

1.2 基于离散GM(1,1)模型的自助抽样生成

根据GJB2072—94《维修性试验与评定》[2]规定:维修作业样本量按选取的试验方法中的统计计算确定,也可选择推荐样本量。在此,将自助抽样生成的样本量选为推荐样本量,即N +A =30。

自助抽样生成原理的基本思路为:从原始数据集合X 中等概率可放回地随机抽取1个数据,记为x 1(1),该抽取过程重复m 次,得到第1个自助样本,记为

X 1={x 1(1),x 1(2),…,x 1(m )}。

(7)

根据离散GM(1,1)模型的建模数据需求,确定m =5~8。为获得自助样本,将整体抽取过程连续重复A 次,则会得到A 个自助样本,可记为

Y A ={X 1,X 2,…,X i ,…,X A },

(8)

式中:X i ={x i (1),x i (2),…,x i (m )}。

针对自助样本X i 建立离散GM(1,1)模型,对其时间响应序列进行一次累减生成,即可得到自助样本X i 中第m +1个预测值,记为

式中:x (N +1),x (N +2),…,x (N +A )分别为A 个自助样本的离散GM(1,1)模型预测值。

(9)

进而得到自助样本集合,即新的装备维修时间数据集合,为

X ′={x (1),x (2),…,x (N ),…,x (N +A )}。

可见,在上市公司治理中,只要法律对契约参与各方的欺骗行为的惩罚rx大于欺骗行为获得的剩余U2-U1,契约参与各方可能会选择诚信。相反,如果法治环境不好,对欺骗行为惩治的力度不够,对欺骗行为的惩罚rx小于欺骗获得的剩余U2-U1,契约参与各方的欺骗行为就可能发生。假设法院判决赔偿的概率r与法治水平q成正比,即r=a×q。

(10)

区域经济发展非均衡,导致区域之间基本公共服务水平差距较大。与珠三角相比,粤东西北在教育、医疗卫生、人民日常生活等诸多方面都明显落后。(见表3)2010—2015年,珠三角就业人员中具有大学专科及以上教育程度的人数比重由6.6%提高到13.7%。粤东西北地区初中及以下教育程度就业人口比重比珠三角地区高16—18个百分点,大专以上教育程度比珠三角低7—9个百分点;2016年,粤东西北地区全体常住居民人均可支配收入18365元,珠三角地区常住居民人均可支配收入达40109元。[19]义务教育规范化学校在珠三角的覆盖率已达到97.2%,但粤东西北地区只有48.9%。[20]

上述自助抽样生成流程如图1所示。基于离散GM(1,1)模型的自助抽样生成,是通过对原始数据序列的随机抽样挖掘,拟合生成了符合参数估计要求的数据信息,而未对原始数据序列的概率分布信息进行假设。然而,其中的自助样本集合依然不能全面反映测试指标的真实状态,在本质上还是“部分已知,部分未知”地实现对测试指标真实状态的认知。与原始N 个数据所表征的“部分已知,部分未知”相比,前者的“已知部分”要远远地多于后者,这也是自助抽样挖掘的目的和作用。

图1 小样本数据的自助抽样生成流程

2 基于未确知有理数的参数估计

针对自助样本集合X ′,构造一个h (h <N +A )阶未确知有理数,对这N +A 个数据进行整体描述,其步骤为:

2.1 未确知有理数的构造及优化

对自助样本集合X ′中N +A 个数据的参数估计,若假设数据的分布特征,需要采用常规的统计方法进行点估计和参数估计,这就失去了自助抽样挖掘的意义,且数据分布特征的合理性和正确性难以验证。因此,不假设生成数据的概率分布规律,而直接引入未确知有理数方法进行参数估计。

1) 记

a =min{x (1),x (2),…,x (N ),

x (N +1),…,x (N +A )};

(11)

b =max{x (1),x (2),…,x (N ),

x (N +1),…,x (N +A )}。

(12)

2) 以小区间的中间值x j (a ≤x j ≤b ,j =1,2,…,h )为中心、λ 为控制半径,确定一数据邻域,统计N +A 个数据在该邻域出现的频率,则可得到可信度分布密度函数表达式

公司将秉承“矿业报国,振兴民族经济”的核心价值观努力发展,将成为世界500强的国际化大型矿业资源跨国公司作为企业目标。

(13)

式中:α j 为自助抽样数据取值x j 时的可信度,且有表示总可信度,且有0<α ≤1。简便地,可将上述过程的未确知有理数记为[[a ,b ],φ (x )]。

针对自助抽样挖掘生成的N +A 个数据,假设有q 个数据位于上述置信区间之外,同时综合估计区间的置信水平,则定义自助样本在上述区间估计的置信度

3) 大多数情况下,对区间[a ,b ]进行2h 个等值划分,使得自助抽样数据值x j (j =1,2,…,h )的邻域控制半径均相等,则可得到其表达式为

(14)

其可信度α j 则用自助抽样数据在x j 为中心的控制邻域内出现的频率表示,即

(15)

式中:n j 为以x j 为中心为半径的控制邻域内的自助抽样数据个数。

对比观察实施sbar交班模式前后,护理人员在晨交班中的交班缺陷情况,同时了解晨交班所需时间,对医护人员开展满意度调查,满分为25分,分为非常满意、满意、一般、不满意、非常不满意五个层级,评分分别为1~5分,调查内容分别为信息明确简洁、重点突出、条理清晰、患者病情掌握情况、节省晨交班时间[4]。

(16)

则h *为所求的未确知有理数的最佳阶数。此时,将h *阶未确知有理数U 记为U =[[a ,b ],φ (x )],其中

(17)

2.2 基于未确知有理数的点估计

称该h *阶未确知有理数U 为一阶未确知有理数,其数学期望

(18)

式中:

用方差D (U )来描述未确知有理数U 到E (U )的离散程度,即

D (U )=E (U -E (U ))2=

IMT(内中膜)大于等于1mm评定为IMT增厚;IMT局限性增厚大于等于1.5cm,突出管腔,评定为斑块形成。

(19)

于是,自助样本的点估计值为

(20)

其估计精度为

(21)

综合未确知有理数期望的可信度,则定义自助样本点估计的置信度

(22)

2.3 基于未确知有理数的区间估计

假设自助样本的分布特征,可以用区间估计法给出样本的取值范围。一般假设自助样本服从正态分布,常用标准正态分布上侧β 分位点如表1所示。

表1 常用标准正态分布上侧 β 分位点表

给定置信水平1-β ,从表1中查询u (β /2),则给定置信水平下置信区间半长度

(23)

于是,可以计算自助样本的点估计值在置信水平1-β 下的置信区间

从事生产、销售、进口、服务的单位和个人应当严格执行强制性标准的各项规定。不符合强制性标准的产品和服务禁止生产、销售、进口和提供。产品的生产者、销售者、进口商以及服务的提供者要有强制性标准意识。违反强制性标准的,将依法承担相应的法律责任。”[1]

(24)

需要注意置信水平和置信度2个概念的联系与区别。本文对装备维修时间的非统计估计分为自助抽样生成、参数描述和参数估计等过程,置信水平反映了正态分布假设条件下区间估计的可靠性,覆盖了参数估计过程;而点估计和区间估计的置信度则覆盖了装备维修时间的非统计估计全过程,置信水平对区间估计置信度有一定的贡献率。

3 非统计估计模型的过程和方法框架

基于离散GM(1,1)模型的自助抽样生成和未确知有理数的装备维修时间非统计估计,是在小样本自助抽样生成、参数描述与估计等过程中,应用离散GM(1,1)建模技术,基于未确知有理数的点估计和区间估计等方法论的一种分析方法,其过程和方法论框架如图2所示。

图2 装备维修时间的非统计估计模型的过程和方法论框架

4 装备平均修复时间的非统计估计算例

为验证本文算法的有效性,采用GJB 2072—94《维修性试验与评定》[2]D1.5中的装备维修时间数据,即26,14,21,30,70,69,20,21,18,65,16,34,26,16,40,28,42,33,19,19,43,54,12,18,13,26,10,50,21,31,42,30,46,24,总计34个。将自助样本的非统计估计结果与原始34个数据样本的非统计估计结果、GJB2072-94建议估计模型的估计结果进行对比验证。

4.1 原始数据非统计估计结果

利用本文非统计估计算法对D1.5中34个装备维修时间原始数据进行处理,其最佳4阶未确知有理数为[[10,70],φ (x )],其中

针对原州区水利建设的实际情况,应该坚持统筹兼顾、因地制宜的原则,实现对本地区的全面统筹规划。标准化、制度化是对农田水利建设工作人员的要求,也是对农田水利工程建设结果的保障。从工程建设到工程运营和维护,都要严格规范管理,以提高原州区农田水利现代化建设水平。

而点估计置信度p 1=76.4%。置信水平为0.99时,区间估计[17.67,44.61],这时有11个点位于上述区间之外,区间估计的置信度p 2=62.2%。

4.2 自助样本的非统计估计结果

对原始34个数据,每间隔2个数据取为自助抽样对象,抽样生成小样本数据;而取小样本数据的前10个作为验证数据,即26,30,20,65,26,28,19,54,13,50。对这10个小样本数据进行等概率可放回地随机抽样,重复抽取m =6次视为得到1个自助样本,总共需要得到A =20个自助样本。

分别针对这20个自助样本进行离散GM(1,1)建模,取每个模型的一步预测值,从而得到自助样本集合为X ′={26,30,20,65,26,28,19,54,13,50,22.1,13.5,27.5,51.2,24.8,23.4,26.5,34.2,65.8,41.1,32.7,46.0,29.0,16.5,12.1,69.0,51.5,19.5,17.8,29.6}。上述自助样本的最大值为69.0,最小值为12.1。构造h 阶未确知有理数,其对应的可信度熵如表2所示。

参考译文:The Chinese have the custom/habit of eating yuanxiao(sweet dumplings made of glutinous rice flour)and watching festivelanternson thefifteenth eveningof thefirst lunar month.

表2 不同阶数未确知有理数的可信度熵

由表2可以看出:可信度熵最大值为0.137 6,其对应的最优未确知有理数阶数h *=4,则本算例构造的4阶未确知有理数为[[12.1,69.0],φ (x )],其中

根据本文的非统计估计算法,得到装备维修时间的点估计为点估计的置信度p 1=78.1%。

假设置信水平为0.95,则β =0.05,计算给定置信水平下的置信区间半长度ε =14.17,则得到装备维修时间的区间估计[18.79,47.13],这时有q =12个点位于上述区间之外,区间估计的置信度p 2=57.0%。

4.3 GJB2072—94建议模型的估计结果

本算例中,装备维修时间的概率分布和方差都是未知的。依据GJB2072—94《维修性试验与评定》[2]D2中试验B的估计模型,有:

1) 对于原始34个数据样本,取α =β =0.05,其标准正态分布分位数Z 1-α/2 =Z 0.975=1.96,则其点估计为双侧置信区间为[25.05,36.59],这时有q =25个点位于上述区间之外。

从1937年成立以来,新华书店承载了中国几代人的阅读记忆和精神追求。八十年过去了,当宁波新华书店变成宁波书城,改变的不仅仅是名称,而有一种很实在的、活在这座城市的感觉。与书有关的故事,每天都在这里发生。

2) 对于本文生成的自助样本,其点估计为双侧置信区间为[26.95,38.70],这时有q =23个点位于上述区间之外。

4.4 对比分析

结合4.1、4.2节可知:针对自助样本、原始数据样本,基于本文非统计估计算法的点估计和区间估计结果均较为接近,且估计置信度也很接近,说明基于离散GM(1,1)模型的样本数据挖掘生成方法有效可行。

结合4.1-4.3节,对原始34个数据样本和自助样本分别进行点估计及位于估计区间之外的点数比较,如表3、4所示。

表3 点估计比较

表4 估计区间之外的样本点数比较

由表3可知:与GJB2072—94[2]建议估计模型的估计结果相比,原始数据样本的非统计估计模型点估计相对误差为1.15%,自助样本估计相对误差为0.39%,这2个数据样本的点估计结果相对误差均较小,而自助样本的误差更小。

由表4可知:同一置信水平下,估计区间覆盖了数据样本的个数,说明本文提出的非统计估计模型要远远好于GJB2072—94[2]估计模型。

新型消能减震复合墙板试验与模拟的骨架曲线、滞回曲线如图4所示,其试验平均值与模拟值得到的关键点数值对比见表2。由图4和表2可知,不同位移下的试验结果与有限元模拟分析结果相差很小,误差基本在20%以内,有限元模型能较好的反映构件的性能,表明数值模型基本是正确合理的。

上述结果表明:本文提出的小样本装备平均修复时间非统计估计模型有效可行。

二是推动中部工业集中区“二次创业”。该区域纵贯东西、连接上下河,包括毗邻的省级经济开发区、姜堰高新区、装备园区三个园区,贡献了全区60%的工业开票销售。我们以“二次创业”为动力,大力推进产业转型升级,着力集聚高端创新要素,积极引入优质工业增量,做优做强实体经济,持续推动质量变革、效率变革、动力变革,力争到2020年该区域工业开票销售超700亿元,占全区比重80%以上。

5 结论

针对装备平均修复时间的小样本参数估计问题,提出了一种基于离散GM(1,1)模型和未确知有理数的新方法,构建了装备平均修复时间的点估计和区间估计模型,并与GJB2072—94建议的估计模型进行对比,验证了其有效性。

参考文献:

[1] 中国人民解放军总装备部电子信息基础部.可靠性维修性保障性术语:GJB451A—2005[S].北京:总装备部军标出版发行部,2005:3.

[2] 中国人民解放军总后勤部军械供应部.维修性试验与评定:GJB2072—94[S].北京:国防科学技术工业委员会,1994:2-3,43.

[3] 苗佳雨,闫鹏程,连光耀,等.武器装备维修性验证试验方法研究[J].计算机测量与控制,2016,24(3):122-126.

[4] 张学东.基于贝叶斯方法的导弹维修性试验与评定研究[J].现代防御技术,2013,41(1):31-36.

[5] 刘君,李庆民,张志华.Bayes小子样分析在武器性能评估中的应用[J].兵工学报,2008,29(9):1114-1117.

[6] 董博超,宋保维,梁庆卫,等.武器装备小子样维修性试验与评定方法研究[J].兵工学报,2011,32(3):327-330.

[7] 苗佳雨,闫鹏程,连光耀,等.维修性试验验前信息融合方法[J].火力与指挥控制,2017,42(8):145-149.

[8] KE H F,CHEN Y G,LIU Y.Data processing of small samples based on grey distance information approach[J].Journal of systems engineering and electronics,2007,18(2):281-289.

[9] 叶伟,李亚平,陈顶,等.基于小样本的复杂装备“虚拟总体”生成与检验模型[J].中国管理科学,2015,23(专辑):240-244.

[10] 汪启跃,王中宇,王岩庆,等.乏信息空间机械臂随机振动信号的灰自助评估[J].北京航空航天大学学报,2016,42(4):858-864.

[11] 王中宇,王倩,付继华.乏信息多传感器压力数据自助模糊融合估计[J].北京航空航天大学学报,2013,39(11):1426-1430.

[12] WANG Y,W ANG Z,SUN J,et al.Gray Bootstrap Method for estimating frequency-varying random vibration signals with small samples[J].Chinese journal of aeronautics,2014,27(2):383-389.

[13] 李化云,范洪海,胡端.岩土小样本参数区间估计方法探讨[J].水力发电,2017,43(8):44-47.

[14] LIU S F,LIN Y.Grey information:theory and practical applications[M].London:Springer,2006:194-228.

[15] 刘思峰,方志耕,谢乃明,等.灰色系统理论及其应用[M].8版.北京:科学出版社,2017:92-97.

[16] 陈永光,柯宏发,胡利民.基于未确知有理数的天线增益测试数据处理[J].电波科学学报,2011,26(6):1194-1199.

[17] 刘开第,吴和琴,庞彦军,等.不确定性信息数据处理及应用[M].北京:科学出版社,1999:45-72.

Non -statistical Parameter Estimation Model of Mean Time to Repair under Small Samples

KE Hong-fa1, ZHU Ji-lu1, SUN Yun-hui2

(1. Department of Space Support, Space Engineering University, Beijing 102206, China;2. Beijing TmutChina Technology Co., Ltd, Beijing 100080, China)

Abstract :Aiming at the problem of parameter estimation of equipment repair time under small samples, a novel method based on discrete GM(1,1) model and unascertained rational number is put forward in the paper. Firstly, random sampling with replacement and equal probability is implemented in raw data set. More sample data are generated through the mining of discrete GM(1,1) model. Secondly, without supposing probability distribution characteristics of bootstrap sampling set, unascertained rational number is used to describe bootstrap sampling set. And its mathematical expression model and order optimization model are constructed. Thirdly, unascertained rational numberbased point estimation model and interval estimation model of mean time to repair are presented respectively. Finally, The validity and feasibility of the non-statistical method are verified by estimating and comparing the parameters with the estimation model proposed by GJB2072—94.

Keywords :mean time to repair; parameter estimation; small samples; discrete GM(1,1) model; unascertained rational number

中图分类号: E92; O21

文献标志码: A

DOI: 10.3969/j.issn.1672-1497.2019.01.019

文章编号: 1672-1497(2019)01-0114-06

收稿日期: 2018-11-19

基金项目: 军队科研计划项目

作者简介: 柯宏发(1969-),男,教授,博士。

(责任编辑:尚菲菲)

标签:;  ;  ;  ;  ;  ;  ;  ;  

小样本下装备平均修复时间的非统计估计模型论文
下载Doc文档

猜你喜欢