摘要:小区的漏损是智能水务信息化的一个非常重要的指标,但是如何使用在线的算法来准确、高效的分析漏损的质变并不是一个简单的课题。该文采用了一种基于时间序列数据的同质性分析方法来分析水表数据中的漏损部分是否有质的变化,变化的时间点,以及变化前后漏损的样本均值。并通过某小区的水表漏损数据进行实验,试验结果表明该方法具有较低的复杂度和较高的辨识度,非常易于实现,具有较高的工程应用价值。
关键词:小区水表;漏损;同质性分析;数据分析;智能水务
引言
小区的漏损是水务行业一个比较重要的指标,在日常的工作中,她可以直接用于指导水务企业的检漏,修漏等。如果经过一段时间的运行,某小区的漏损量发生了比较显著的提升,这很有可能意味这个小区发生了新的水管渗漏,甚至是管暴。因此如何准确的定位小区漏损发生了质的变更,在水务企业的工作中具有显著的民生效应和经济效应。
但是如何检测这样的漏损量发生了质的变化却鲜有很好的方法。通常的做法是,用当前的漏损与前一段时间进行对比,这个方法有以下四个缺点:
比较时间间隔的大小很难确定。即使通过配置,也很难发现一个使用于所有场景的配置。
很难避免水表数据在采集,传输和存储过程产生的随机误差对计算结果的影响。
很难确定多大的变化可以认为是质的变化。由于不同的小区水量不一致,不同类型水表(机械表,电磁表和超声波表)的精度也不一致,导致很难发现一个合适算法参数去适应所有的小区。
较小的背景漏损很难被发现,因为他们在单点的比较中常常被噪声所淹没。
稍好的做法就是采用均值的做法,比如采用7日均线,通过比较7日均线上不同时间点的差异,这种方法虽然可以避免系统的随机误差,但是仍然不能解决后三个问题。
该文引入的办法是通过统计学上的同质性分析(Homogeneity Test)来寻找水表所产生时间序列数据是否产生了质的变化以及变化的时间点和变化前后的样本均值。该方法目前已经完成试验阶段,将会被上海云瀚科技股份有限公司在2017年7月发布到“水管家”平台的“智能表计”软件产品中。
1计算方法
小区水表检测的是小区的实时用水量,如果想要得到小区的漏损,需要分析小区在夜间的用水量,因为该时间段的小区居民基本不处于用水状态,故该时间段的水量就可以被近似认为是漏损的量。具体漏损量的计算方法,不在该文中赘述, 具体可见参考文献[3]。
1.1寻找显著性变更点
1.2确定显著性变更的可信度
1.3计算出变更前后的样本均值
2应用分析
下面我们以某市的某小区的2015年12月2日到2016年1月10日的小区漏损数据为样例阐述上面的计算方法。详细数据见表1和表2,其中第一列为漏损所发生的日期,第二列为漏损的量。从该表的数据 表2:某小区的2015年12月2日到2016年1月10日的小区漏损-续
另根据公式6,我们可以计算出概率0.0000051远低于显著性水平,所以拒绝接受假设,而是接受假设,也就是该序列发生了显著性变更。因此,我们可以认定该时间段内该小区的漏损发生了显著性的变更。由于此处的取的是的值,进一步依据上面的计算方法,可推断出漏损是显著性增大的。以2015年12月24日为分界线,该序列可以被划分为两个序列。
序列1:[(2015/12/2,184),(2015/12/3,278),(2015/12/4,183),(2015/12/5,187),(2015/12/6,203), (2015/12/7,195),(2015/12/8,185),(2015/12/9,170),(2015/12/10,169),(2015/12/11,188),(2015/12/12,199), (2015/12/13,195),(2015/12/14,186),(2015/12/15,175),(2015/12/16,193),(2015/12/17,186),(2015/12/18,186),(2015/12/19,200),(2015/12/20,189),(2015/12/21,187),(2015/12/22,176),(2015/12/23,177),(2015/12/24,187)]
序列2:[(2015/12/25,228),(2015/12/26,255),(2015/12/27,253),(2015/12/28,235),(2015/12/29,233),(2015/12/30,236),(2015/12/31,239),(2016/1/1,259),(2016/1/2,248),(2016/1/3,250),(2016/1/4,221),(2016/1/5,226),(2016/1/6,230),(2016/1/7,237),(2016/1/8,242),(2016/1/9,257),(2016/1/10,251)]。通过统计分析不难得出两个序列的样本均值分别是190.348和241.176。整个序列和显著性变化前后的样本均值,通过图1展现如下:
漏损变化曲线
Fig. 1Leakage Curve
从曲线中不难看出样本均值确实发生了显著的变更。虽然在2015年12月3日,录得漏损值为278,这一超大的值,但是这并没有影响我们的分析结果。主要是因为采用的统计学的样本均值,所以一个随机误差的引入并不会带来样本总体质的变更。
为了验证,序列1和序列2是否是同质,我们可利用该网站 http://www.socscistatistics.com/tests/mannwhitney/Default2.aspx中所提供的Mann-Whitney 测试来校验这两个序列,在显著性水平为0.05,双尾假设的前提下可计算得出pValue<0.00001,从而也可以验证这两个序列是本质上不同的。
3结束语
本文通过引入基于Pettitt测试的同质性测试方法分析转换过的小区水表的实时数据,可以有效的解决传统计算方法中需要设定多个参数设定;计算结果容易受随机误差的影响;小的新增背景漏损不易被发现等问题。她计算简单,复杂度低,由于不需要大数据的支撑,所以也可以通过智能表计的固件来实现;由于对样本分布没有限制,小区特征也没有要求,也不需要特定的参数设置,故也非常适合在云平台上批量的计算,所以具有较高的实际应用价值。
参考文献:
[1]Pettitt A.N. A nonparametric approach to the change point problem[C]. Applied Statistics 28, 1979:126-135.
[2]陈魁.应用概率统计[M]. 清华大学出版社, 2000: 187-213
[3]Malcolm Farley,Gary Wyeth, Zainuddin BinMd.Ghazali, Arie Istandar, Sher Singh. The Manager’s Non-Revenue Water Handbook [M].Farely Water Consulting, 2008,55-60
[4]Mann, Henry B., Whitney, Donald R. On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other [J]. Annals of Mathematical Statistics, 1947, 18 (1): 50–60
[5]王燕. 应用时间序列分析[M]. 人民大学出版社, 2012:103-120
[6]博克斯等著,王成璋等译.时间序列分析预测与控制[M].机械工业出版社,2011:535-540
[7]Hirsch R, Slack J, Smith R. Techiniques of Trend Analysis for Monthly Water Quality Data[C]. Water Resource. Res. , 18, 1982:102-121
[8]Libiseller C, Grimvall A . Performance of partial Mann-Kendall tests for trend detection in the presence of covariates[C]. Environmetrics, 13, 2002:71-84, doi:10.1002/env. 507.
[9]Alexandersson H. A homogeneity test applied to precipitation data[J]. Journal of Climatology, 6, 1986:661-675.
[10]Buishand T.A. Some methods for testing the homogeneity of rainfall data[J]. Journal of Hydrology, 58, 1982:11-27.
[11]Von Neumann J. Distribution of the ratio of the mean square successive difference to the variance[J].Ann. Math. Stat., 12, 1941:367-395.
论文作者:仇宏祥
论文发表刊物:《科技中国》2017年7期
论文发表时间:2017/11/1
标签:小区论文; 序列论文; 水表论文; 样本论文; 数据论文; 很难论文; 同质性论文; 《科技中国》2017年7期论文;