(云南电网公司玉溪供电局 玉溪 653100)
摘要:以南方电网公司县级供电企业管理评价报告为数据来源,以综合计划指标体系为基础,探索对县级供电企业“分类管理、分类指导”的方法,提出了利用统计分析中的聚类分析方法对县级供电企业分类的思路与模型,并采用SPSS数据分析软件,选择2014年度南方电网公司管理评价报告进行了实例分析和结果评估,最后进行了展望,提出了下一步的研究方向。
关键词:聚类分析;社会科学统计软件(SPSS);分类;欧式距离
1引言
从2011年开始,为全面掌握县级供电企业的整体情况,客观展示县级供电企业管理成效和短板,南方电网公司每年开展县级供电企业管理评价工作。2013年,加大了管理评价的频度,评价周期由每年一次调整为半年一次。2012年云南电网根据南方电网公司“分类管理、分类指导”的工作原则,将县级供电企业中的84家子公司划分为整体先进型、管理领先型、快速增长型、普遍服务型四个类型。之后,南方电网、云南电网的年度农电工作要点,都提到要构建科学合理的县级供电企业分类模型,探索对县级供电企业“分类管理、分类指导”的方法。
2聚类分析方法
聚类分析是一种研究分类的数理统计方法,是将研究对象按照某个标准分成若干类。按照聚类的对象,可以分为Q型聚类和R型聚类。Q型聚类是按照变量对观测值进行聚类,R型聚类是按照观测值对变量进行聚类。
聚类的基础是类与类之间相似性的度量。Q型聚类以样品间的靠近程度聚类,这一程度通常用距离来衡量。距离包括欧式距离、绝对距离、切贝谢夫距离、明可夫斯基距离等,其中通常使用的欧式距离,又称欧几里得距离,它是在p维空间中两个点之间的真实距离。设x与y是p维向量,欧式距离可以表示为 。
3县级供电企业分类方法
利用聚类分析,可以通过定量分析和计算,利用相似度对县级供电企业进行较为科学的分类。因此,采用Q型聚类,将各个县级供电企业作为样本,以管理评价报告为基础,选择一定数量的县级供电企业管理指标作为变量,用系统聚类方法将样本合并到设定的类别数量,达到分类的目的。
4指标体系选择
从简化计算的角度出发,选择管理评价关键指标,如2014年度县级子公司共计18项关键指标,县级分公司共计19项关键指标。
5数据来源与处理
选择某年度的县级供电企业管理评价报告,从中选择需要进行分类研究的若干个县级供电企业作为分析样本,每个县级供电企业的相应指标作为分析变量,以电子表格的形式进行初步整理,并去除明显错误项、缺值项、等值项,进行数据核实,形成原始数据表。
6数据分析软件选择
数据分析软件选择比较常见的社会科学统计软件,即SPSS,其提供统计方法先进成熟、操作简便,可以较为方便地实现统计分析和绘图。
7实例分析
从2014年县级供电企业管理评价报告中,选择某地市供电局所辖8个县级子公司作为分类研究对象,以18项关键指标作为变量开展聚类分析,分析方法选择系统聚类法。
7.1整理数据
从报告中挑选出数据进行整理、除错、筛选,得到原始数据表格,其中去除一项8个县公司均为0的指标后,剩余17项关键指标。其中,关键指标名称以序号代替,县级子公司名称以A至H代替。
7.2导入流程
将原始数据表格导入SPSS,由于在SPSS中变量为横向排列,以此需要对表格数据进行转置。调整后在SPSS中得到数据表,其中以CASE_LBL列为县级子公司名称列,var001至var017为关键指标,作为计算变量。
7.3数据分析
在SPSS中使用“分析-分类-系统聚类”,进行适当设置后,以17个关键指标为变量,以8个县公司为个案进行数据计算,所示结果如下图。
如图1所示,树状图是分类结果更直观的表示。结合树状图,同样可以根据需要选择分类数量,其中横坐标为样本点间的距离,纵坐标为县级子公司名称。比如,如果将8个县公司分为2类,从右向左看,C公司、F公司为一类,其余公司为一类。如果将8个县公司分为3类,从右向左看,C公司、F公司为一类,E公司、H公司为一类,其余公司为一类。以此类推,如果将8个县公司分为4类,从右向左看,A公司、B公司、D公司、G公司为一类,E公司、H公司各分为一类,C公司和F公司分别为一类。
8结果评估
从分类结果看,分2到4类比较好,因为分类的间距越大说明类别间差异越大,效果也就越好。结合各县级子公司具体指标,分为4类的情况下,E与H公司单位可控供电成本较高的特点突出,C公司的万元固定资产售电量和F公司的利润总额高于其他公司较多,使这两个公司单独分为一类;分为两类的情况下,C公司和F公司因为售电量大的突出特点分为一类,其他公司为一类,这与实际情况相符合。
9结束语
本文探讨了利用聚类分析方法对县级供电企业进行分类的思路与模型,并以2014年管理评价报告的数据进行了实例分析,对分析结果进行了评估,对县级供电企业“分类管理、分类指导”的方法进行了探索。利用该方法,可以从量化的角度对县级供电企业进行分类,避免人工分类时对县级供电企业特点的感性判断,将复杂的指标数据梳理和比较用软件完成,相对降低了分类研究的难度。
参考文献:
[1]费宇.应用数理统计-基本概念与方法[M].北京:科学出版社,2007.
[2]詹姆斯?R?埃文斯.数据、模型与决策[M].北京:中国人民大学出版社,2011.
[3]贾怀勤.数据、模型与决策[M].北京:对外经济贸易大学出版社,2004.
[4]孙旭.时间序列全局特征聚类分析方法及其应用[J].统计教育,2009年3月.
[5]Kalpakis K, Gada D, Puttagunta V. Distance measures for effective clustering of ARIMA time - series [C]. IEEE International Conference on Data Mining, San Jose, CA, USA, 2001.
作者简介:
翟亮(1983),男,四川高县人,工程师,从事农电管理及企业管理工作。
杨俊(1982),男,云南昆明人,工程师,从事科技管理工作。
柴国庆(1977),男,云南玉溪人,助理工程师,从事县级供电企业管理评价工作。
论文作者:翟亮,杨俊,柴国庆
论文发表刊物:《电力设备》2016年第23期
论文发表时间:2017/1/16
标签:县级论文; 公司论文; 供电企业论文; 方法论文; 数据论文; 指标论文; 距离论文; 《电力设备》2016年第23期论文;