摘要:随着科技的不断发展,智能化技术在电力行业中得到了广泛应用。大数据平台可通过分析相关数据,为企业决策提供依据。本文分析了智能化背景下的电力大数据高效分析挖掘技术。
关键词:智能化;电力;大数据;高效分析;挖掘技术;思考
1 项目简述
2013年国家电网启动大数据关键技术研究工作,2014年开始设计大数据平台,并由应用与技术两方面规划公司大数据平台框架。现阶段,公司已形成较为完善的大数据平台框架,并且对大数据采集、分布式存储工作进行了检验,并积累了一定经验。但是并未针对电力大数据的特征,优化电力大数据计算及数据分析技术,也未深入研究数据处理能力,因而为其并不能满足各部门对电力大数据分析挖掘方面的要求。本次研究就是为弥补此方面的不足,研发高效大数据分析及智能分析技术来提高大数据平台处理能力,并建设多种具有一定业务价值的智能决策应用。
2 电力大数据智能化高校分析挖掘技术研究
2.1大数据智能化分析算法
数据挖掘算法就是依据数据创建数据挖掘模型进行试探与计算。为建设相应模型,需依据数据信息,探究特定类型的模式及趋势。
大数据挖掘就是在大量、不完全、随机数据库中获取有价值、知识的数据信息,其可为企业决策提供一定支持。大数据挖掘技术的实现,需利用人工智能、机器学、模式学等知识及技术。通过自动化分析大数据,可为企业、商家、用户决策提供数据支持。数据挖掘可帮助企业(比如:银行、电商等)解决很多问题,主要包含:确定营销策略、分析市场行情等。常用的大数据挖掘技术有:分类、回归分析、聚类、关联规则等。
2.1.1分类算法
分类算法可解决分类问题,属于数据挖掘、机器学习、模式识别的重要领域。此方法可通过分析已知类别训练集,并发现其分类规则,预估新数据类别。分类算法在银行中风险评估、客户类别分类等方面得到了广泛应用。
Bayes、Lazy Learning等均属于分类算法,Lazy Learning 的方法是在训练过程中保存样本集数据信息,在测试样本到达之后才可进行分类决策。与其他分类算法不同,此种分类算法可依据测试样本的数据信息学习模型,如此可保证学习模型与样本特征相符。
决策树算法,需将数据信息分类,从而实现预测数据种类的目标。使用此计算方法,需将训练集数据形成相应决策树,整个决策树是由决策结点、分支及叶子构成的。
2.1.2回归分析
此方法是确定两种及以上变量之间相互依赖的变量关系的分析方法。此种方法应用较为广泛,依据变量多少,可将其分为一元回归与多元回归分析;线性回归分析方法中,依据变量多少,可将其分为简单回归分析与多重回归分析方法;依据自变量与因变量之间的关系,可将其分为线性回归分析及非线性回归分析。
回归分析可反映数据属性值的特点,可利用函数反映数据映射之间的关系,了解属性值之间的关系。此方法可用于预测、分析数据序列。回归分析方法在市场营销中得到了广泛应用。
2.1.3聚类
此方法与分类相似,其主要依据数据相似特点及差异点将数据分为不同类。相同种类的数据较为相似,不同种类的数据并不相似,聚类分析的主要目的是在相似数据信息中搜集同种类数据并分类。聚类技术在多个领域中的得到了广泛应用及发展。
在使用聚类分析技术时,并不需要事先制定分类标准,聚类分析技术可依据数据信息自动分类。使用方法不同,其结果也不相同。因此不同研究人员针对相同数据进行聚类分析,也将获得不同聚类数。
期刊文章分类查询,尽在期刊图书馆
聚类分析属于数据挖掘的重要任务,聚类技术可明确数据分布情况,并观察每簇数据的特点,详细分析特定的聚簇集合,此外,聚类分析可作为其他算法的预处理环节存在。聚类分析计算方法主要包含:划分法、层次法、基于密度的方法、网格算法等方法。
2.1.4关联规则
关联规则是与X→Y相似的蕴涵式,X表示的是关联规则的先导,Y表示的是关联规则的后继。关联规则就是隐含在数据之间的关联或相互关系,也就是依据一个数据可推导出其他数据。关联规则数据挖掘过程主要包含以下两个环节:首先,由海量数据中挖掘高频项目组;其次,由高频项目组中形成关联规则。此大数据挖掘技术已应用到金融行业中。关联规则主要分为以下三类:基于规则中处理的变量的类别、基于规则中数据的抽象层次、基于规则中涉及到的数据的维数。
2.1.5神经网络
由于神经网络具备自行处理、分布存储、容错度较高等特征。神经网络模型可分为:前馈式神经网络模型(比如:函数型网络)、反馈式神经网络模型(比如:连续模型)、自组织映射方法(比如:ART 模型)。目前,并未明确规定何种领域使用何种神经网络模型与算法,同时大部分人并不理解神经网络的决策过程。
2.1.6深度学习
深度学习是由Hinton等人提出的,其是由深度置信网络提出的,其可用于解决深层结构优化问题。同时,Lecun等人认为卷积神经网络属于首个多层结构学习算法,其可通过空间相对关系减少参数数目从而提升训练性能。我们可将深度机器学习法分为有监督学习、无监督学习两种,不同学习框架建设的学习模型也不相同。卷积神经网络属于有监督学习类机器学习模型,而深度置信网则属于有监督学习类机器学习模型。
2.2变压器状态大数据智能分析
随着科技的发展,电力设备检测方法也在不断增多,电网维护、检测工作将产生大量数据信息,并且与设备状态监测、生产管理等数据信息形成了统一平台管理。变压器状态大数据分析主要涉及高电压、电力系统、统计学等学科。为实现变压器状态大数据智能分析,需依据变压器电压等级、设备厂家、运行年限等条件,分析、挖掘变压器数据信息,并获得数据分布规律及相关性。在预测变压器设备运行状态时,可采用多元回归分析、神经网络、灰色预测等预测方法及关联分析、聚类分析分析技术建设故障预测模型,并预估变压器故障位置及故障程度。
2.3用电负荷聚类分析
用电预测就是依据历史用电负荷值,在一定条件下预测未来某个时间的用电负荷值。其对电力企业科学调度电力资源具有重要意义。近几年,数据挖掘技术在用电预测范畴应用较为广泛。负荷特性指标主要包含最高负荷、平均负荷、负荷密度、自然功率因数等。影响用电预测的因素比较多(比如:经济结构和产业结构调整、居民生活水平提高和消费观念的变化、气温气候变化、电价等),因此使用单一数据方法并不能保证用电预测的准确性,电力企业需使用多种智能预测方式进行用电预测(现阶段,应用较为广泛的算法为:层次聚类,模糊C-均值等。)
3 结语
随着科技的迅速发展,大数据在各行业中得到了广泛应用。智能技术在电力行业得到了广泛应用,电力数据信息的种类及数量也在不断增加,大数据挖掘技术可提升数据处理速度及数据分析能力。电力大数据高效分析挖掘技术,可有效提升数据处理、分析速度及能力,为电力企业决策提供准确数据支持。
参考文献:
[1]王刚,武毅,王梓,等.基于大数据技术的电力系统谐波分析及治理方案[J].电力系统及其自动化学报,2016(s1):46-50.
[2]夏绪卫.大数据时代下数据挖掘技术在电力中的应用分析[J].通讯世界,2016(7):115-115.
[3]李志华,李华军.基于大数据背景下提高供电局数据质量对策分析[J].中国高新技术企业,2016(30):177-179.
论文作者:叶敏
论文发表刊物:《电力设备》2018年第32期
论文发表时间:2019/5/17
标签:数据论文; 技术论文; 神经网络论文; 算法论文; 模型论文; 方法论文; 数据挖掘论文; 《电力设备》2018年第32期论文;