浅议电力数据检索的发展论文_杨颖杰

浅议电力数据检索的发展论文_杨颖杰

(山东交通学院)

摘要:从 20 世纪 70 年代开始,计算机、通信技术及数据处理技术快速发展,需要面对的数据量愈来愈大,虽然所需的有价值的知识也在不断增长,但是深藏在大量数据中的这些有价值的知识并没有和原始数据量的增长按等比例增长,因此必然会造成部分蕴含在大量数据中的知识无法被充分利用。本文就讨论了电力数据的检索。

关键词:电力数据;检索;现状和发展

数据挖掘就是从海量的、有噪声的、不清晰的、杂乱的数据中,提取隐藏的、不易发觉的和有价值的信息与知识的过程,简单来说就是一个对数据分析的过程。从原始数据提取知识,就像从大浪中淘金一样。原始数据的类型多种多样,可以是结构化的数据,例如存储在关系型数据库中的数据,可以是诸如文本、图像数据的半结构化数据,还可以是异构型数据。发现知识的方法也是多样的,例如数学的、非数学的、演绎的、归纳的。经过分析得到的知识的用途也是多样的,可以用于决策支持,可以用于信息管理,可以用于查询优化等。所以知识发现是人工智能、计算机科学、数据库和统计学等多种科学的一个交叉点。

数据挖掘经过几十年的高速发展,其发现的知识已经服务于商业决策、科学管理、科学研究等多个领域。在金融领域,可以用于贷款偿还预测和客户信用政策分析,可以用于挖掘股票交易数据,为客户制定投资策略,可以根据顾客信息安排银行出纳员等。在电子商务领域,可以通过分析商家及客户的数据调整销售策略,根据客户的购买习惯,提供更加人性化的服务,为商家带来更高的利润,还可以应用于客户拓展、欺诈检测、需求预测等方面。在通信领域,可以对用户数据进行数据挖掘,分析研究不同用户的电信使用模式,然后针对不同类型的客户采取相对应的营销策略。在工业生产领域,这一领域也是数据挖掘最有潜力的应用领域之一,可以对生产设备数据、操作决策经验数据及生成过程产生的相关数据等处理后,为工业生产提供可靠帮助。在生物与医学领域,数据挖掘也得到了广泛的应用,生物信息学中数据挖掘可以利用统计学的方法对生物序列进行分析研究,找到规律。

随着信息技术与计算机网络快速发展,各个领域都产生了大量的数据,并以前所未有的速度不断增长,数据规模也从 GB 级发展到 TB 级,甚至是 PB、EB 级。大数据技术在短短两三年内就迅猛发展并产生巨大影响。在 21 世纪的今天,人类各方面的文明都离不开电力,但在电力方面,随着数据采集、存储和传输技术的飞速发展,各种智能电表、智能终端在电网中快速推广应用,积累了大量的运行数据,日益呈现体量大、类型多、价值高等特征,在可预见的未来,智能电网的建设势必带来数据量爆炸式的增长,数据处理能力落后与数据快速增长之间的矛盾将更加突出。且随着数据量、数据类型的不断增多,也呈现出分析性能问题,数据利用手段方面缺乏分析挖掘的高级方法,非结构化数据尚缺乏有效的利用等。

期刊文章分类查询,尽在期刊图书馆由于海量数据的 5v 特点(Volume、Variety、Velocity、Variability、Va lue),数据处理对服务器集群的性能要求也越来越高,因此在处理海量数据时,传统的数据挖掘算法都遇到了相应的性能瓶颈,在大数据环境下数据挖掘的任务将很难完成。因此寻求适用于大数据的平台及挖掘算法迫在眉睫。

数据挖掘(Data Mining,DM)又被称为 KDD(Knowledge Discover in Database,数据库中知识发现)是在 1989 年第十一届国际联合人工智能学术会议上提出的,自此以后,数据挖掘经过近二十几年的蓬勃发展,现在已经深入到各个领域,为人们提供理论上的支持。国内外对数据挖掘这一领域高度重视,在理论和实际应用两个方向都有了很大突破,关于数据挖掘的国际研讨规模从专题讨论升级到国际学术大会,人数也已由原来的几十人发展到千人以上,收录的论文从质量和数量两方面都极大提高,所研究的内容也从最早单一的方法发现转为更加实际的应用问题,进而转为大规模的综合系统的开发,在不断壮大的过程中,关注力从单一的理论研究转为注重多种发现策略及与多种技术的集成方法,还有不同学科之间的相互渗透。数据挖掘技术已经成为当前计算机科学界的一大热点研究方向。研究者们已经取得了大量的成绩,不仅掌握了各种数据挖掘算法,并且开发出了许多优秀的数据挖掘工具如 SPSS、Neural network 、Cognos Scenario 等,更是开发了许多优秀的数据挖掘系统,例如DBMiner、Quest、JAM(Java Agent for Meleaning)等。

大数据平台作为大数据各种技术的一个有机结合体,具有数据采集、数据存储、数据处理、数据分析等功能,大数据平台为大数据的应用提供了有力的支撑。在国外,大数据技术已被各大互联网知名企业发现了其中的巨大商机,其中 Hortonworks、Cloudera、MapR 都推出了商业性质的大数据平台,在相互竞争的过程中促进了大数据平台的发展,在平台技术方面分别提供加速数据分析、降低硬件成本、有序的数据存储等功能。国内企业相对来说起步较晚,基于大数据主的应用主要在互联网、金融、电信、交通等领域。但是基于浪潮、华为、联想等厂商也提供的从服务器、存储到大数据分析平台等软硬件产品,百度、腾讯、阿里巴巴这三家互联网巨头也纷纷拥有了自己的大数据核心产品,并把很多传统应用挪到大数据平台之上,使之更加适应当前大数据发展形势,同时也外界提供大数据存储、分析及挖掘的技术能力。

参考文献

[1]李绪成,王保保.挖掘关联规则中Apriori算法的一种改进[J].计算机工程.

[2]徐章艳,刘美玲,张师超,等.Apriori算法的三种优化方法[J].计算机工程与应用.

[3]陈江平,傅仲良,徐志红.一种Apriori的改进算法[J].武汉大学学报:信息科学版.

作者简介

杨颖杰(1994-09-15),男,电气工程及其自动化。

论文作者:杨颖杰

论文发表刊物:《电力设备》2017年第30期

论文发表时间:2018/3/13

标签:;  ;  ;  ;  ;  ;  ;  ;  

浅议电力数据检索的发展论文_杨颖杰
下载Doc文档

猜你喜欢