山西电力职业技术学院 山西省 030021
摘要:如今云计算与大数据不仅改变了人们生活和工作的方式,还改变了我国市场经济的发展模式,更重要的是云计算和大数据可能会改变信息化的发展方向。但是为了突破传统数据挖掘存在的弊端,开始将云计算与大数据挖掘现结合,从而为用户提供更加有效的数据,满足其多元化的需求。然而基于云计算的大数据挖掘,还需要对大数据挖掘中潜在的弊端进行了解,需要采取有效的解决方案才能促使两者之间进行有效的融合,从而使其能够得到有效的应用。本文主要分析探讨了云计算条件下大数据挖掘内涵及解决方案,以供参阅。
关键词:云计算;大数据挖掘;内涵;解决方案
1大数据以及云计算概述
随着计算机行业的快速发展,各类信息系统的数据规模在逐渐扩大,同时数据种类以及数量等不断增加。海量数据信息的存在,为数据存储系统带来较大的负担。而且,随着信息技术的不断进步,各类信息数据数量不断提升。例如在某一具体的行业中,会产生大量的数据信息,且这些数据信息的种类和样式存在明显差异,随着企业的不断发展,信息数量的存储量会更多,一些实时数据也是其中的重要内容。而云计算主要是在大数据环境下存储数据,同时动态分析数据的一种商业模式,具有快速以及便捷性特点。作为用户应按量进行付费,管理工作应与云计算供应商进行有效互动。在大数据背景下产生了云计算技术,对于云计算而言,大数据主要是一种应用环境,而对于大数据而言,云计算是一种重要的驱动力以及IT基础,两者之间具有紧密的联系。随着大数据的广泛应用,云计算的重要性逐渐凸显。因此,在新的形势下,基于云计算的数据平台在信息利用中是一种有效的研究方向。
2基于云计算的大数据挖掘结构
2.1云计算
纵观整个大数据的发展进程,无论是传统的数据挖掘,还是当下的大数据挖掘,其始终存在有这样或者是那样的一些问题,而同样的,在整个大数据的挖掘之中是寻在着很多不足之处的,因此,我们将这些云计算来应用于大数据挖掘,这样一来,云计算的一些特点,比如虚拟化和高弹性等等,这些特点都可以帮助与大数据的挖掘,可以为大数据挖掘提供动力上的支撑。而在云计算的核心地位中,其一般来说是分为分布式并行的计算以及分布式文件的存储这两种。首先是分布式存储,这种方式其主要针对的是大数据中的一些分布式的文件存储来说的,对于这样的一种存储方式来说,其一般的适用情况是分布式的、大型的、海量的数据之中,同时代表这种分布式文件的系统是GFS,而这种系统其虽然具有的拓展性是十分之高的,但是对于一些储存量比较小的一些文件,却不是那么的适用,同时这种方式还有可能会出现到一些单点故障等等的现象。
2.2大数据的挖掘结构
根据上文大数据挖掘和传统数据挖掘的对比分析,在大数据环境下可以构建一种融合多种计算模式和存储模式的大数据挖掘体系架构。在该架构中根据功能可以分成支撑平台层、功能层和服务层。
期刊文章分类查询,尽在期刊图书馆首先支撑平台层是为大数据挖掘技术分析处理数据和存储数据提供丰富资源和动力支持的,也就是以该平台为支撑,利用基于云计算的相关技术和处理工具对复杂庞大的数据进行分析处理,从而构建资源丰富的云环境。在云环境下除了向外界提供数据、硬件和软件等资源,另外还能大数据挖掘的数据预处理、数据分析和挖掘提供动力支撑。功能层是指从用户特点和实际需求出发,利用数据挖掘和分析工具,在云平台上对数据进行智能化的分析,具有较高的存储和分析能力。服务层指的是在云平台上利用大数据挖掘技术进行分析处理后将数据处理的结果,借助可视化技术等技术服务形式提供给用户。
2.3基于Hadoop的大数据挖掘平台
(1)数据预处理。大数据挖掘模式在后,数据在前,并且确定性模型能够在数据影响下不断变化,其中,预处理主要以综合技术为基础,具体包括数据流处理技术、远程采集技术、传统预处理技术、多模态实体识别技术等,在综合技术作用下,预处理综合功能能够有效实现。数据预处理过程中存在轻因果关系、重数据现象,存在轻数据完整性,重实时性现象,这也是大数据挖掘结果失准的主要原因。(2)数据存储。传统数据挖掘存储数据时,所涉及的系统主要有文件系统、数据仓库以及操作系统等,数据存储较被动,存储模式较单一。大数据挖掘存储在传统储存系统的基础上,增加了分布式存储功能,所存储的数据类型主要有三种,第一种即非结构数据,第二种为存储结构数据,第三种为半结构数据。存储方式主要有两种,第一种即混合存储,第二种为列存储。针对不确定数据有效存储时,能够充分发挥不确定数据管理技术、管理系统的作用,以此完成不确定数据存储活动。(3)数据分析。传统数据挖掘仅在少维数据分析中具备处理灵活性和分析准确性,对于多维数据的分析仅停留在浅层面。大数据挖掘针对数据计算、分析时,主要借助融合计算模式对其进行处理,对于大量维度、动态数据信息分析时,大数据挖掘能够在融合传统数据挖掘不足的基础上,针对性提升原有分析能力,同时,将分布式文件系统与传统挖掘算法有效结合、有效改进,以此优化数据分析质量。(4)数据显示。大数据挖掘在数据显示方面明显优越于传统数据挖掘,挖掘结果的呈现方式主要为图像式和动画式,用户观看的同时,还能对数据有效性分析。传统数据挖掘针对动态数据、多维数据显示时,可视化效果较差,并且因果关系不能直观呈现。因此,要想提升可视化分析效果,还应对交互挖掘、内存原位、系统可视化等技术深入研究,确保节点通信、可视化技术时效等问题被有效解决。
结束语
综上,在大数据时代,面对海量、复杂、不确定的动态数据,传统数据挖掘方式在计算分析能力和存储能力上都遇到了问题,而且其灵活性和扩展性也不符合大数据实时处理要求。而基于云计算的大数据挖掘技术一方面有强大的计算和存储能力,另一方面还能使大数据和云计算得以深度融合。不过,大数据挖掘也存在数据精确度不高、数据处理质量较差、隐私安全以及共享等问题,所以未来还需要对这些问题进一步研究和深入,从而满足用户对于大数据挖掘可靠、高效和高质量的需求。
参考文献
[1]李凯敏,曾子力.基于云计算的大数据挖掘内涵及解决方案研究[J].电脑迷.2018(10)
[2]饶正婵,蒲天银.云计算条件下的大数据挖掘内涵及解决方案[J].电子技术与软件工程.2018(03)
[3]曹小阳.基于云计算的大数据挖掘内涵及解决方案研究[J].数字技术与应用.2017(11)
论文作者:李昌弘
论文发表刊物:《基层建设》2019年第24期
论文发表时间:2019/11/26
标签:数据论文; 数据挖掘论文; 技术论文; 分布式论文; 传统论文; 解决方案论文; 方式论文; 《基层建设》2019年第24期论文;