(92493部队,辽宁省 葫芦岛市 125000)
摘要:当今信息化发展速度惊人,大数据、云计算、人工智能技术应用于各行各业,给社会的发展带来了很多便利,也为我国经济的快速发展注入了新的血液。因此,根据实际情况研发出科学而有效的数据挖掘算法,对于整个信息行业来说都有不可估量的意义,在进行大规模数据信息处理的时候,在关联规则下的数据挖掘算法就体现出了它本身重要的优势。因此,本文将对关联规则下的数据挖掘算法进行详细的分析,以供参考。
关键词:数据挖掘算法;关联规则;分析
1前言
随着社会信息化的迅速发展,无论是数据的变化速率,还是数据的新增种类都在不断更新,数据研究变得越来越复杂,这意味着“大数据时代”到来。2011年,互联网数据中心(internetdatacenter,IDC)将大数据重新定义为:在大数据原有的三维特征——数量、多样、速度基础上,增加了另一新的特征——“价值”。IDC强调:“目前,对于庞大的数据量,通过经济的方式,极速发掘、获取和分析处理的技术,进而提炼获取价值,这是大数据新时代的专属。”“大数据时代”的专属特征被重新定义为:数量(volume)、多样(variety)、速度(veloci⁃ty)和价值(value),称为“4V”。
2数据挖掘的研究现状
数据挖掘将高性能计算、机器学习、人工智能、模式识别、统计学、数据可视化、数据库技术和专家系统等多个范畴的理论和技术融合在一起。大数据时代对数据挖掘而言,既是机遇也是挑战,分析大数据,建立适当的体系,不断地优化,提高决策的准确性,从而更利于掌握并顺应市场的多端变化。在大数据时代下,数据挖掘作为最常用的数据分析手段得到了各个领域的认可,目前国内外学者主要研究数据挖掘中的分类、优化、识别、预测等技术在众多领域中的应用。
1)分类。
伴随着时代的进步和科技的飞速发展,作为人口大国,中国在健康医疗、老龄化社会等方面产生的公共数据呈几何级数进行增长,而基于大数据的挖掘数据所附有的价值问题急需解决。健康医疗数据的结构、规模、范围和复杂度等都在不断扩大,传统的计算方法并不能完全满足分析医疗数据,数据挖掘技术则可以根据医疗数据的一些特点:模式的多态性、信息的缺失性(数据中由于涉及个人隐私问题而导致的缺失值)、时序性、冗余性对健康医疗数据进行分类,从而可以为医生或病人提供准确的辅助决策。同时,中国正加速进入老龄化社会,而互联网是改善老龄化社会的重要媒介,大数据是评估老龄化社会重要的技术手段。屈芳等提出了“互联网+大数据”模式的养老实现途径,整个养老服务体系是建立在多元异构信息汇聚和数据融合挖掘之上,“互联网+大数据”的养老体系是将多种信息通信技术进行融合,在这里,包括通信技术、数据挖掘技术及人工智能技术等。
2)优化。道路的交通状况与人们的出行关系密切,随着城市的快速发展、生活水平的改善,机动车的规模也逐渐扩大,带来了交通拥堵等问题。数据挖掘技术可以有效解决交通道路和物流网络之间的优化问题,Pan等提出了一种数据挖掘预测模型,该模型用于“实时预测”短期的交通状况,给陷入交通拥堵的驾驶人员带来极大的帮助。
3)识别。自从20世纪50年代数字图像出现以来,数字图像成为人类社会中必不可少的“数据”。在计算机应用中,数据挖掘在图像识别的应用越来越普遍,有代表性应用为人脸识别和指纹识别。人脸识别通过对获得的信息库进行数据挖掘,进一步分析和处理可靠的、潜在的数据,充分准备资料的分析工作和未来的开发工作。
期刊文章分类查询,尽在期刊图书馆Wright等阐述了基于稀疏表示的鲁棒人脸识别,并给出了详细的理论分析与实践总结。沙亚清等针对目前的电子报税系统中利用用户名和口令的不安全性,提出了一种基于智能卡和指纹识别的身份认证方案,并结合指纹技术,构建新的口令参数,从而使得安全性明显提高。随着数据挖掘技术的不断发展,大数据识别人脸和指纹的精确度会越来越高。
4)预测。
预测问题是各领域中研究最多的问题,其目的是通过历史数据预测出未来的数据值或发展趋势。大部分历史数据是时间序列数据,即指按照时间的顺序排列,得到了一系列观测值。由于信息技术的不断进步,时间序列的数据也日益剧增,如气象预报、石油勘探、金融等。时间序列数据挖掘的最终目标就是通过分析时间序列的历史数据,预测未来一段时间的变化趋势及其带来的影响。
3 关联规则下数据挖掘算法应用
3.1数据挖掘算法在数据交互上的应用
为了有效避免数据重复这一情况,相关关联规则下的数据研究人员往往会对数据挖掘技术的研究过程进行整体上的改革,进一步加大研究力度,刷新挖掘目标,科学的完善整体的挖掘计算机制。比如,相关研究人员在进行实际研发的时候,要对数据挖掘计划做一个详细的数据总结,并且对整个系统当中的工作控制具体到任务分配环节上来。使得每一位研究人员都能够在一个理想的挖掘数据信息环境当中来指定挖掘算法的约束。进而从不同的阶段上面,来对数据挖掘技术基本形式进行实时的数据交互。
3.2数据挖掘算法在反馈机制下的应用
在进行实际数据挖掘算法研究的过程当中往往会受到很多不可测因素的影响,所以在其间建立有效的反馈机制和负反馈机制是非常有必要的。针对于计算结果,要及时的进行验证,防止由于错误导向导致的算法数据修正。因为在数据修正的过程当中会消耗大量的人力、物力以及时间。建立约束机制是必不可少的,数据挖掘算法当中的各个阶段都需要约束机制的作用。确保逻辑上的正确性,并且根据客户的侧重面来进行实际主观改良。数据挖掘算法的约束是不变的,像数学上的逻辑性一样。在研究的过程当中一定要满足各方面的实际需求,符合逻辑性。
3.3数据挖掘算法在约束条件下的线性应用
在进行约束类型选择的过程当中,一定要遵守相关的关联规则:在时态的约束条件之下。数据量的上升以及计算机的内存是呈线性关系的,倘若在一个数据库中,对数据挖掘算法进行扫描的时候,发现少了I/O个数的话,在关联规则之下,数据挖掘算法就有其必要性,此内容就是ISS的容量控制。ISS容量控制如果非常科学、合理的话,能够在一定程度上减少CPU的占用量,提升性能。
4结束语
在关联规则之下,数据挖掘算法是在数据挖掘技术当中所引发出来的非常重要的数据处理方法,它的合理应用能够使得数据库在进行大范围内的数据处理时,能够高效,及时并且容错率低地进行数据统计、分析、计算、预测。所以,本文中的主体主要是介绍数据挖掘技术以及数据挖掘算法,以供相关读者参考。
参考文献
[1]郝建军,翟岁兵,刘冬,等.数据挖掘技术识别可疑洗钱交易行为模式研究[J].电脑知识与技术,2016,12(14):204-205.
[2]郝建军,刘斌.基于数据挖掘的服装销售决策系统研究[J].信息与电脑(理论版),2018(1).
[3]郝建军.数据挖掘在服装客户关系管理中的运用——评《服装市场营销》[J].印染助剂,2018(2).
[4]万铮.基于数据仓库的OLAP系统的设计与实现[D].西南交通大学,2015.
论文作者:陈阳
论文发表刊物:《知识-力量》2018年12月下
论文发表时间:2018/11/2
标签:数据论文; 数据挖掘论文; 算法论文; 技术论文; 规则论文; 互联网论文; 时间论文; 《知识-力量》2018年12月下论文;