摘要:近年来,我国计算机技术不断发展,被广泛应用到了各个行业之中。通过数据挖掘技术,人们可以在大量的数据当中寻找到目标信息,在某种程度上可以大幅度提高人们的工作效率。数据挖掘技术发展比较晚,还需要不断的完善,数据挖掘技术涵盖了计算机技术的特性和统计学理论。经济快速发展促使信息数量大幅度增长,为了在大量的信息数据当中搜索到目标信息,需要人们借助数据挖掘技术来实现。
关键词:数据挖掘技术;软件工程;应用
引言
数据挖掘技术的主要发展内容就是在现在因为信息技术的普及形成的大量信息库中按照人们的需求,准确的查找出人们需要的资料的技术。该项技术在当今时代有着非常广泛的运用面,所以在近年来得到了全面的发展,在需要进行信息处理的各个领域,该项技术都有着非常广泛的运用。
1数据挖掘技术概述
数据挖掘(Datamining),也称为数据采矿,是数据库知识发现的一个基础环节,是在海量数据中自动完成隐藏特殊关系数据搜索的过程,数据挖掘技术就是这一过程应用的相关技术。一般来说,数据挖掘过程可以分为四环节进行,分别是选择软件库保存的数据、完成选择数据的预处理、对预处理得到的格式化数据进行挖掘、以及最终获得目标数据。
软件工程是数据挖掘技术的重要应用领域,具体的数据挖掘工作普遍分为三个层次进行,分别是交互式可视数据探查、自动模式提取和建构模型。三个层次之间存在着直接的关联联系,其中可视数据探查是后两者的基础,而建构模型又是前两者的指导。
软件工程领域应用数据挖掘技术的目的,主要是借助聚类、分析、预测、统计等技术手段,在海量数据资源中快速分辨、寻找符合人们应用需求的数据信息,并自动将检索到的信息反馈至软件系统。此外,为保障数据挖掘的科学性和有效性,数据源还应尽可能达到庞大、真实的要求。
2数据挖掘技术对于软件工程开发的重要作用
首先在软件开发计划过程中通过运用数据挖掘技术能够保证,对于软件产品质量控制提供重要参考。通过合理准确的计划软件开发过程中各项能源资源的消耗,并且对于开发过程进行准确的预测可以避免出现较大差距。如果存在误差则可以及时的进行改进,保证了软件产品的质量。其次通过数据挖掘技术能够为软件学习组织的构建提供基础。在过去软件项目开发过程中必须要针对项目事件作为参考,但是由于知识经验首先要通过实际问题的考验。而数据挖掘技术能够运用对比分析的能力寻找,实际问题的共通性,并且将共同点作为项目经验,提高了软件开发的效率。其次通过对于软件开发,中应用数据挖掘技术,也能够为后续的软件运营与维护提供帮助,由于软件开发很容易出现各种因素的影响,导致变更必须要及时的加以解决,通过数据挖掘能够快速的避开软件存在的风险,并且寻找积极的解决策略,也可以提高软件开发管理决策的效率,加强对于项目的科学决策。例如通过数据挖掘能够有效分析软件具体应用途径,解决软件故障实现对于软件的综合管理。
3数据挖掘技术在软件工程中的应用
3.1程序代码
本文涉及的程序代码,主要是指克隆代码,即通过简单的“复制、粘贴”操作获得并再次进行使用的代码。数据挖掘在克隆代码检测中的应用,是数据挖掘技术应用的早期形式之一,目前应用较为普遍的方法包括基于标识符对比方法、基于文本对比方法等几类。总的来说,数据挖掘在克隆代码检测中的应用还有待进一步的发展和完善,尤其是关于语法信息和语义挖掘的考虑,以提高检测的科学性和准确性。对横切关注点进行挖掘,也是数据挖掘技术的重要应用,主要是由于部分关注点在程序中的代码具有极高的相似度,甚至是使用相同代码导致的。
期刊文章分类查询,尽在期刊图书馆目前,应用于Aspect的挖掘方法众多,根据不同方法的具体特点,可以分为形式概念分析方法、本文和类型分析方法、聚类分析方法、以及自然语言分析方法等等。在对执行模式进行数据挖掘时,应优先选择方法执行关系挖掘和形式概念分析法两种方法。此外,数据挖掘技术还可用于对数据库目标构件或代码的挖掘应用,在数据挖掘技术的支持下,可大幅度提高检索速度、效率和准确度。
3.2开源软件开发
所谓开源软件,就是源代码处于开放状态的软件,一般来说,开源软件普遍对客户免费开放,也正由于开源软件的这一特性,导致对开源软件的管理和控制变得相对困难。在这种环境背景下,在开源软件开发阶段引入数据挖掘技术,可有效提高开源软件的开发质量。以大阪大学设计的分布式数据挖掘系统为例,该系统就可以在实现大规模系统挖掘的同时,完成对不同开源软件的挖掘;再以牛津大学设计的数据挖掘系统为例,该系统实现了系统开发者和使用者的持续跟踪管理,从而大幅度地提高了开源软甲的使用率。
3.3软件项目管理
软件管理对于软件的质量具有非常重要的影响,为此必须要加强对于软件管理的科学研究。通过数据挖掘技术能够对于软件项目组织关系进行挖掘,由于软件工程规模不断提升,各个工程项目管理之间也愈加复杂,为此必须要加强对于开发流程的合理规划,通过数据挖掘技术来控制各个环节的开发质量,最终保证软件开发实现预期目标。在数据挖掘技术应用过程中,能够加强对于人员组织关系的分析,促进人力资源之间的高效协调,降低人力资源成本,保证软件开发的效率不断增强。在软件工程开发过程中通过数据挖掘技术能够针对版本控制信息的变化内容进行全面记录,同时根据系统修复中存在的记录进行分析,为设计者提供参考,降低后期软件维护的成本。
3.4软件故障检测
从故障检测的角度分析,对程序执行记录进行数据挖掘,可提供程序的交互模式和说明,而以上信息均可以作为软件故障定位和检测的依据。对程序说明的数据挖掘过程,就是对信息的跟踪和逆向建模的过程,该过程对于加深对程序的理解,以及优化程序后续的维护管理,具有重要的作用和意义。目前,基于规则的挖掘方法是应用较为普遍的方法,其主要通过对程序行为的挖掘发现对应的规则,进而借助时态逻辑完成表达。
4在其他领域的应用
在其他的领域当中也有数据挖掘技术的广泛参与,比如说半导体领域,在半导体领域当中选择原材料时,会存在大量的问题半导体元件。通过将数据挖掘技术应用于半导体领域,可以大幅度的降低问题半导体元件的出现,由此提高半导体产品的生产质量。在电子商务领域也有数据挖掘技术的身影,电商为了快速的找出用户的数据,提高自身平台的优势,需要应用数据挖掘技术对用户的浏览信息进行分析。分析浏览记录当中的数据信息,适时的通过平台推送用户感兴趣的产品,由此可以实现个性化服务。对于一些生产型企业也会需要数据挖掘技术,通过数据挖掘技术可以实现利润的最大化,由此推动企业自身稳定可持续的发展。
结语
综上所述,随着数据挖掘技术在软件工程中的不断发展和运用,相信未来数据分析技术将会变得更加智能化和自动化。软件工程中的数据分析技术有着简洁、成本低等优势,所以这将是一个开发前景非常广阔的应用领域,在未来人工智能、大数据、互联网+时代的到来时,相信数据分析技术必将是我们生活中不可或缺的一项技术和技能,希望本文的研究能够为数据挖掘方面提供一定的参考和借鉴。
参考文献
[4]张勇.软件工程行业中数据挖掘的应用探讨[J].中国新通信,2018,20(05):89.
[5]李怡.浅析软件工程中数据挖掘技术的应用[J].中国新通信,2018,20(04):102.
[6]朱楠.浅析数据挖掘技术在软件工程中的应用与研究[J].信息系统工程,2018(01):40.
论文作者:何沅隆
论文发表刊物:《基层建设》2018年第36期
论文发表时间:2019/2/27
标签:数据挖掘论文; 技术论文; 软件论文; 软件工程论文; 数据论文; 方法论文; 开源论文; 《基层建设》2018年第36期论文;