基于神经网络的数据挖掘方法研究

基于神经网络的数据挖掘方法研究

李必辉[1]2008年在《基于神经网络的销售分析预测研究与应用》文中研究表明在世界范围内,CRM(Customer Relation Management)自1997年以来一直迅速发展,成为了企业信息化建设的重要组成部分。同时CRM的广泛应用也积累了海量的客户数据。随着企业竞争得加剧,企业管理对决策支持的需求日益迫切。客户关系管理与数据挖掘技术的结合已成为一种发展趋势。论文针对CRM系统对决策支持方面的需求,将数据挖掘技术应用到销售预测中。结构化的CRM系统设计基于模块,模块间功能独立,数据交互功能复杂。论文在设计CRM时采用基于业务流程管理(Business ProcessManagement)的方法,通过完成业务流程实现系统功能,同时可以让管理人员管理和优化企业业务流程。有效融合了企业内部的不同信息系统,同时也为数据仓库的构建和数据挖掘提供了便利。基于数学统计的销售预测方法往往只考虑了一部分影响销售的因素,无法表达影响需求的各种因素之间的复杂的相互作用,建立的模型相对简单。论文通过对比传统的统计学预测方法和人工神经网络,认为人工神经网络具有良好的非线性映射能力和自学习能力,可以通过学习把基本需求、季节、周期、市场活动等因素以及它们之间的相互作用以权值的形式固化在神经网络中,用来预测销售趋势。论文分析了基于BP(Back Propagation)网络进行销售预测的原理,利用叁层前馈神经网络建立预测模型,详细探讨了网络的拓扑结构、隐节点个数确定的原则、样本数据的选取和预处理、初始参数的确定、激活函数的选取等问题。仿真结果表明,该模型预测精度较高,具有较好的泛化能力。论文提出并实现的适用于中小型企业的销售分析预测系统,基于企业不同信息系统搭建数据仓库,通过数据挖掘实现销售预测,同时也包括其他数据分析模型。在系统设计构架上,考虑到对不同类型的神经网络类型的扩展需求,论文将不同神经网络的共同特征提取、设计成接口,便于以后将不同类型的神经网络应用集成到该框架中来,具备更好地可扩展性,为日后的功能增强提供了支持。

李欣[2]2003年在《基于神经网络的数据挖掘方法研究》文中进行了进一步梳理数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能从数据仓库中自动分析数据,进行归纳性推理,从中发掘出潜在的模式;或者产生联想,建立新的业务模型,帮助决策者做出正确的决策。数据挖掘研究和实践表明:知识就隐藏在日常积累下来的大量数据之中,然而仅靠复杂的算法和推理并不能发现知识。人工智能技术,特别是神经网络技术与数据挖掘的结合为数据挖掘理论和方法的研究指出了一条新的道路。 本文对数据挖掘、神经网络的研究现状、发展趋势及应用领域进行了综述,阐述了数据挖掘、神经网络的基本概念、基本模型和传统实现方法。针对数据挖掘具体的研究内容,提出并实现了神经网络数据挖掘中的数据准备的一般处理方法、基于神经网络分类决策树的构造、基于神经网络的分类与预测、基于神经网络的关联规则挖掘和基于自组织神经网络的聚类分析的模型和算法。基于神经网络数据挖掘方法与传统数据挖掘方法相比较,在信息处理能力、关联规则挖掘和表示能力方面有较大提高。 根据基于神经网络数据挖掘的研究成果,并结合大庆油田采油叁厂科研项目,研制开发出《萨北开发区北二西葡萄花油层水淹层识别系统》。系统以油田勘探开发数据库为底层数据支持,主要包括数据清洗、数据转换、数据抽取、基于神经网络方法的数据挖掘、结果评估和知识表示等功能,实现了水淹层的自动识别。

刘伟[3]2007年在《基于神经网络的信息挖掘模型研究》文中研究表明数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能从数据仓库中自动分析数据,并进行归纳性推理,从中发掘出潜在的模式;或者产生联想,建立新的业务模型,帮助决策者做出正确的决策。理论研究和应用实践表明,知识就隐藏在日常积累下来的大量数据之中,然而仅靠复杂的算法和推理并不能发现知识。人工神经网络是目前计算机领域发展迅速并取得众多应用成果的一门新技术,由于其用于问题求解无需事先建模,因此它与数据挖掘的结合为数据挖掘理论和方法的研究指出了一条新的道路。本文对数据挖掘、神经网络的研究现状、发展趋势及应用领域进行了综述,阐述了数据挖掘、神经网络的基本概念、基本模型和传统实现方法。针对数据挖掘具体的研究内容,提出并实现了神经网络数据挖掘中的数据准备的一般处理方法、基于神经网络分类决策树的构造、基于神经网络的分类与预测、基于神经网络的关联规则挖掘和基于自组织神经网络的聚类分析的模型和算法。基于神经网络数据挖掘方法与传统数据挖掘方法相比较,在信息处理能力、关联规则挖掘和表示能力方面均有较大提高。根据基于神经网络数据挖掘的研究成果,并结合大庆油田采油叁厂科研项目,开发了《萨北开发区北二西葡萄花油层水淹层识别系统》。系统以油田勘探开发数据库为底层数据支持,主要包括数据清洗、数据转换、数据抽取、基于神经网络方法的数据挖掘、结果评估和知识表示等功能,实现了水淹层的自动识别,并取得了较好的应用效果。

周戈[4]2017年在《基于神经网络的数据挖掘方法研究》文中认为本文将通过简单介绍两种常见的基于神经网络的数据挖掘类型,即自组织神经网络数据挖掘以及模糊神经网络数据挖掘类型出发,以RBF神经网络为例,着重围绕基于神经网路的数据挖掘方法进行简要分析。

常凯[5]2014年在《基于神经网络的数据挖掘分类算法比较和分析研究》文中进行了进一步梳理随着信息技术的发展,人们生产数据和采集数据的能力愈来愈高,但是,我们在数据分析和知识获取方面,能力还相对滞后。因此,从收集数据、创建数据库,管理数据,到数据分析,数据挖掘技术渐渐产生和发展。数据挖掘(Data Mining, DM)是一门跨学科的课题,涉及许多领域,包括统计学(Statistics)、数据库(Database)、机器学习(Machine Learning)和人工智能(Artificial Intelligence)等。数据挖掘,也被称为数据库中的知识发现,是从“海洋般”的大量数据中获取新颖的、有用的、有效的、可理解的模式的非平凡过程,也就是从大量数据里提取知识。分类(Classification)问题是数据挖掘技术中非常重要的研究课题,利用分类技术,可以从数据集中提取出描述数据类相同的模型或函数,并且能够顺利把数据集中每一个未知类别的数据划归到某个已知的类别中去。目前,常用的数据挖掘分类算法主要有:统计分类法、决策树、人工神经网络方法等。不同的算法会产生不同的分类器,而不同的分类器又会影响数据挖掘的准确率和数据挖掘的效率。因此,当面对数据量庞大的分类问题时,选择适当的分类算法是非常有必要的。人工神经网络(Artificial Neural Network, ANN)是数据挖掘常用的方法之一,该方法通过模拟人脑生物神经网络,将若干个具有处理功能的神经元(neurone)节点,按照一定的网络结构连接起来,使它能够处理不精确数据、模糊数据或者复杂的非线性映射问题。人工神经网络能够识别的模式是由网络的连接权值、拓扑结构及神经元阈值决定的。通过优化人工神经网络的拓扑结构及网络的权值、阈值,可以达到优化人工神经网络模型的目的。本文针对实际应用中的分类问题,详细介绍了叁种人工神经网络算法的网络结构和算法描述,以及叁种算法的优缺点,重点阐述了极限学习机的理论基础。将极限学习机算法应用于六个真实的数据集中,实现分类应用试验,并对实验结果与支持向量机和BP算法实验结果进行比较分析。通过实验结果发现,极限学习机在分类时间和准确率等反面,均具有明显的优势。

赵波[6]2004年在《人工神经元网络在智能空间决策支持系统中的应用研究》文中研究指明地理信息系统在现代社会中的作用越来越重要,这主要是因为地理信息系统不仅可为我们提供丰富的空间信息,而且通过其强大的空间分析能力为决策提供支持信息。地理信息系统为决策支持提供了强大的数据输入、存储、检索、显示的工具,但在分析模拟和推理方面的功能还比较薄弱,本质上是一个数据丰富但知识贫乏的系统,在解决复杂空间决策问题上缺乏智能推理功能。所以,为解决复杂的空间决策问题,需要在地理信息系统的基础上开发智能决策支持系统(Intelligent Spatial Decision Support Systems,简称ISDSS),用于数据获取、输入、存储、分析和输出;用于知识表达与推理;用于自动学习、系统集成、人机交互。它应该能够对结构化或非结构化的知识进行表达与推理。该系统应该以人工智能和知识工程作为知识表达和推理的手段;以软件工程作为系统开发和管理的工具;以空间信息系统作为数据处理和显示的基础框架,并使以上各部分以无缝的方式结合在一起,构成一个完整的空间决策支持系统 对于ISDSS来说,符号方法仍是一种重要的知识表达与推理手段。而对于具有大规模并行分布式结构的知识来说,采用人工神经元网络方法则会比符号方法有较大的优越性。不管ISDSS应用符号方法、神经网络或者混合方法,制约ISDSS发展的瓶颈都将是空间知识的自动获取。从空间数据库中发现(学习)知识的能力是衡量一个ISDSS成功与否的重要标志。因此研究人工神经元网络以及其它智能方法在空间知识的获取、表达以及推理中的应用,对于解决上述问题具有重要意义。本文针对人工神经元网络在空间智能决策支持系统中的应用进行了研究,主要工作有如下几方面: 1.人工神经元网络用于空间数学模型的建立 包含隐含层的BP网络模型,可以以任意精度逼近任何连续函数,因此该网络模型在GIS空间数据模型建立中具有重要的应用价值,是GIS应用领域建立空间数学模型的有效工具之一。采用人工神经网络,可以在有很少或没有关于待建模型先验知识的情况下,通过对样本知识的学习,建立变量之间的依赖关系,并且只要样本数据之间存在某种依赖关系,人工神经元网络就一定可以通过训练得到,否则神经网络不会收敛。这一点是常用的回归方法所不能比拟的。本文把人工神经元网络用于空间数学模型的建立,并在模型建立过程中引入关键神经元的概念,从而使网络减少冗余结点,使其能更好地反映空间要素之间的依赖关系。 2.人工神经元网络用于空间知识的表达与推理 知识的表达与推理是建立智能系统的关键问题。一个智能系统为了能够理解和对问题进行推理,该系统需要掌握有关该领域的先验知识。因为空间决策支持系统是一个用于空间推理的智能系统,所以空间知识的表达与推理具有非常重要的地位。文中对知识的常规表达与推理方法进行了介绍,并提出基于神经网络的知识表达与推理方法,由于具有较强的容错能力、大规模并行处理能力和自学习能力,因此将是对常规方法在空间决策支持系统中应用的一个替代或强有力的一个补充。文中对采用人工神经元网络表达确定或不确定空间知识进行了研究,引入了模糊神经网络用于实现不确定性空间知识的表达与推理,并经实例验证,认为这是一种可行的方法。3.人工神经元网络用于空间数据挖掘与知识发现 空间知识是构成智能空间决策支持系统的关键要素,同时也是智能空间决策支持系统的瓶颈所在,因此获取空间知识就成了建立空间决策支持系统的主要任务。空间数据挖掘与知识发现技术正是为满足这一需求而产生的。在空间数据库中,可以挖掘的空间知识种类很多,可用的方法也比较多。在空间数据挖拥方法中,统计学原理是其中使用的主要方法。统计学力一法存在的问题是要求数据附台一定的统计分布规律,同时算法所需要的上作量也较大。人[神经网络和机器学习为解决上述问题注入了新的思想和算法。文中把人工神经网络用于空间数据的聚类分析,并引入了一种具有动态结构的神经网络GSOM网络,由于GSOM可以通过自动生长新的神经元和删除冗余的神经元,来实现网络输出结构的自动选择,因此用于空间聚类分析时,效果较好,可以较好地解决空间数据库中高维数据的自动聚类问题。在空间聚类分析中,使用GSOM,可以实现在没有太多人工干预的情况下,实现自动聚类。

王颖[7]2012年在《基于神经网络的数据挖掘方法的研究和应用》文中认为随着信息技术的发展,人们生产和收集数据的能力大幅度提高,与之相对应的是数据分析和知识获取能力上的相对滞后。从数据收集、数据库的创建、数据管理,到高级的数据分析技术,数据挖掘(Data Mining)技术随之产生和发展。数据挖掘是从数据集或者数据库中识别出有效地、新颖的、有用的、可理解的模式的非平凡过程。分类挖掘是数据挖掘的重要应用之一,分类能力是通过构造一个分类器来实现,其构造方法有统计方法、机器学习方法、人工神经网络方法等。人工神经网络(ANN)是数据挖掘的重要方法之一,通过模拟人脑生物神经网络,将若干具有处理功能的神经元节点按照一定的结构连接起来,使其具有处理模糊、不精确数据和复杂非线性映射问题的能力。神经网络所能识别的模式是由网络的拓扑结构、连接权值和节点阈值决定的。因此,针对神经网络模型的优化方法主要分为优化网络的拓扑结构和优化网络的权值阈值。本文重点研究基于BP神经网络的分类器模型,以及BP神经网络模型与其他优化算法的结合,包括遗传算法(GA)、粒子群算法(PSO)、Adaboost算法。GA和PSO具有全局搜索的性能,多用于优化网络的权值阈值和隐含层节点数。Adaboost算法是基于集成的思想来建立一个加强型的分类器。与标准的BP分类模型相比,优化后的分类器能够明显提高分类精度,减少错判率。进一步研究了Adaboost算法,针对分类中的两类错误FNR和FPR,本文引入了基于重视程度的样本自适应权重算法,用来改对善重视程度高类别的判别能力。本文的实证分析是将基于BP神经网络构建的分类器模型应用到财务分析领域,建立上市公司财务危机预警模型。通过数据准备阶段、分类器建模阶段、挖掘阶段、解释分析阶段,把数据挖掘方法应用财务预警系统中,构建了一个适用于财务预警的分类器,并通过单一BP分类器、Adaboost_BP分类器和改进的Adaboost_BP分类器的测试样本分类结果的对比,验证了Adaboost算法和改进算法的有效性。

段录平[8]2007年在《基于RBF神经网络的数据挖掘研究》文中提出随着数据库技术的成熟应用和Internet的迅速发展,人们利用信息技术生产和搜集数据的能力大幅度提高,使得从大量数据中挖掘出有用的信息或知识成为一个迫切需要解决的问题。正是这种需求推动了数据挖掘兴起和数据挖掘技术的发展。数据挖掘经常要面对一些有噪声、杂乱、非线性的数据,而神经网络具有良好的鲁棒性、自适应性、并行处理、分布存储和高度容错性等特点,因此神经网络非常适合用来解决数据挖掘的一些问题。本文简单阐述了数据挖掘和人工神经网络的基本理论。在分析数据挖掘各种技术的基础上,对神经网络方法在数据挖掘中的应用进行了研究分析,接着着重研究了基于RBF神经网络的分类数据挖掘方法。在梯度算法基础推导出一种增量式的学习算法,在训练过程中该算法可以自适应调整网络参数。然后在IRIS数据库上进行分类实验,仿真实验结果表明该算法性能较好。在对RBF神经网络训练算法深入研究的基础上,本文采用了两阶段学习策略来加速学习收敛;提出动静相结合的隐含层设计方法来构造出较优的隐含层结构;提出采用误差校正的思想来改进RBF网络输出精度,并给出了其实现算法。并对这些改进算法在UCI数据库上进行了实验和对比分析,实验结果表明改进后的算法其性能均有明显提高。基于对数据挖掘和神经网络技术的研究,开发了一个主要用作实验平台的集成了本文各种算法的数据挖掘系统。本论文研究的基于RBF神经网络的数据挖掘方法具有一定的理论深度和实用价值,尤其创新的学习算法可以为相关的科研工作提供有益的参考。

朱丽娜[9]2012年在《基于电离层异常现象的数据挖掘方法研究》文中认为强震前电离层前兆异常已经被大量的统计研究结果和震例研究结果所证实,地震电离层前兆观测已经成为地震短临预测的有效手段之一。面对庞大的电离层数据,传统的数据处理方法已经力不从心,将数据挖掘方法引入到分析电离层电磁异常现象中来是技术发展的必然趋势。论文结合法国DEMETER卫星数据,基于神经网络数据挖掘方法研究了磁暴和大地震电离层前兆异常进行预测的方法,讨论不同参数条件对训练结果的影响,主要完成如下工作:针对卫星数据分布不均匀问题,应用时间换空间的概念,对DEMETER卫星原始数据进行了预处理,牺牲时间分辨率将一维时间序列数据转化为二维空间图像。这一处理方法可有效减小数据样本集分布的不对称对神经网络训练结果的影响。通过均值、插值计算等方法实现去噪、平滑和填补缺失值;进而通过计算标准差、门限分割将原始数据转化为0-1图等操作凸显异常值。将预处理后的标准差以及标准差和值和门限分割后的二值图分别作为神经网络的训练样本考察数据样本对训练结果的影响。针对磁暴这一电离层较为常见和显着的电磁辐射现象,采用磁暴电离层异常数据样本,研究了不同分辨率条件下和不同的数据预处理方法获得的样本集,以及不同的网络拓扑结构和网络参数对神经网络预测性能的影响。试验结果表明数据样本选择标准差和值,神经网络选择双隐层、变速率学习方法的误差反向传播(BP)神经网络时,磁暴的预测正确率可达到80%,有较优的预测结果。针对地震电离层扰动的复杂性,论文利用神经网络对未知模型的可预测性优势,研究了基于神经网络的地震前兆预测方法,通过数据样本与地震准备区电离层异常数据的对应性分析,研究预测有无地震问题。并进一步运用误差反向传播神经(BP)网络和径向基(RBF)神经网络分析电离层参数与地震的“关联程度”,两种网络得出了一致的结果:电子密度和离子密度与地震的“关联程度”要高于电子温度和离子温度这两个参数,这与一些权威文献震例研究结果相吻合,验证了本论文所采用的数据处理方法的有效性。试验结果也表明,在预测方面,RBF神经网络的准确率要高于BP神经网络。

郭翠翠[10]2007年在《基于神经网络的数据挖掘方法研究》文中研究指明从大量的数据中提取和挖掘未知的、有效的和可操作的知识就是数据挖掘,它是知识发现过程中的重要步骤。数据挖掘能够发现未知的知识,区别于那些先提出假设再进行验证的数据处理方法。挖掘结果的有效性是指数据挖掘的结果是正确、合理的;挖掘结果的可操作性是指挖掘的知识能够为决策提供支持。数据挖掘越来越多地受到各界的重视并被广泛应用于各个领域。分类技术是数据挖掘中最有应用价值的技术之一。数据分类就是在大量数据中找出一组对象的共同特征,并将数据按照分类模型划分成不同的类的过程。该模型能够把数据库中的元组映射到给定类别集中的某一个。数据分类一般分两步,建立数据模型与使用模型进行分类。在使用模型进行分类前应首先评估该模型即分类器的预测准确率;如果准确率可以接受,就可以使用类标号对未知的数据元组或对象进行分类。人工神经网络是在现代神经生物学研究成果的基础上发展起来的一种模拟人脑信息处理机制的网络系统,它不但具有处理数值数据的一般计算能力,而且还具有处理知识的思维、学习、记忆能力。基于神经网络的数据挖掘过程由数据准备、规则提取和规则评估叁个阶段组成。本文研究了教学型和分解型规则抽取算法,在分析了RX分解型算法后,利用关联法对输入输出神经元进行关联计算,按关联度排完序之后,用RBF神经网络进行结点选择,这样可以大大减少神经网络的输入结点个数,简化网络结构,减少子网的递归分裂次数,提高计算效率。最后,通过两个UCI数据集中数据的验证,表明了该方法的有效性。由于目前还没有任何一种分类方法对所有的分类问题都优于其他方法,因此对于各种分类方法的改进与优化是一个非常有意义的研究方向。

参考文献:

[1]. 基于神经网络的销售分析预测研究与应用[D]. 李必辉. 东华大学. 2008

[2]. 基于神经网络的数据挖掘方法研究[D]. 李欣. 大庆石油学院. 2003

[3]. 基于神经网络的信息挖掘模型研究[D]. 刘伟. 大庆石油学院. 2007

[4]. 基于神经网络的数据挖掘方法研究[J]. 周戈. 数字技术与应用. 2017

[5]. 基于神经网络的数据挖掘分类算法比较和分析研究[D]. 常凯. 安徽大学. 2014

[6]. 人工神经元网络在智能空间决策支持系统中的应用研究[D]. 赵波. 武汉大学. 2004

[7]. 基于神经网络的数据挖掘方法的研究和应用[D]. 王颖. 中国地质大学(北京). 2012

[8]. 基于RBF神经网络的数据挖掘研究[D]. 段录平. 哈尔滨理工大学. 2007

[9]. 基于电离层异常现象的数据挖掘方法研究[D]. 朱丽娜. 哈尔滨工业大学. 2012

[10]. 基于神经网络的数据挖掘方法研究[D]. 郭翠翠. 武汉理工大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于神经网络的数据挖掘方法研究
下载Doc文档

猜你喜欢