决策支持系统中的数据挖掘与OLAP——数据仓库环境下的信息分析

决策支持系统中的数据挖掘与OLAP——数据仓库环境下的信息分析

程扬[1]2006年在《基于HIS数据仓库的构建及数据挖掘的研究与应用》文中认为近年来,随着医院制度和社会保险制度改革的深入,一般的大中型医院都相继建立了自己的医院管理信息系统(HIS)。医院对信息系统的管理越来越重要。然而,随着HIS的应用和不断发展,HIS数据库中的数据也在日益的膨胀,如何充分分析利用医院现存的这些大量宝贵的信息资源,为医院的管理决策服务,使医院在医疗市场竞争日益激烈的环境下,保持自己的核心竞争力,不断发展,基于HIS的数据仓库技术和数据挖掘技术应运而生。基于这种现状,本文在通过研究现有HIS的基础上,提出了建立基于医院管理信息系统的数据仓库,以及进行数据挖掘分析来提高医院管理决策水平的一种解决方案。通过数据仓库技术,根据实际需求,从医院信息海量数据库中分析、提取、确立主题,进行有效的数据组织,来构建数据仓库模型。在进行数据清理和数据转换后,实现对数据仓库的数据装载。从而,对创建好的数据仓库就可以进行SQL查询,报表统计,OLAP数据分析以及数据挖掘等方面的应用,来有效地服务于医院的全方位管理决策。本文运用了Microsoft SQL Server 2000提出数据仓库与数据挖掘技术的解决方案。Microsoft公司的SQL Server 2000已经在性能和可扩展性方面确立了世界领先的地位,是一套完全的数据库和数据分析解决方案。Analysis Services提供了OLAP和数据挖掘的功能,将OLAP功能集成到Microsoft SQL Server中,提供可扩充的基于COM的OLAP接口。本文使用OLAP和数据挖掘技术,通过分析数据仓库中的数据,对多维数据集进行构建,从多层次、多角度对HIS数据仓库门诊部和住院部信息进行OLAP数据挖掘和分析,并调用PiovitTable进行了分析结果的展示。同时,提出了对关联规则挖掘算法的一种改进,并且给出具体算法实现,该方法提高了实际应用中关联规则挖掘的效率。具体来说,本文做了以下工作:通过对源数据库中的数据进行大量数据分析和数据预处理工作,提取出构建数据仓库的主题,提出了基于HIS的数据仓库的模型。提出了使用Microsoft SQL Server 2000 Analysis Services进行OLAP与数据挖掘,并对数据仓库数据创建多维数据集,运用OLAP技术进行多维数据分析和数据挖掘。研究和探讨了关联规则挖掘算法Apriori算法,以及其运用于数据挖掘中,提高算法运行效率的几种方法。并且研究利用Apriori算法,提出了一种有效的改进方法,对现有的关联规则挖掘算法进行了改进和扩展。

许宏[2]2004年在《基于数据仓库的决策支持系统研究》文中进行了进一步梳理随着计算机在管理中的应用,大量的数据可以被充分的利用,辅助管理和决策。20世纪80年代,在管理信息系统的基础上,发展了决策支持系统。决策支持系统的基础是大量被良好管理的数据。为了管理好这些数据,产生和发展了数据仓库系统,它是数据库技术发展及应用驱动的结果。数据仓库提供了一个数据平台,在此基础上可以进行强有力的数据分析、数据挖掘和报表,从而支持决策。数据仓库技术从提出开始,就受到学术界、工业界和用户的重视。虽然各公司陆续推出了数据仓库产品,对于数据仓库的研究方兴未艾,国内的 研究还有很大的空白有待填补,特别是灵活的数据仓库解决方案还需要研究探索。建立数据仓库系统,最关键的问题是数据的组织问题。在数据仓库中,数据处于中心位置,围绕数据建立多种分析和应用,不同于传统数据库中以应用为中心收集和组织数据。论文讨论了数据建模的过程。数据仓库建模包括收集需求、需求分析、系统的规划、概念设计、逻辑设计、物理设计等。针对数据仓库的特点,需要动态的数据仓库开发过程,支持用户需求的调整与追加。本论文实现了动态数据仓库的建模过程,以用户的需求为驱动,支持用户需求的变化与调整,从系统的逻辑设计到物理设计,每一步骤都有相应的中间结果文件生成,方便用户对设计结果的掌握,同时,具有良好的交互性和简单友好的操作界面。本文讨论了数仓库建模的详细过程和技术。首先是数据仓库的概念、体系结构及开发过程,以及基于数据仓库的数据挖掘和联机分析处理理论,着重论述数据仓库技术在决策支持系统(DSS)中的应用。当前数据仓库支持技术的重点是OLAP,OLAP分析是基于多维模型。本文在研究了多维建模的基本原理和基本方法的基础上,针对企业决策过程的迫切需要,建立了多个OLAP模型。这些模型虽然不能涵盖企业的所有决策需求,但是它们一方面满足了企业最迫切的一部分需求,一方面也可作为进一步建立更多的OLAP模型的重要参考。

张佳民[3]2008年在《基于数据仓库体系结构的OLAP和数据挖掘技术的研究与应用》文中提出近年来,数据仓库系统在电信业、银行业、零售业、政府机关等都有广泛的应用。数据仓库系统数据量迅速增长和对数据仓库系统需求的发展,对当代数据仓库系统有了新的要求,因此对数据仓库系统及其相关技术的研究有着重要的现实意义。本文通过对实现数据仓库系统的数据仓库、OLAP、数据挖掘叁方面技术进行研究,最后以某市公安信息系统为例,设计实现了公安数据仓库系统。在数据仓库设计技术方面,主要包括实时数据仓库架构的设计和维护数据仓库中缓慢变化维的代理键的研究。实验表明:基于系统数据日志的实时ETL算法和混合型实时数据仓库架构,实现了实时数据仓库与业务系统数据零延时的要求;在数据仓库中,代理键自增序列算法的使用,除了可以维护缓慢变化维,还可以极大的缩减数据仓库的存储容量。在OLAP研究方面,主要研究了OLAP的实现技术与数据存储技术,提出了MOLAP基于Cuboid的数据立方体压缩存储算法,和基于该存储结构的解压缩算法和语义查询算法。实验表明:该算法在压缩稀疏数据的同时,改进了以往多维数组压缩算法对非稀疏数据的敏感性,解决了索引维信息冗余问题。在数据挖掘研究方面,介绍了数据挖掘在数据仓库中的应用,提出最大模糊后验假设,对朴素贝叶斯分类算法进行改进,并与OLAP结合,设计了基于数据立方体的改进朴素贝叶斯分类算法,实验通过对模糊系数的调整,明显提高了朴素贝叶斯分类算法的准确率。在公安数据仓库系统设计方面,结合了公安现有的信息管理系统、全国刑侦联查系统数据接口,设计实现了行政治安和全国刑事侦查两个数据集市组成的实时数据仓库系统。

陶维成[4]2005年在《基于数据仓库与数据挖掘的营销决策支持系统》文中研究指明随着经济全球化和市场经济日渐成熟,企业间的竞争也日趋激烈,迫使企业不断地改进管理手段,提高生产经营决策质量,以提升市场竞争力!信息技术的深入发展,传统的管理信息系统(MIS)难以满足企业对日益增长的海量数据分析处理要求,于是决策支持系统(DSS)便应运而生了。本文根据某啤酒企业销售公司的实际需求情况,结合国内外最新研究动态,提出了以数据仓库(DW)、数据挖掘(DM)、OLAP等技术来构建营销决策支持系统(MDSS)。应用这些技术设计开发决的策支持系统,弥补已有的MIS系统对企业高层管理决策支持能力的不足,提高企业营销决策分析能力。围绕营销决策支持系统的实际应用课题,本文主要完成的研究工作有:①以某啤酒企业销售公司的MDSS研究与开发为目标,对研发过程中所需要的基本理论、方法、算法等进行了深入的比较与研究,解决了系统设计、开发、实施所需要的核心技术。②研究分析了数据挖掘、数据仓库、决策支持系统叁者的关系,提出了适合于该企业MDSS的合理解决方案。③对数据挖掘中的关联规则、决策树方法进行了研究。将优化后的Apriori算法和改进后的ID3算法应用于MDSS中。④设计了MDSS中的数据仓库模型,并将MIS中的源数据经过清洗转换后导入SDW数据仓库中。在数据仓库基础上,使用Microsoft SQL Server2000 Analysis Services创建了所需要的多维数据集,如销售多维数据集,从而全面系统地进行了OLAP数据分析与挖掘。⑤提出了MDSS的架构模式。设计开发了MDSS的前端展示应用程序,采用面向对象和软件工程的思想进行研究与开发,使应用程序具有一定的可扩展性、可维护性及易用性。采用Visual Studio .NET 2003为开发工具,使用C#语言,并利用Web Services技术有效地将后台处理与前台应用分离开来,为分布式应用作了有益地尝试。

李天霞[5]2008年在《数据仓库的设计与数据预处理技术的实现》文中进行了进一步梳理数据挖掘技术与数据仓库技术的产生与发展为人们从海量数据中获取有价值的信息和知识提供了有效的平台。随着“商业智能”、“决策支持”相关产品的市场需求和社会需求不断推进,数据挖掘理论的研究、数据挖掘和数据仓库技术的应用、智能数据挖掘工具的开发与完善已成为信息科学学术界的热点问题。本文主要研究目标是数据挖掘理论的研究、数据挖掘和数据仓库技术的实际应用、智能数据挖掘工具的探索与开发,以及数据挖掘中数据预处理技术的研究与实现。本文结合档案数据仓库的设计过程阐述了数据挖掘和数据仓库技术的实际应用;系统的描述了基于插件技术的智能数据挖掘系统研究与设计,重点描述了数据预处理子系统的节点设计和插件实现过程。

盛晓忠[6]2006年在《基于Web的OLAP可视化方法研究》文中提出OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。在数据仓库应用中,OLAP应用一般是数据仓库应用的前端工具。NET是Microsoft的XML Web服务平台。XML Web服务能使应用程序在Internet上跨操作系统和编程语言传输和共享数据。OLAP技术和.NET技术的结合可以构建一个基于互联网的联机分析服务。本论文就如何实现一个基于WEB的OLAP前端展示系统即基于WEB的OLAP的可视化进行研究。该项目的任务是设计出一个B/S结构的可以对多维数据集进行切片、切块、钻取、旋转等多维分析的前端展示系统。本论文首先阐述了数据仓库、联机分析处理的发展现状和关键技术等。其次从系统的通用性和实用性入手,对该系统的系统结构和系统部署进行了设计。对系统所采用的分析平台和开发环境进行了分析。给出了系统中数据的封装方案。重点对数据的表现形式进行了设计,讨论了多维网格的表现形式,提出了以树状饼图和Tree Map结构展示多维图表。最后对系统的应用效果进行了展示。目前,系统调试试验已取得了较理想的结果,充分证明了该系统的正确性和可行性。

马治国[7]2008年在《基于工作仓库的OLAM技术在决策支持系统中的研究与应用》文中研究指明随着信息技术的不断进步,企业内部产生了越来越多的数据。快速增长的海量数据收集存放在大型和大量的数据库中,没有强有力的工具,理解它们已经远远超出了人的能力。基于数据仓库的联机分析挖掘(On-Line Analytical Mining,OLAM)技术越来越多的被引入到现代企业的决策支持系统中,为企业决策者提供方便快捷的决策支持。然而,OLAM中数据统计分析和数据挖掘所需的数据基础通常是多样的,对数据处理的准确性和效率要求比较高,传统的OLAM中产生的大量多维数据集使得数据挖掘的功能受到限制,挖掘算法效率低下。针对上述问题,本文主要做了以下工作:对数据仓库环境下的决策支持系统进行了深入分析,设计了一种基于工作仓库和多维关联规则挖掘的OLAM系统框架,并对框架的各部分功能及关键技术进行了说明。给出了整个系统的运行流程,并分析了它的主要特点。分析了当前数据仓库环境下的联机分析挖掘存在的瓶颈和缺陷。阐述了工作仓库的设计要点,运用数据缓存技术对一些频繁使用的数据集进行了处理,以达到及时获取数据和减少对数据服务器I/O操作的目的。本文提出了一种新的数据缓存算法,保证了工作仓库中数据的有效性和高可靠性,提高了工作仓库缓存池中数据的命中率。针对传统OLAM系统中数据挖掘的维度单一和低效的缺点,设计了一种多维关联规则挖掘模型,提出了一种未剪枝的Apriori多维关联规则挖掘算法。通过增益指标评定标准,推导出了用户感兴趣的强关联规则,提高了挖掘结果的准确性和多样性。本文研究成果已初步应用于某海事局船务决策支持系统中。应用结果表明,海量船务数据分析统计的时间大大缩减,分析结果的准确性得到了明显提高,为管理层决策提供了强有力的支持。

邢国麟[8]2007年在《轧机电气设备故障诊断中数据挖掘技术的研究》文中认为随着现代科学技术的迅猛发展,钢铁加工业生产系统正朝着大型化、复杂化、系统化和自动化的方向加速发展。这些发展都对承担着繁重生产任务的轧机电气设备的安全可靠性提出了更高、更严格的要求。由于长时间不间断运行,轧机电气设备存在着很大的故障隐患,由此而导致停产,损失往往是巨大的。所以近年来,轧机电气设备的故障诊断逐渐受到人们的重视。首先,在深入学习轧机电气设备故障诊断理论的基础上,以带动轧机运转的主要电气设备——主电机为故障诊断对象,对其结构、故障类型和常用的检测技术进行了研究。分析了现有棒材生产线在线检测控制系统存在的问题,创新性地提出将基于关联规则的OLAM挖掘技术引入轧机电气设备故障诊断领域,以期望发现大量监测数据背后所隐藏的对故障诊断有积极指导意义的信息,从而提高设备安全性和经济效益。其次,研究了数据仓库技术、联机分析处理技术、数据挖掘技术和联机分析挖掘理论,并对数据挖掘中关联规则挖掘的理论和算法进行了深入的学习,选取了适宜的关联规则挖掘算法,使其与数据立方体相结合,构建了基于关联规则的OLAM挖掘模型,并结合轧机主要电气设备——电机的故障诊断对模型组成进行了研究。最后,以钢铁公司为例,鉴于监测系统中存储了大量的电机测量数据,应用基于关联规则的故障诊断方法,在Windows XP操作平台下,使用Microsoft SQL Server 2005,建立了OLAM挖掘模型。利用选取的电机数据集对提出的模型进行了训练和考核。结果表明,基于关联规则的OLAM挖掘模型产生的规则,能够为故障诊断提供辅助决策。

王骏强[9]2008年在《基于OLAM的进销存决策支持系统的设计与实现》文中研究表明决策支持系统(Decision Support System,DSS)是一种帮助中高层管理人员进行决策的计算机系统,这种系统综合运用了信息论、人工智能、信息经济学、管理科学、行为科学等学科的理论、方法和技术。随着联机分析挖掘(On-lineAnalytical Mining,OLAM)概念的提出和技术的成熟,OLAM成为了新的决策支持系统的主要分析工具之一,它以数据仓库(Data Warehouse,DW)为基础,无缝集成了联机分析处理(On-line Analytical Process,OLAP)和数据挖掘(DataMining,DM)技术,具有两者的优势,因此有较大的研究与应用价值。本文阐述了基于OLAM的进销存决策支持系统的设计思路,着重利用SQLServer 2005在多种技术无缝集成方面的优势,对整个系统进行了具体的搭建、设计和实施。本文主要工作包括:(1)分析了联机分析挖掘技术在当前国内外研究的背景现状,提出在进销存数据仓库系统中运用联机分析挖掘技术作为辅助决策的构想。(2)对进销存决策支持系统进行总体设计,包括:进销存决策支持系统的需求分析,基于OLAM技术的进销存决策支持系统的系统设计和功能设计。(3)依据具体的进销存数据,通过概念模型、逻辑模型和物理模型的设计建立所需的数据仓库,并对数据仓库实施的关键技术进行了研究。(4)建立了进销存决策支持系统的开发环境,针对进销存数据仓库建立相应的OLAP多维数据集,设置维度、层次和度量值;搭建Web Service平台,用Visual Basic.net语言编程提供接口,建立ASP.net Web服务并调用Web Service接口和Office Web Component组件,通过JavaScript调用Web服务来实现多维数据立方体的前台展现,对进销存系统数据集进行了挖掘结构和挖掘模型的设计,采用聚类挖掘算法进行分析以辅助决策,实现了数据报表的Web发布。论文进行了进销存数据仓库底层构架的设计,实现了进销存决策支持系统的OLAM功能。系统可提供进销存多维数据立方体的查询,还可以通过挖掘算法进行挖掘分析以辅助决策。

钟足峰[10]2007年在《联网收费系统数据分析与挖掘的理论和实现》文中研究表明随着我国高速公路的快速发展,越来越多的联网收费系统已经建立起来。通过联网收费系统可以获取大量的交通数据,然而用传统方法处理这些数据既费时又费力,在这些大量的未分析或待分析的数据中有可能隐藏着许多有用的信息,数据挖掘旨在从大量数据中发现这些有价值的信息。数据挖掘技术在商业领域中己广泛使用,然而在交通领域的应用却极少。本文针对莞深高速公司的具体情况,在.Net框架下结合使用了数据预处理、OLAP、数据仓库、数据挖掘等技术,实现收费数据分析系统。本文通过对数据挖掘系统中数据预处理技术的学习,并参考国内外数据挖掘系统在数据预处理方面的处理过程,设计了一个能在一定程度上满足需要的数据预处理系统。本文所阐述的过滤异常值、去掉重复记录方法比较通用,能把数据挖掘前需要准备的数据进行一定程度的和必要的清洗、转换,在一定程度上提高了数据挖掘的质量和效率。本文以数据仓库及其相关技术为出发点,主要致力于研究联网收费系统中的决策支持,制定适合于收费数据分析方案。数据仓库是实现数据分析支持的基础,在数据分析的实现上,作者通过两种途径来实现,即统计分析和数据挖掘,这两者是数据分析的逐步深入。作者利用先进的技术实现了统计分析功能,即数据转换、数据集市的建立和OLAP(联机分析处理)展示。在对系统中数据挖掘技术的研究上,作者综合考虑了分析工作的需求,选用了几种分类算法。系统能够多角度分析展示大量的离线历史数据和在线实时数据,还可以对采集到的数据进行挖掘和分析,并在企业局域网上实现信息共享,供企业各层管理人员监控、查询和进行综合分析,以便有效地进行决策。该系统能够有效地帮助企业高层管理人员对各种相关数据进行分析和预测。本文以实际工程为主线,以实际收费数据为研究对象,对上述各项技术进行探讨。经过实际生产的检验,证明该系统是提高管理信息化的有益尝试。论文结束时还对该技术的发展趋势和前景进行了讨论。

参考文献:

[1]. 基于HIS数据仓库的构建及数据挖掘的研究与应用[D]. 程扬. 新疆大学. 2006

[2]. 基于数据仓库的决策支持系统研究[D]. 许宏. 南京工业大学. 2004

[3]. 基于数据仓库体系结构的OLAP和数据挖掘技术的研究与应用[D]. 张佳民. 吉林大学. 2008

[4]. 基于数据仓库与数据挖掘的营销决策支持系统[D]. 陶维成. 重庆大学. 2005

[5]. 数据仓库的设计与数据预处理技术的实现[D]. 李天霞. 吉林大学. 2008

[6]. 基于Web的OLAP可视化方法研究[D]. 盛晓忠. 南京理工大学. 2006

[7]. 基于工作仓库的OLAM技术在决策支持系统中的研究与应用[D]. 马治国. 南京航空航天大学. 2008

[8]. 轧机电气设备故障诊断中数据挖掘技术的研究[D]. 邢国麟. 河北工业大学. 2007

[9]. 基于OLAM的进销存决策支持系统的设计与实现[D]. 王骏强. 武汉理工大学. 2008

[10]. 联网收费系统数据分析与挖掘的理论和实现[D]. 钟足峰. 长沙理工大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

决策支持系统中的数据挖掘与OLAP——数据仓库环境下的信息分析
下载Doc文档

猜你喜欢