王军[1]2007年在《数据仓库技术在商业智能系统中的应用》文中进行了进一步梳理当今世界已进入全面知识管理时代,信息量的急剧增加使得企业的决策过程日益复杂。新兴的商业智能技术为企业提供了新的选择,越来越多的管理者开始借助商业智能技术为企业寻求解决之道。虽然当前商业智能的研究与应用正处于从起步阶段向发展阶段过渡的转变时期,其理论研究与系统应用已成为目前国内外企业界和软件开发界广泛关注的热点问题。商业智能是对商业信息的搜集、管理和分析过程,目的是使企业各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策。商业智能一般由数据仓库、数据分析、数据挖掘、在线分析、数据备份和恢复等部分组成。目前对于商业智能的开发还没有一套系统的研究,本文从这些出发对该系统作较为全面的研究,并在项目实践过程中对其中的经验进行总结,对其中的重要问题提供相应的对策。本文在第一章主要介绍了商业智能的产生以及体系结构,开发及实施过程以及商业智能的应用。第二章和第三章分别介绍了商业智能系统实现的技术基础:数据仓库和商业智能。在第二章重点对数据仓库产生的背景、数据仓库的体系结构、ETL、OLAP等技术做了深入研究;对数据仓库、数据集市、数据库做了比较分析;对数据仓库的实现策略、开发流程、实施特点进行研究,同时比较分析了常用的数据仓库工具以及数据仓库的新技术。这些为后面的系统实现奠定了基础。第四章和第五章主要介绍了系统的设计、实现。重要的是对系统实现过程中的经验作了总结,为以后系统的开发提供了重要的参考。
袁武[2]2000年在《一个数据分析工具》文中指出技术革命和社会发展相互推动的自然辩证法则在数据库应用技术的发展和企业生存竞争的关系中得到了淋漓尽致的体现。OLTP技术推动了企业信息化进程,而企业的发展又要求信息处理技术从操作型处理进入到分析型处理。数据仓库理论和技术与OLAP分析的结合,为建立企业辅助决策支持系统创造了广阔的前景。 本文具有很强的实践背景。全文可分为两部分:理论部分和实践部分。 在理论部分,本文介绍了数据仓库和OLAP的一些基本概念,阐述了OLAP和OLTP之间的不同点;并引入了多维数据库模型,力图建立多维数据库模型之间的转化处理规则,从而建立具有全局一致性的多维数据库模型。 在实践部分,本文主要介绍了中国税收征管信息系统(CTAIS)数据分析系统的设计与实现。CTAIS数据分析系统采用了ODS作为主题数据的数据存储机制;数据表现机制的实现采用了工具化策略。
邓文俊, 曹阳波, 刘英群, 程建钢[3]2014年在《基于教务管理系统的数据分析工具的研究与设计》文中研究说明基于大数据的学习分析受到越来越多的关注,但能够直接用于教育教学实践的分析技术和工具则非常有限。随着教育信息化发展,高校普遍应用了综合教务管理系统,积累了大量的数据。该文收集并分析了教学管理者最迫切的数据分析需求,选择了常用的数据分析方法,设计并实现了一个基于教务管理系统的数据分析工具系统。该系统由统计分析工具集、数据计算方法模块、分析结果可视化模块三个部分组成,其中统计分析工具集包含学生、教师、师生比、教师工作量和成绩分析等方面的七个常用工具。应用该系统对某高校教务管理系统中16年的数据进行分析,结果验证了数据分析工具对于教务管理者的决策支持价值,体现了嵌入教学系统的数据分析工具的优势。
徐珊[4]2008年在《数据仓库在江西省公安厅综合信息分析系统中的应用》文中进行了进一步梳理我国公安机关担负着打击犯罪、维护治安、管理服务社会等多方面的任务,公安信息化涉及面广、业务复杂、数据量巨大,特别是随着“金盾工程”的全面实施,公安工作信息化建设得到了飞速的发展,由此而产生了大量的公安业务数据。采用数据仓库技术,建设一个综合的、历史的、面向决策支持的公安业务综合信息分析系统,满足数据查询、分析和数据挖掘的需求,已成为公安业务信息化的一个重要环节。本文首先从决策支持和数据仓库的概念入手,分别介绍了决策支持和数据仓库的概念、数据仓库ETL过程、联机分析处理相关概念和方法、数据挖掘技术以及现有数据仓库解决方案,重点研究了基于数据仓库技术的公安综合信息分析系统的设计与实现方法。本系统选取CCIC全国犯罪信息数据库中的“在逃人员历史库”等五个业务数据库作为研究对象,采用IBM的整套商业智能解决方案(数据仓库采用DB2 UDB DATAWAREHOUSE STANDARD EDITION,olap数据库采用DB2OLAP SERVER STANDARD EDITION,前端展现工具采用Hyperion)。在设计实现部分,本文重点阐述了数据仓库系统的安装配置过程、数据抽取、转换和装载的实现过程、多维模型建立过程、前端分析工具的使用过程。在本文的最后还列举了应用此系统得到的一些相关分析结果以及系统后期的发展方向。本文为充分利用现有公安信息资源,深入挖掘目前已建成的应用数据库的信息,获得深层次的、有价值的增值信息探索出一条可行之路。本文的研究成果对今后公安系统的数据仓库建设和数据挖掘技术的应用具有一定的指导意义。
刘方亚[5]2007年在《数据仓库在江西烟草数据中心系统中的应用》文中研究指明决策支持系统的研究与开发方兴未艾,对决策所需大量数据的管理仍是其中的一个瓶颈问题,尚未得到有效的解决。本文应用90年代兴起的数据仓库技术作为决策支持系统中数据管理的解决方案,对决策支持系统与数据仓库技术有效的结合方面进行了深入的研究。并在此基础上,以江西烟草数据中心系统建设为背景,设计并实现了基于数据仓库的江西烟草数据中心系统。本文的主要研究工作和成果是:1)数据仓库的体系结构和相关技术进行了研究、分析;2)重点分析了数据的抽取、清洗和转换技术;3)分析了数据仓库的重要应用联机分析处理的功能和实现中的相关技术和方法;4)设计并实现了一个基于数据仓库的江西烟草数据中心系统。
曾兴东[6]2018年在《用户用电行为挖掘系统设计与实现》文中指出随着电力体制的改革,人们对电网公司提供的售电服务要求的提高,原来单一、粗犷式的服务模式难以应对更加个性化、精细化的服务需求。在数据驱动业务的今天,通过充分利用公司的数据资源,分析客户的需要,提供个性化的优质服务,从而增加客户满意度,对电网公司的进一步发展具有较大的意义。在国家电网的建设中,积累了海量的电网数据,因此,国家电网公司希望充分利用这些数据,通过大数据的分析手段开展电力客户用电分析,进而制定有针对性的客户.服务策略。在此背景下,国家863电网大数据项目正式启动,用户用电行为挖掘系统就是在相关863电网大数据项目的支持下设计与研发的。本课题旨在设计和实现电网用户侧用电大数据的数据分析系统。应用数据挖掘以及大数据手段,从用户用电行为归类、行为演进分析以及用电行为异常分析等角度入手,开展对用户用电行为分析的系统挖掘。相较于以前的电网数据处理平台,本文设计的系统具有处理大数据的能力,拥有友好的访问界面,更重要的是本文研究用户用电行为演进过程,具有分析用电行为趋势、发现用电异常行为的功能。本文首先查阅文献调研了相关的技术,明确了系统的技术可行性。然后按照软件工程的要求对系统进行了需求分析。关键技术方面,本文首先对原始的电网数据进行了预处理,并提出了基于BIC模型评估的后向选择算法,此模型选择算法在降低模型复杂度的同时还提高了模型准确率。在对处理后的数据进行用户用电行为分析过程中,演进聚类算法存在聚类质量变差的情况,为此本文提出了一种改进的演进聚类算法。上述关键问题的解决方法得到了相关学术期刊以及会议的认可。关键技术的解决为系统的搭建清除了障碍,本文围绕关键技术进行了系统的总体设计和详细设计,并搭建起了功能比较完善的用户用电行为挖掘系统,然后设计并实现了用户友好的可视化界面。通过一系列的测试,本文实现了需求设计要求的所有功能。最后,本文对完成的系统进行了总结,并提出了不足之处以及改善的方向。
杨京, 王效岳, 白如江, 祝娜[7]2015年在《大数据背景下数据科学分析工具现状及发展趋势》文中研究表明文章根据大数据时代的特征,分析了海量数据给数据科学分析工具带来的主要挑战,介绍了为应对挑战而发展的大数据分析工具,并对比分析了R语言、Rapid Miner、Mahout三种数据科学中比较流行的大数据分析工具,发现R语言和Rapid Miner功能全面,而Mahout具有突出的大数据分析能力,最后指出了数据科学分析工具的发展趋势。
金骏时[8]2017年在《可协同数据分析系统的设计与实现》文中研究表明随着互联网产业的快速更迭与发展,人们在日常使用网络时产生了非常庞大的网络数据,随之出现的问题是,传统的数据分析系统已经无法有效地对如此庞大并且数据类型多种多样的数据进行有效的分析处理,为上层提供服务。现在需要将数量庞大、种类繁多、位于公司内不同部门和系统的数据结合在一起进行处理分析,将这些数据转化为有价值的信息。这些信息可为公司的上层决策和管理提供有效的参考意见。但在传统的数据分析系统中,随着数据量的增多、格式种类的繁杂,原有的数据分析系统已经不能满足公司的正常需求。大部分传统的数据分析均是以单个数据分析工具为入口,对已知线索进行分析,然后通过其他工具对分析结果进行扩展分析推理的过程需要业务人员有一定的工作经验,而且大部分需要进行重复操作,另外还需要借助其他办公软件对所有分析结果进行汇总和梳理,无法实时还原业务分析思路的概貌,不利于工作成果的迅速扩展和分享。针对以上问题本文设计并实现了一个可协同的数据分析系统,论文的主要工作分为以下几个方面:1.全面分析可协同数据分析系统的需求,为系统的设计与实现奠定坚实的基础。2.给出了可协同数据分析系统的详细设计方案,包括系统模块的设计以及统数据库的设计。3.完成了系统主要功能的实现以及测试工作,验证了系统的正确性。利用本文系统,一个完整的数据分析流程是这样的:首先,数据分析小组组长以思维导图的形式直观地展示他对数据分析任务的理解和分工,并通过共享思维导图,将该任务分工传达给小组成员;每个小组成员通过调用系统提供的各种数据分析工具独立完成数据分析子任务,然后编辑思维导图的子任务结点对子任务的结果进行展示。在这个过程中,组长可以随时查看思维导图,了解任务进展情况。目前,本文系统已经在作者所在实习公司得到应用,有效地提升了数据分析小组的沟通效率和执行效率。
姚恒[9]2018年在《基于机器学习方法预测拟南芥功能关联互作组和基于网络驱动的组学数据分析系统》文中认为理解生物生理过程背后的生物学逻辑是生物学研究中一个重要的目标,这样的研究有助于加深我们对生物表型背后生物学机制的了解,进而为我们预测与干预生物表型提供新的研究方向。构建一个质高质量的功能关联网络将有助于实现这一目标。在本研究中,以拟南芥的分子功能相互作用组为背景,我们构建了新一代的拟南芥预测相互作用组资源(predicted Arabidopsis interactome resource,PAIR)这一功能关联网络。随后实现了基于该网络的新一代组学数据分析方法——基因集关联分析(gene set linkage analysis,GSLA)。新一代的 PAIR v5.0 通过整合多种形式的功能关联证据,利用机器学习算法预测了一共335301对拟南芥的基因功能关联。随后,通过与现存的被广泛使用的一系列其他类功能关联网络的对比,我们定量地评估了 PAIRv5.0作为一个功能关联网络的统计学特性。以此网络作为驱动,新一代的GSLA得以对观测到的组学数据变化展开有效的分析。组学数据的变化一般反映在从组学变化中提出的差异表达基因(differential expressed genes,DEGs)上。利用GSLA,生物学研究者可以对这些差异表达基因展开分析,以阐释这些差异表达信息所代表的生物学过程对生物个体施加了怎样的功能影响。GSLA利用现存的生物学概念来分析观测到的组学数据变化。与传统方法不同的是,GSLA不仅通过这些生物学概念来描述组学数据本身,还通过功能关联网络来来拓展我们对于组学数据的认知。该特性使得研究者能通过GSLA形成对组学数据更高层次的理解,找到有助于进一步研究的新线索与新方向。在本论文中,我们利用GSLA展开了对拟南芥种子发育过程中光响应与植物激素响应的研究,并在这两个研究案例种通过比较GSLA与一系列被广泛使用的组学数据分析工具,定量地评估了 GSLA在分析组学数据中所展现出的独特能力,展现了 GSLA如何帮助研究者将宏观的表型变化与微观的分子机制联系在一起,从而更加综合以及系统地理解这些变化对生物体施加的功能影响。最后,我们开发了 PAIR v5.0与GSLA的在线资源,方便他研究者更广泛地使用这一组学数据分析系统。本研究中所涉及到的所有数据与分析工具,均可通http://public.synergylab.cn/pair 来访问。
刘延珍[10]2009年在《仿真数据智能化分析方法及工具研究》文中研究指明仿真数据智能化分析方法是为模型验证服务的,是系统仿真领域研究的重点问题。仿真数据智能化分析是采用基于专家系统的方法,综合利用仿真领域相关知识、各类数据分析方法和技术对仿真数据进行分析。本文对仿真数据智能化分析方法及工具进行了深入的研究,为仿真数据分析存在的难点提供了解决方案。首先,阐述了课题的背景和目的,分析了仿真数据分析工作中存在的难点。分析了仿真数据分析方法、工具及智能化分析方法的国内外研究现状,并给出了本文的研究内容。第二,归纳了基本的仿真数据分析方法,主要包括静态数据分析方法和动态数据分析方法。其中对于静态数据分析方法,重点围绕区间估计法和假设检验法展开。从时域分析和频域分析的角度阐述了动态数据分析方法。设计了仿真数据智能化分析框架,并简要说明了框架中的各个组件。第三,对仿真数据智能化分析的关键技术进行了深入研究,给出了各种情况下的静态数据预处理方法及动态数据预处理方法,设计了六个数据分析流程,给出了它们的具体步骤,接着讨论了定性定量评价意见的统一、权重分配及综合方法,并应用这些方法进行了仿真数据智能化分析。第四,利用“面向对象—规则”混合知识表示方法设计了仿真数据智能化分析知识库,主要包括:数据分析方法、数据分析规则及专家知识的表示,在此基础上研究了推理机制。第五,在上述理论研究的基础上,对仿真数据智能化分析工具进行了设计和实现。设计了该工具的总体结构,对其中的关键模块进行了简要说明并给出了实现方法和关键技术。实现了仿真数据智能化工具,通过应用说明了该工具的有效性。最后,对本文的研究工作进行总结,提出了下一步的工作方向。
参考文献:
[1]. 数据仓库技术在商业智能系统中的应用[D]. 王军. 华东师范大学. 2007
[2]. 一个数据分析工具[D]. 袁武. 中国科学院研究生院(计算技术研究所). 2000
[3]. 基于教务管理系统的数据分析工具的研究与设计[J]. 邓文俊, 曹阳波, 刘英群, 程建钢. 中国电化教育. 2014
[4]. 数据仓库在江西省公安厅综合信息分析系统中的应用[D]. 徐珊. 南昌大学. 2008
[5]. 数据仓库在江西烟草数据中心系统中的应用[D]. 刘方亚. 南昌大学. 2007
[6]. 用户用电行为挖掘系统设计与实现[D]. 曾兴东. 北京邮电大学. 2018
[7]. 大数据背景下数据科学分析工具现状及发展趋势[J]. 杨京, 王效岳, 白如江, 祝娜. 情报理论与实践. 2015
[8]. 可协同数据分析系统的设计与实现[D]. 金骏时. 扬州大学. 2017
[9]. 基于机器学习方法预测拟南芥功能关联互作组和基于网络驱动的组学数据分析系统[D]. 姚恒. 浙江大学. 2018
[10]. 仿真数据智能化分析方法及工具研究[D]. 刘延珍. 哈尔滨工业大学. 2009
标签:计算机软件及计算机应用论文; 大数据论文; 数据分析论文; 数据仓库论文; 用户行为分析论文; 数据与信息论文; 系统仿真论文; 用户研究论文; 智能化技术论文; 功能分析论文; 网络行为论文; 商业智能论文;