麦永浩[1]2000年在《数据仓库和数据挖掘方法研究及其在公安信息建设中的应用》文中研究说明本文根据国内外数据挖掘和数据仓库技术的发展和公安信息的特点,以省级公安综合管理信息系统和其数据仓库的建设为应用背景,运用动态规划方法为工具,对数据仓库和数据挖掘中的若干问题提出了一些优化方法。本文的主要工作如下:1、根据省级公安综合管理信息系统和公安数据仓库与数据挖掘的特点,本文作者提出了公安数据仓库的模型、公安数据挖掘一般方法的模型、以及基于公安数据仓库的公安数据挖掘一般方法的模型。从横向和纵向两个方面介绍了省级公安综合管理信息系统和其数据仓库结构和功能,说明了将这三者结合进行研究的重要意义和主要手段。2、对于优化公安数据仓库的计算机网络资源配置问题,本文作者将静态规划问题转化为动态规划问题,以避免非线形规划和计算的复杂性;对于公安数据仓库的计算机局域网络信息资源和广域网络信息资源的二维的资源分配问题,利用拉格朗日乘数法,将其降低维数,以降低计算的复杂性。同时,对于在公安数据仓库的智能化集成和数据挖掘中的数据关联问题,为了避免复杂的分析过程,本文作者利用动态规划方法进行分析:其关联是偶然的,还是必然的,关联的程度如何,从而得到一些简单易行的优化策略。3、在公安数据仓库的建立过程中,需要从各个不同的应用系统中集成数据,本文作者通过利用动态规划方法进行分析,对数据载入进行优化,对数据处理进行最优调度,得到总的期望报酬最大。同时,在网络环境中,公安数据仓库管理和存储的数据海量增加,本文作者利用存储区域网络SAN(Storage Area Network)来解决这个问题并利用动态规划方法进行优化配置,以满足随机需求。4、针对在公安数据仓库的使用中,经常遇到数据陈旧或部分残缺,需要更新的问题,本文作者利用动态规划方法对公安数据仓库的及其数据更新策略优化。同时,公安数据仓库信息智能集成经常要涉及到某两个节点之间是否有路径存在,寻找任意两节点间最小代价的路径的问题,本文作者利用一种较为特殊的动态规划方法------传递闭包算法来优化,得到一种收敛较快、适应广泛而又简单易行的优化方法。5、公安数据仓库的数据集成的两个重要方面是公安数据仓库信息源的供给策略研
吴宝伟[2]2014年在《社保资金支付大数据决策支持平台的研究与实现》文中研究指明随着财政部门对财政科学化、精细化的管理要求越来越高,同时财政专项资金的支付也面临一系列的挑战。传统的基于操作型数据库的信息管理系统在财政管理的领域中获得了广泛应用,但是大数据时代的到来也给这些系统带来了许多待解决的问题。数据仓库技术作为决策支持系统的基础,当前在社保业务管理领域中应用范围还不是很广泛,本文依据扬州市财政管理部门对于社保资金支付决策支持的需求,再充分借鉴以及吸收了现有的决策支持系统在理论和实践方面的研究成果,制出定了扬州市社保专项资金支付大数据决策支持系统的设计方案。构建社保资金支付大数据决策支持平台的目的是实现科学且全面、及时且准确的汇总分析社保数据,客观的反映社会保险业务的发展情况,客观的反映社保征缴与发放以及保险业务登记、审查等实际情况,从而更加有效地监控与预警,能够供决策参考。并且通过对社保数据的比较、审核、推送等智能处理,保障社保资金分析的正确性,同时也为各级管理人员提供多层次、多角度、多指标、全方位深度分析,并提供智能的统计图表,为管理者的决策过程提供支持。本文在对决策支持系统在国内外的发展情况以及系统开发的相关技术与方法的研究分析基础之上,结合了在社保资金支付应用中的特定用户需求,提出了构建社保资金支付决策系统的解决方案,包括系统的架构设计、系统模型设计、系统功能模块设计以及数据仓库设计等,并以社保违规查询为示例,设计完成了该决策支持系统中有关社保违规查询分析功能的实现程序,在文章的结尾处给出了具体实现的部分应用测试。本课题的研究解决了扬州市众多公共财政管理部门之间相关数据不能统一发布与共享,且无法做到对社保专项资金数据进行整体的分析以及无法实现依据数据进行决策的问题。目前,该系统已经完成开发并投入使用,我们将会及时收集用户的使用反馈,在用户体验上及时更新,同时时刻关注政府有关社保管理政策的变动,及时对系统进行维护调整。
秦秀洁[3]2014年在《数据挖掘在银行客户关系管理中的应用研究》文中认为银行客户关系管理在银行的管理经营过程中扮演者重要的角色,而数据挖掘作为客户关系管理中的重要技术,对银行客户关系管理的有效分析和实施起着决定性作用。目前对银行客户关系管理中数据挖掘技术的研究主要包括数据挖掘算法和数据挖掘流程,虽然多数的理论研究都利用数据挖掘算法来提炼出银行数据库中的潜在信息,但是这些算法在精准度和有效性等方面还有待改进,同样的,对数据挖掘实施流程的研究也仅限于传统的两种模型,没有更为科学的新方法的产生,本文将对这两方面的内容加以改进,提出数据挖掘改进算法和数据挖掘改进实施方法,并将其应用于银行客户关系管理中。针对数据挖掘算法,本文选取了银行客户细分中最常见的聚类分析方法进行研究,针对常见聚类分析方法的优缺点,提出了将层次聚类法和K-means聚类法相结合的改进算法,既解决了层次聚类法类间对象不能交换,算法伸缩性差的问题,又解决了K-means聚类法对初始聚类中心敏感的问题,使得聚类结果更加精确。同时,利用UCI数据库的测试数据对改进算法的测试也表明改进的聚类分析算法聚类效果更好。针对数据挖掘的实施流程,本文利用了传统数据挖掘方法SEMMA过程模型能够对数据准确分析的优点,将SEMMA方法嵌入到传统数据挖掘方法GRISP-DM过程模型中,既发挥了GRISP-DM方法能够全面概括业务分析过程的优势,同时也能将数据进行精细化的处理,使得数据挖掘过程更加合理和全面。另外,这一改进实施方法在客户流失预警方面的应用也被证实更为科学。客户细分是银行客户关系管理的重要内容,本文利用改进的数据挖掘算法和改进的数据挖掘实施流程模型,对某家银行机构的信用卡客户进行数据挖掘,得出五类差别化明显的客户群,针对不同客户群的特点,提出相对合理的银行信用卡营销策略建议,为银行客户关系管理和经营决策提供有力支撑。
于中辉[4]2007年在《犯罪分析系统的设计与实现》文中认为公安行业在社会的经济建设中起着保证社会稳定繁荣的重要任务,其业务范围涉及到包括刑事、交通、社会安全等社会的方方面面。如何及时地从纷繁芜杂地海量数据中获得有用信息及发现信息地规律性已成为公安行业提高办事效率地关键。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用以支持管理决策。数据仓库技术地应用将使得大量业务数据的深层次利用变得更为容易,也将大大提高公安各部门驾驭社会治安、严厉打击刑事犯罪的能力。本文以公安各种犯罪信息系统为背景,采用DB2数据库系统作为底层的存储系统,运用数据仓库相关技术,建立了一个犯罪规律分析系统。基于对犯罪规律的分析,确定了犯罪人构成规律、侵财型犯罪规律、杀伤型犯罪规律、性犯罪规律和经济犯罪规律五个主题。对每个主题都作了较细致的剖析,找出影响主题的相关因素,构建相应的数据仓库模型。在建立了犯罪规律数据模型的基础上,运用联机分析工具对这些信息从各种粒度和多维度进行分析,找出影响犯罪的各种因素及这些因素对犯罪发生的影响。本方案既能提供数字报表展示,还能提供强大的图形展示,可以对数字报表以柱状图、饼图、折线图等图形直观的展现给用户,还支持对关心的图形区域进一步细化展示的功能。本文的主要贡献在于,它采用了数据仓库技术,对公安系统的大量数据进行数据建模、数据挖掘,对各种犯罪规律进行深入的分析和验证,为公安机关打击犯罪提供科学的依据,改变了过去公安机关凭经验的做法,提高公安各部门驾驭社会治安、严厉打击刑事犯罪的能力。
佚名[5]2004年在《《计算机工程与应用》2004年(第40卷)总目次》文中进行了进一步梳理·博士论坛·城市突发公共卫生事件应急指挥系统空间数据模型设计———以“合肥地区非典防治决策支持系统”为例………………………李琦刘纯波李斌(1-1)计算机支持的协同工作(CSCW)发展述评………………宋海刚陈学广(1-7)拓扑关系形式化描述的基本问题与研究
栗然[6]2009年在《电力负荷分析与预测的分布式数据仓库和数据挖掘研究》文中研究说明准确的负荷预测对电力系统的规划与运行具有十分重要的意义,但是目前采用的各种负荷预测方法的准确度还不能完全满足系统的要求。目前电力负荷预测的研究多数只是对某个已有预测方法的改进和对新数学方法应用的探讨,对负荷的实际特性和气象因素的影响考虑不够,因此对预测精度的改进有限。目前研究中对气象因素的考虑很粗略,一般是在预测区域的广泛范围内采用同一气象条件,这对供电区域辽阔的大电网是明显不够的。本文根据电力系统运行管理的特点,将电网按地域进行网格划分,建立关于负荷及其影响因素的分层分布式数据仓库,并深入分析气象因素对电力负荷的影响,在此基础上研究基于数据挖掘技术的网格化负荷分析与预测方法,通过对负荷预测算法和预测策略的改进提高负荷预测的准确度。论文主要工作如下:提出了基于分布式数据仓库的网格化负荷与气象敏感度分析思想,并开发了相应的分析软件。通过将大电网按自然区域进行网格划分,构建面向负荷分析与预测主题的分布式数据仓库模型;引入四个综合气象指数详细分析各子网格对应的气象与负荷的相关度和敏感度;根据各地区的负荷气象灵敏度大小加权得出大电网的综合气象指数值,以此为基础预测下一年度负荷与气象指数敏感度变化曲线。提出了基于考虑属性-值对两次信息增益优化的改进决策树挖掘算法的日特征负荷预测方法。该方法用聚类分析和信息熵进行气象属性离散化,可以更客观地考虑气象条件与负荷的关系,将离散化的断点数控制在一个合理的数值;考虑属性-值对两次信息增益优化可以弥补ID3算法的不足,减小树的深度,提高查询速度和查询效率,最终达到提高日特征负荷预测准确率的目的。用负荷预测实例对所提方法进行了测试比较,证明了方法的有效性。提出了一种基于面向粗糙集默认规则挖掘算法的网格化短期负荷预测方法。该方法一方面可以减少因噪声的影响而产生的多余规则,缩小产生的分类规则集,提高规则产生和实际分类的效率;另一方面可以根据地域特点更具体地考虑子网格的气象因素和负荷特性,建立不同的网格负荷预测模型,提高大电网短期负荷预测精度。利用实例对区域网格化和非网格化两种负荷预测方法的预测结果进行了对比,验证了本文所提方法对提高负荷预测精度的有效性。
王勇[7]2005年在《时序数据挖掘技术及其在水质预测中的应用研究》文中指出时间序列数据挖掘是从大量的时间序列数据集中提取潜在的、有用的知识,据此预测时间序列的未来。本文结合导师“区域水环境监控及决策支持系统开发(广东省科技攻关项目)”和“流域水污染时滞大系统的建模与控制(国家自然科学基金项目)”的研究课题,进行了时序数据挖掘技术及其在水质预测中的应用研究。其主要内容包括:进行基于时序模式和规则的趋势预测方法研究、进行基于时序趋势结构序列的时序数据挖掘方法研究、进行基于粗糙集和趋势结构序列的时序挖掘方法研究、以及进行时序挖掘方法应用于水质预测上的研究。本文的主要工作、成果及核心部分归纳如下: (1)第一章概述时序数据挖掘的产生背景和研究现状,阐述进行时间序列数据挖掘技术及其在水质预测上的应用研究的价值和意义,给出本博士论文的组织结构和研究内容。 (2)第二章介绍数据挖掘的概念及数据挖掘的几个过程,概述关联规则的概念和关联规则的发现、分类发现的含义和分类发现的主要方法。 (3)第三章,作者给出上升的时间子序列和下降的时间子序列的概念,提出基于时间序列的模式和规则的趋势预测方法。对于给定的时间序列,该技术先把时间序列转换成时间子序列数据集,然后挖掘时间子序列数据集,重点挖掘其上升的或下降的时间子序列数据集,从中提取序列模式和规则;提出基于模式和规则、基于支持度和可信度的时序趋势预测。最后给出挖掘算法。 (4)第四章,作者定义时间序列的趋势结构序列、最近时间子序列、趋势结构相同、基于可信度和基于支持度的趋势预测的概念。作者认为最近时间子序列是时间序列的信息聚集器,在此基础上,提出基于时间序列的趋势结构序列的时序数据挖掘方法。该挖掘方法先把待挖掘的时间序列转换成时序趋势结构序列,然后利用时序趋势结构序列的最近时间子序列隐含的知识或信息,来指导对原时间序列的挖掘;提出基于可信度和支持度的时序趋势预测方法,并给出挖掘算法。
刘博[8]2014年在《空间数据仓库关键技术及其在犯罪热点分析中的应用》文中进行了进一步梳理近些年,数据仓库技术应用水平不断提高,其在企业中发挥的价值也越来越大。随着手机、汽车、智能穿戴设备等传感定位技术的发展,越来越多的含有空间信息的数据加入到仓库中,包含地理时空数据的空间数据仓库受到人们的重视,对空间数据仓库的研究也成为这些年来的一个研究热点。空间数据仓库有哪些特性,如何对空间数据进行建模,是本文的研究重点。本文首先探讨了传统数据仓库的理论、特点和设计中的关键环节,讨论了数据立方体、维度、度量、OLAP设计的概念及特性,其次介绍了空间数据仓库的研究与发展现状,分析了空间数据主题与传统数据仓库之间的差异,并根据空间数据仓库的特点,提出了多粒度空间数据仓库(MuSD)设计模型,对相关概念进行了符号化的定义。论文最后讨论了基于SOA的空间数据仓库应用集成框架,并运用作者提出的MuSD模型,对作者参与的‘城市犯罪热点分析’项目进行了数据建模,使用ArcGIS工具对分析模型发布了GP服务,实现了对多类犯罪类型的热点展示与转移情况的分析。
高立青[9]2017年在《治安监控视频大数据中的行人行为识别方法》文中提出近年来,暴力袭击、游行示威和人员拥挤踩踏等社会性公共突发事件在国内外频繁发生,作为城市公共场所社会活动的主体,行人的公共安全问题已成为社会安全管理和智能安防建设中的重点问题。目前,我国大力发展以视频监控为核心的安防监控体系,高清摄像机已经广泛分布于城市的广场、车站、商场等社会各个重点区域,产生了大量的治安监控视频数据。如何从这些监控视频大数据中智能分析出行人群体性行为的状态变化,如何从中早期发现群体性突发事件的端倪,已经成为目前治安智能视频监控领域面临的日益尖锐的科学问题。视频监控系统中的行人行为识别问题一直是国内外学者、相关软硬件公司与研究机构关注的热点,已经取得了比较丰富的研究成果。已有的研究通常仅依据行人的图像特征,基于分类的方式进行分析,缺乏综合知识的整体支撑;当算法应用于监控视频大数据时,存在知识整体组织的缺失问题和子算法冗余问题,造成了大量资源的浪费。行人行为通常可以由视频图像中行人图元的属性状态变化体现出来,本文主要以行人图元为最小粒度对行人骨架属性信息、人数属性信息,以及行为信息进行研究,从实例验证和系统实现两方面检验模型算法的有效性。本文的主要研究工作如下:(1)针对治安视频大数据的行人行为识别问题,提出了基于知识的行人信息挖掘框架。该框架以系统科学理论和基础知识元模型为理论依据,基于知识元模型实现了监控视频处理过程中所涉及到的先验知识的管理和组织,并将行人图元作为行人知识元的一类属性,通过构建属性间的映射关系来指导行人图元部分属性的挖掘,最后基于图元属性的先验知识实现行人行为的识别。针对多摄像机下不同监控场景的行人行为识别需求,以人类视觉认知理论为指导,灵活的实现算法的组合集成,在降低算法冗余的同时,为行人行为信息挖掘问题提供新思路。(2)针对基于骨架属性的单人行为识别问题,研究了单人图元骨架属性的挖掘算法和基于骨架信息的单人行为识别方法。作为视频行人行为识别的基础算法,骨架化算法在保证拓扑结构的前提下,需要具有较快的处理速度。本文基于离散曲线演化迭代过程得到行人图元形状属性的关键节点,采用平行线簇对图元形状多边形进行截取,将截线段中点近似为骨架点:基于骨架点的关联关系确定以图结构形式表述的行人骨架。视频集上的实验结果验证了算法的有效性和快速性。进一步,统计定义的几种单人行为类型的骨架特征,并作为先验知识;通过构建单人行为先验知识的模糊逻辑规则,从而实现视频数据中的单人行为识别。(3)针对监控摄像机下人群行为控制的需求,研究了多人图元人数属性的挖掘算法和基于知识的行人群体性行为识别方法。由于监控摄像机的透视问题,目前基于回归的算法大多数只能得到在时域不一致的计数结果。本文基于视频图像序列中图元的时空关联性构建了图元网络模型,将回归算法得到的图元人数信息作为节点权重,通过求解带网络流约束的二次规划模型实现对多人图元人数属性的修正。为进一步提高算法的精确度和处理速度,提出了图元直方图特征和原始图元网络的收缩方法。标准数据集上的实验结果显示该算法可以很好的降低已有行人计数算法的误差。进一步,基于人类视觉总结人类对异常群体性行为分析的先验知识(人群数量信息和场景中单人行为信息等),并基于模糊逻辑理论将先验知识进行规则化,提出了基于先验知识的行人群体性行为识别方法,该方法可以灵活的添加场景以及人群的先验知识,有助于异常群体性行为的精确识别。(4)针对海量视频数据的处理需求,研究了基于MapReduce框架的分布式处理算法。并以多个摄像机下的视频行人计数算法为例,通过分布式行人检测算法辅助获取回归函数的训练集,完成人数关系知识元实例的分布式训练和分布式存储,实现了人数信息的分布式挖掘算法。最后基于整个理论模型和算法对相关系统进行实现。本研究属于社会公共安全管理、应急管理、大数据挖掘与人工智能的交叉与渗透,对实现监控视频大数据下的行人行为识别具有一定的理论与实践意义。
部先永[10]2013年在《基于开源信息整合的反恐情报获取研究》文中研究指明互联网开启了信息社会的新时代。网络在方便大众进行信息传播与交流沟通的同时,也往往会被恐怖组织和恐怖分子所利用,成为他们组织人员联系、散布恐怖消息、筹集资金、谋划袭击的新载体。尤其是近几年,在经历国际社会对恐怖主义的高强度打击后,处境越来越不利的恐怖组织和恐怖分子将互联网作为新的组织和实施恐怖活动的重要工具和手段。恐怖组织和恐怖分子在虚拟网络空间中忽隐忽现,大肆宣扬极端主义,号召发起血腥袭击,并迅速在互联网上扩大阵地。恐怖组织和恐怖分子越来越熟练地利用网络从事疯狂的破坏活动,迫使各国政府纷纷采取相关措施加大对互联网“信息反恐战”的投入,同时各国的情报部门和学术机构也加入到反恐主义的“网络新阵地”,反恐呈现出信息化、网络化、智能化、虚拟化的发展趋势,反恐情报获取和涉恐信息智能化处理已成为十分迫切而重要的研究课题。开源信息是指通过公开或半公开渠道获取的信息。随着信息技术和网络技术的不断发展,开源信息的获取变得十分方便快捷,资源数量也急剧增长。纷繁芜杂的开源信息在互联网上的快速传播和持续增长给情报搜集与信息安全带来了新的机遇和挑战。如何通过互联网迅速准确地了解一个国家、一个地区对某些重大政策的舆情与民意,构建和谐社会;如何利用网络上的蛛丝马迹追踪定位恐怖分子,保卫国家安全;如何从海量的、看似无关的信息中找到一些还没有发现的规律,把握事物发展的趋势,以便更好地把握未来等重大问题。这些无不给科研工作者提出了崭新的挑战,特别是互联网使恐怖分子及其恐怖活动越来越隐蔽,网络情报资源越来越成为类似土地、石油、矿藏等稀有资源的首要“矿源”,利用开源信息可以广泛获取各类关乎国家安全、社会安全、个人安全的重要情报,这对指导现实工作的有效运转有着极其重要作用。由于开源信息通常由结构化数据、半结构化数据、非结构化数据等多种结构类型的数据组成,如果不对其进行有效的整合,是无法快速有效地从中提取有价值的隐藏信息,获取高质量的、深层的反恐情报。基于开源信息整合的反恐情报获取研究吸收了情报学、计算机科学、本体、人工智能等领域的研究成果,并且以众多先进的理论与技术为支撑,如知识工程、数据挖掘、语音识别、人际情报网络、可视化技术等,为反恐情报的获取、创新以及反恐决策的优化提供支持。本文的研究工作主要包括以下六个部分:第一部分,从分析本论文选题背景入手,阐述了论文的研究意义和国内外研究现状,以及本文的主要研究内容、研究方法和创新点。第二部分,首先分析了反恐情报的概念、特征和作用;接着介绍了开源信息的概念及其对公共安全的价值、地位和影响,分析了开源信息整合的原则和技术特征,重点论述了开源信息整合的三种模式:物理整合模式、逻辑整合模式和语义整合模式。最后从信息检索与知识检索、数据挖掘与知识发现、语音识别、情报分析等方面论述了获取反恐情报的基础理论与技术。第三部分,分别从基于情报源、Deep Web信息资源、本体技术、XML技术等提出开源信息整合的策略,并对各种整合策略进行了详细的分析,同时阐述了相关的理论依据。第四部分,主要探讨了基于开源信息整合的反恐情报获取流程和模型。在反恐情报获取流程中,详细分析了反恐情报需求识别与表示、开源信息搜集与整合和反恐情报的挖掘与获取。本部分在分析现有反恐情报获取模型的基础上,提出和构建了基于开源信息整合的反恐情报获取模型,包括开源信息采集、开源信息整合、反恐情报获取、反恐情报可信度判别和反恐情报可视化输出五大模块,并对该模型进行了评价。理论分析结果表明,该模型能够显著提高涉恐信息的整合效率和反恐情报智能化获取水平。第五部分,分析了反恐情报获取中的关键技术与方法,包括情报知识检索、基于数据挖掘的反恐情报获取方法、基于人际情报网络挖掘的反恐情报获取方法、基于语音识别的反恐情报获取技术和基于情报分析的反恐情报发现技术,并对每种方法和技术进行了详细的论述。这些方法和技术不仅是获取反恐情报的关键,同时也提高了反恐情报获取的智能性、全面性和准确性。第六部分,对全文进行了总结,并给出了加强我国反恐情报工作及系统建设的建议,同时展望了下一步的研究。本文系教育部人文社科重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究(批准号:08JJD870225)”和国家自然科学基金项目“企业竞争情报分析模型与方法研究(批准号:71073121)”资助的研究成果之一
参考文献:
[1]. 数据仓库和数据挖掘方法研究及其在公安信息建设中的应用[D]. 麦永浩. 华东理工大学. 2000
[2]. 社保资金支付大数据决策支持平台的研究与实现[D]. 吴宝伟. 电子科技大学. 2014
[3]. 数据挖掘在银行客户关系管理中的应用研究[D]. 秦秀洁. 华南理工大学. 2014
[4]. 犯罪分析系统的设计与实现[D]. 于中辉. 山东大学. 2007
[5]. 《计算机工程与应用》2004年(第40卷)总目次[J]. 佚名. 计算机工程与应用. 2004
[6]. 电力负荷分析与预测的分布式数据仓库和数据挖掘研究[D]. 栗然. 华北电力大学(河北). 2009
[7]. 时序数据挖掘技术及其在水质预测中的应用研究[D]. 王勇. 广东工业大学. 2005
[8]. 空间数据仓库关键技术及其在犯罪热点分析中的应用[D]. 刘博. 东华大学. 2014
[9]. 治安监控视频大数据中的行人行为识别方法[D]. 高立青. 大连理工大学. 2017
[10]. 基于开源信息整合的反恐情报获取研究[D]. 部先永. 武汉大学. 2013
标签:计算机软件及计算机应用论文; 大数据论文; 数据挖掘论文; 数据仓库论文; 数据挖掘算法论文; 序列模式论文; 预测模型论文; 数据整合论文; 情报搜集论文; 天气预报论文; 数据分析论文;