空间数据挖掘的研究

空间数据挖掘的研究

康大伟[1]2007年在《基于GIS和空间数据挖掘的事故分析系统的研究与开发》文中认为GIS数据库中含有丰富的数据和信息,其中隐含着许多有价值的知识,而目前的GIS系统主要局限于现实数据的录入、查询、统计等功能,无法有效地挖掘数据中存在的关系和规则。数据挖掘技术能够对GIS数据进行有效的分析,发现其中隐含的知识。因而从GIS的空间数据库中进行空间数据挖掘,已经成为数据挖掘领域中一个重要的研究方向。本文首先介绍了交通事故研究现状和现有的交通事故研究方法,通过对空间数据挖掘和GIS技术的产生背景、应用特点进行介绍和分析,指出了采用空间数据挖掘和GIS技术解决目前交通事故分析中存在的问题的优势和可行性;然后详细地描述了数据预处理的方法:通过对事故数据的空间数据概化、数据归约化,将事故记录对应的谓词转化为整型数值,提高了算法的挖掘效率;通过粗糙集对不完备事故数据进行补齐,避免因为事故数据的不完备性影响事故挖掘的准确性。随后,本文将多层次空间关联规则挖掘算法应用于事故数据挖掘中,该算法不仅解决了传统算法对事故数据挖掘的局限性,而且提高了基于空间数据挖掘和GIS技术的事故分析系统的性能;此外,根据空间数据挖掘和GIS技术的特点,提出了一个基于GIS的空间数据挖掘叁层体系结构,该叁层体系结构展现了对事故数据提取、预处理、挖掘的整个过程,把空间数据挖掘应用于GIS上必将进一步拓展GIS应用领域的广度和深度。本文最后介绍了使用ArcGIS Engine和C#.NET开发交通事故分析系统的方法,给出了系统主要功能的类的实现,并实现了一个示例系统。通过对某市交警总队已有的交通事故数据进行分析,证明了该示例系统能够对数据库中杂乱的事故数据进行挖掘并将有意义的规则知识呈现给用户。综上所述,本文的主要创新处在于将空间数据挖掘和GIS技术相结合应用于交通事故分析中,解决了交通事故中相关规则挖掘的问题,并通过ArcGIS Engine和C#.NET实现了一个示例系统。事实表明,基于空间数据挖掘和GIS技术的交通事故分析系统能够有效的对事故数据进行管理和分析,为城市的交通安全和规划建设提供有效的决策。

赵璐[2]2008年在《基于MATLAB的空间数据挖掘系统(M-SDM)设计与实现》文中进行了进一步梳理自20世纪90年代提出空间数据挖掘概念以来,面对海量的空间数据进行数据挖掘和知识发现的研究受到人们的关注,研究成果不断涌现,主要是进行理论研究和小型的试验研究,但面对海量空间数据的数据挖掘集成系统研究尚欠探讨,而这是实际工作中迫切需要解决的问题。鉴于此,本研究尝试从一个新的角度探讨空间数据挖掘的技术途径,即基于具有强大的数值计算能力和可视化图形设计功能的MATLAB平台,设计开发空间数据挖掘集成信息系统,从而为海量空间数据挖掘提供技术支持和解决方案。本研究借鉴脑功能成像数据分析软件SPM(Statistical Parameters Mapping)的设计思想,将MATLAB、GIS、SDM叁者有机结合,在MATLAB平台上搭建SDM系统框架,针对部分主要算法如空间关联分析、空间聚类分析、决策树分析等进行集成,并借助土地利用空间数据进行试验应用,旨在提高大数据量处理和利用的效率,增强挖掘结果的科学性,并扩展MATLAB在空间数据挖掘、空间矢量数据处理等方面的应用。本文在归纳分析了空间数据挖掘研究的背景及SDM系统研究现状的基础上,结合空间数据挖掘的相关基础理论以及M-SDM系统的需求分析,提出了M-SDM系统设计和开发的叁层体系结构,实现了系统平台的搭建;详细设计了空间关联规则Apriori算法、空间模糊聚类分析和决策树C4.5算法的实现和集成;开发了M-SDM系统,主要模块相互独立,具有灵活开放的结构;通过具体实例测试和验证了系统的可行性和有效性,并获得了有实际价值的知识和规则。本研究提出的基于MATLAB平台开发空间数据挖掘系统的技术方法和体系结构,所解决的系统开发与集成的关键问题,开发出的SDM集成系统,以及其在土地利用空间数据挖掘中的成功应用,证明了基于MATLAB平台构建SDM集成系统进行海量空间数据处理和挖掘是一个可行的研究途径和技术方法,其研究思路、技术路线、算法设计、系统集成等对相关研究具有指导和借鉴作用。

孙元军[3]2008年在《土地利用空间数据挖掘方法及其应用研究》文中认为政府土地主管部门通过土地利用现状调查和城镇地籍调查积累了大量第一手资料,但如何从中提取出人们感兴趣的有用信息是亟待解决的重要问题。本文通过对如何选取数据挖掘工具、如何选取数据挖掘算法、如何分析解释数据挖掘结果等问题的研究,在大量实验的基础上,结合实际案例对空间数据挖掘方法在土地空间数据中的应用作初步探讨。本文内容主要分为叁大部分:第一部分介绍了选题依据、国内外研究现状、技术路线等内容;第二部分对文中所应用的数据挖掘算法进行重点介绍;第叁部分为实例研究,选用不同的数据挖掘软件,选用各具特色的数据挖掘算法,分别对城市地籍数据和城镇土地利用结构数据进行挖掘分析得到如下结论:(1)城市地籍空间数据挖掘。以SQL Server 2000组件Analysis Manager软件为工作平台,采用决策树算法,对2000年济南市城区地籍资料进行数据挖掘操作。通过对数据挖掘产生的决策树进行分析,发现研究区域内的建筑容积率较低,说明该区域建设用地的利用程度不高,已开发建设用地还有很大的提高潜力。依据挖掘结果提出在今后的土地开发利用中应该将工作的重心放在内部挖潜、提高已有建设用地的利用效率上等建议。(2)城市建设用地结构分析。将基尼系数的基本原理引入到城市建设用地结构的研究中,构建了“城市建设用地结构基尼系数”的概念及其计算方法。借助GIS等手段对不同城市间建设用地结构的差异进行分析,结果显示:①以东部、中部、西部和东北部四个区域为单位计算出的同一地类城市建设用地结构基尼系数很小,但不同地类间差异较大,而且随时间变化呈现出不同的变化趋势;②大多数省份的城市建设用地结构基尼系数略有下降,说明我国整体的城市建设用地结构逐渐趋于合理化;③依据基尼系数的计算结果,与《城市用地分类与规划建设用地标准》(GBJ 137-90)进行了对比。研究结论:使用基尼系数衡量城市建设用地结构是一种行之有效的方法。(3)城市建设用地结构特征挖掘。尝试使用Weka软件,运用其关联分析、聚类、回归方法中的不同算法对城市建设用地结构进行分析,获取了一些有益的结果:①通过关联分析得到不同用地间的相关性;②通过聚类将全国城市分为5类,并分析了其空间分布特征,即存在均匀分布,又呈现相对聚集现象;③通过回归分析得知用地结构与城市规模之间存在一定联系。(4)初步建立了城镇用地结构数据挖掘的数据预处理、挖掘算法筛选、挖掘结果分析的技术流程。

叶枫[4]2008年在《基于GIS的人口统计数据分析》文中进行了进一步梳理近年来,地理空间信息对社会科学领域的重要性不断得到加强,人口、经济等统计信息所具有的空间特征,通过地理信息系统可以进行空间可视化,从而得到人口在空间中的直观的分布变化规律。地理信息系统(Geographical Information System,缩写为GIS)是集计算机科学、地理地质学、测绘科学、环境科学、空间科学、信息科学和管理科学等为一体的多学科结合的新兴边缘科学。它是在计算机硬件、软件系统的支持下,采集、存储、管理、分析和描述整个或部分地球表面与空间和地理分布有关的数据的空间信息系统。数据挖掘(Data Mining),也可以称为数据库中的知识发现(Know ledge Discover Database,KDD ),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。本文在介绍了地理信息系统、数据挖掘的基本概念的基础上研究和实现了以下几方面内容:1、总结和分析了人口地理信息系统(GIS)的研究与发展现状,并对人口数据的空间分析进行深入的探讨。2、实现了基于MapX组件的南京市人口统计地理信息系统。3、将空间统计方法应用于人口数据的关联规则挖掘,通过空间自相关分析和G统计分析获取了出生人口性别比的有关规则。

张希雯[5]2007年在《基于GIS的空间同位规则挖掘算法的实现及应用研究》文中研究表明空间数据挖掘(Spatial Data Mining,简称SDM)是数据挖掘的一个重要分支,它对于理解空间数据,寻找空间数据之间、空间与非空间数据之间内在关系,以简洁方式表达空间数据规律起着重要作用。空间数据挖掘面向的是空间数据库,空间数据库是一类重要的、特殊的数据库。地理信息系统(GeographicInformation System,简称GIS)是空间数据库的载体,GIS数据库中含有大量的空间和属性数据。因此,利用GIS作为开发空间数据挖掘工具的平台,能够使空间数据的整合利用更加方便以及知识的表达更加直观。空间关联规则是空间数据挖掘所要发现的一种重要知识。Tobler的第一地理规则描述了这样一种空间依赖性:“所有的事物都是有联系的,一个地方发生的事件总是与它附近发生的事件有关联,并且相距近的事物之间的联系一般比相距远的事物之间的联系要紧密。”如果能从这些数据中找出其规律性或相互联系,就可以反过来推断客观世界的情况。这就是空间关联规则挖掘的任务。一般的空间关联规则研究是基于传统的关联规则,然而这些方法在处理空间关系时是不适用的。同位规则问题的提出,很好的解决了挖掘正确有效的空间关联规则的需要。本论文分为五章。第一章是概述,对空间数据挖掘、GIS以及空间关联规则等概念和理论框架进行简要的阐述。第二章介绍空间数据的相关理论以及GIS与空间数据挖掘的集成模式。第叁章是空间同位规则挖掘算法的研究。介绍了用于处理布尔型空间数据的事件中心模型和拓展到处理空间多维分类数据的同位规则挖掘算法,对后者进行了改进,有效的控制了生成的候选同位模式的规模,减少数据库扫描次数,从而提高了算法的效率。第四章是改进算法在GIS平台上的实现,并以北京市大兴区2005年的经济普查数据为例,分析工业、餐饮业和学校叁者间的空间分布规律,得出相关结论。第五章是对本文的工作、创新点以及下一步的研究方向进行总结。

孙姝艺[6]2018年在《基于空间聚类和关联规则的广东省“旱改水”优先区选址》文中研究表明随着我国新型城镇化水平的日益提高,大量的耕地将会被占用,这将对我国粮食安全和生态安全造成严重威胁。在这样的背景下,保护耕地资源、提升耕地质量,实行耕地数量与质量保护并重已经上升为国家战略—耕地占补平衡政策,在补充耕地质量不优和农用地整治潜力日渐匮乏的双重压力下,“占优补优,占水田补水田”已成为落实耕地占补平衡政策的有效举措。各地政府为响应国家政策开始实施“旱改水”工程改造,由于受自然资金条件的限制,需要统筹安排适宜和不适宜改造地区,因此“旱改水”优先区域选址是实施改造先后顺序的重要评判标准。本文以广东省为研究区,借助WEKA软件,基于空间聚类和关联规则的方法来选择“旱改水”优先区:第一,通过属性选择获取包括地形坡度、有效土层厚度、表层土壤质地、剖面构型、有机质含量、PH值、障碍层深度、灌溉保证率、水源距离9个相关性较高的改造因子建立了分区指标,实现数据的预处理;第二,通过Kmeans聚类分析将研究对象划分成5类簇;第叁,通过Apriori关联规则挖掘出分区因子属性之间最强关联关系作为决策挖掘出优先改造的簇,并对结果进行了分析和验证。本文的结论如下:(1)本文将空间聚类分析划分的5类簇作为选址的选择区Cluster0,1,2,3,4;将关联规则挖掘出的最强关联关系作为优先区选址的标准,基于已经划分好的聚类区,通过筛选分区单元,发现符合最强关联关系的聚类区是Cluster4。(2)本文通过2016年广东省国土资源厅“旱改水”承诺改造面积验证结果表明,准确率达到89%以上,采用空间聚类和关联规则相结合的数据挖掘方法来进行“旱改水”优先区选址是科学且合理的。(3)本文针对优先区选址结果进行分析,从地块数量来看,优先区共涉及个15个市,73个县区,137380个地块,共计273531公顷,占总数比19%;从空间分布来看,主要分布在地势平坦、水资源充足的珠叁角平原区南部、粤西北山区西部和粤西沿海区雷州半岛。并且本文还从宏观和微观的角度分别提出了改造建议,划分珠叁角平原区南部—粤西北山区西部、粤西沿海区雷州半岛区域和粤西北山区东部部分地区—粤东沿海区东部叁大改造重点建设区域。

贾泽露, 刘耀林[7]2009年在《可视化空间数据挖掘研究综述》文中认为空间数据挖掘针对的是更具有可视化要求的地理空间数据的知识发现过程,可视化能提供同用户对空间目标心理认知过程相适应的信息表现和分析环境,可视化与空间数据挖掘的结合是该领域研究发展的必然,并已成为一个研究热点。论文综述了空间数据挖掘和可视化的研究现状,重点阐述了空间数据挖掘中的可视化化技术及其应用,并对可视化空间数据挖掘的发展趋势进行了阐述。

朱红春[8]2003年在《数字高程模型(DEM)空间数据挖掘研究》文中提出DEM是国家基础地理信息数据库的核心内容,是GIS数字地形分析的数据基础,包含着丰富的地形、地貌及相关的地学信息与知识。目前,我国测绘部门已基本上完成了4级比例尺DEM建设,面对海量的信息,研究与掌握基于DEM空间数据挖掘的理论与方法,对于指导DEM及其相关空间数据的应用具有及其重要的意义。本研究在广泛总结前人研究成果与研究经验的基础上,利用空间数据挖掘和地形地貌学的基本理论,以陕北黄土高原多地貌类型区为实验样区,以1∶10000比例尺DEM为样本数据,探讨了DEM中地形地貌数据挖掘与知识发现的理论方法和体系结构;确定了宏观和微观地形因子、地形综合特征知识的体系结构;系统总结了DEM基本地形因子的提取算法,并重点对坡长、曲率、地形的起伏度、切割深度和沟壑密度因子提取的原理与算法作了深入的分析;提出了黄土高原地区区域特征知识的基本构成及其系统完整、科学可行的挖掘提取算法;扩充了ArcView GIS软件平台中DEM空间分析的基本功能;实现了以Delphi7.0为平台的地形信息辅助挖掘系统的设计与开发;完成了对黄土高原多地貌类型区(样区)地形信息空间分异特征的分析。研究结果表明,所提出的基于DEM空间数据挖掘的理论与方法,对于区域地形、地貌信息的知识发现具有重要的理论意义和应用前景。

李涛, 曾春秋, 周武柏, 周绮凤, 郑理[9]2015年在《大数据时代的数据挖掘——从应用的角度看大数据挖掘》文中研究表明介绍了大数据时代数据挖掘的特点、任务及难点,分析了大数据挖掘的核心架构,提出大数据的核心和本质,即应用、算法、数据和平台4个要素的有机结合。在此基础上介绍了本团队研究设计的大数据挖掘系统FIU-Miner。该系统是一个用户友好并支持在分布式环境中进行高效率计算和算法快速集成的数据挖掘系统平台,使得数据分析人员能够快速有效地进行各类数据挖掘任务。最后,介绍了基于FIU-Miner的3个典型的成功应用案例:高端制造业数据挖掘、空间数据挖掘和商务智能数据挖掘。

王新洲[10]2006年在《论空间数据处理与空间数据挖掘》文中认为根据现行文献中反复提到的空间数据处理内涵的理解,将空间数据处理分为空间数据处理技术和空间数据处理理论,简要论述了各自的主要内容,讨论了空间数据挖掘的现状和今后研究的重点,比较了空间数据处理与空间数据挖掘的异同。

参考文献:

[1]. 基于GIS和空间数据挖掘的事故分析系统的研究与开发[D]. 康大伟. 江苏大学. 2007

[2]. 基于MATLAB的空间数据挖掘系统(M-SDM)设计与实现[D]. 赵璐. 山东师范大学. 2008

[3]. 土地利用空间数据挖掘方法及其应用研究[D]. 孙元军. 中国地质大学(北京). 2008

[4]. 基于GIS的人口统计数据分析[D]. 叶枫. 苏州大学. 2008

[5]. 基于GIS的空间同位规则挖掘算法的实现及应用研究[D]. 张希雯. 厦门大学. 2007

[6]. 基于空间聚类和关联规则的广东省“旱改水”优先区选址[D]. 孙姝艺. 华南农业大学. 2018

[7]. 可视化空间数据挖掘研究综述[J]. 贾泽露, 刘耀林. 地理空间信息. 2009

[8]. 数字高程模型(DEM)空间数据挖掘研究[D]. 朱红春. 西北大学. 2003

[9]. 大数据时代的数据挖掘——从应用的角度看大数据挖掘[J]. 李涛, 曾春秋, 周武柏, 周绮凤, 郑理. 大数据. 2015

[10]. 论空间数据处理与空间数据挖掘[J]. 王新洲. 武汉大学学报(信息科学版). 2006

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

空间数据挖掘的研究
下载Doc文档

猜你喜欢