基于卷积神经网络的建筑物提取方法论文_赵梅,纪聪聪

山东省泰安市国土资源局岱岳区分局山东泰安 271000

山东省泰安市农业技术推广站山东泰安 271000

摘要：从米级高分辨率遥感影像中提取精准的建筑物时，影像中的树木和道路影响提取精度的主要噪声对象。本文利用卷积神经网络和贝叶斯结合的方法，较好地解决了这一问题，首先将人工去除遮挡后的建筑物和没有被遮挡的建筑物、林地、道路作为样本建立三个独立的样本库，利用一个5层的全卷积神经网络模型对样本分别进行学习，获取各自的特征向量集；然后对特征矢量集进行混合高斯建模，以估计噪声对象与房顶混合的条件概率密度函数。利用高分2影像进行了训练和测试，结果表明，本文方法能够较好地消除树木和道路的影响，提取建筑物的精度能够达到91%。

关键词：高分2号；卷积神经网络；FCN；建筑物提取

1介绍

获取详细的城镇建筑物分布图在社会管理、制定发展规划中具有重要的意义。高空间分辨率遥感影像能够展现大量的地物特征，这使得利用高分辨率影像对城市建筑物进行精确识别成为可能[B]。在高分辨率卫星遥感影像上，建筑物屋顶是城镇建筑物制图的主要特征 [A]。由于城区屋顶材料和建筑物的朝向的多样性，尤其是房顶被高大树木或其它高大物体被遮挡的现象较多，使得利用高分辨率多光谱遥感影像进行城镇建筑物制图存在较大的困难。

由于城镇环境空间格局复杂多样，城镇各类地物在高分辨率多光谱影像上光谱变异度高，同物异谱和异物同谱现象远比自然环境下普遍[A1]。高分辨率遥感影像4 个多光谱波段能够区分城镇水体、裸土、植被、阴影和不透水性地面等土地覆盖类[ A2-A3]，但仅靠低层次的光谱统计特征，试图把光谱混淆严重的不透水性地面区分为道路、停车场和建筑物则存在相当大困难[A4]。近年来有研究提出了空间与光谱结合的分析方法，认为空间特征是与光谱特征互补的信息[B1]，利用结构信息、上下文信息和光谱信息的整合进行了对建筑物的提取[B2-B4]；同时以分割为基础的面向对象的分析方法也得到应用，如文献[B5-6]提出了一个基于支持向量机的集成方法，该方法将面向对象和基于像素的方法结合起来对城市地物进行分类；文献[B7]利用改进的像素级和对象级遥感影像的分类方法来区分不同的地物。针对城市地物的特殊形态，人们也提出一些相应的空间特征计算方法，如像元形状指数 [B8]、形态学序列[B9-12]、城市多尺度复杂指数[B10-11]等。目前研究中存在的最主要问题，主要基于低层次特征或特征组合进行提取，致使有遮挡的建筑物提取的难以被完整的提取出来。

随着深度学习研究的深入，卷积神经网络(Convolutional neural networks， CNN)在图像理解中的作用逐渐受到人们的重视。卷积神经网络是以卷积运算为基础的深度神经网络，卷积结构可以减少深层网络占用的内存量，也可以减少网络的参数个数，缓解模型的过拟合问题。促进了遥感图像处理技术的发展。由于现有以CNN模型为基础发展起来的影像分割模型都属于监督学习模型，样本的质量决定模型的质量，因此，人们在训练模型建筑物模型时都是采用建筑物形状完整的模型，以提前模型的识别能力，导致训练出来的模型在识别有遮挡的建筑物时能力较差。我们通过深入分析上述模型的结构和前向传播的推导过程，发现导致上述问题出现的根本原因，是由于传统的深层卷积网络模型在前向传播的推导时，没有考虑低层的噪声对高层特征的影响方式和影响程度，降低了模型的识别能力。

我们在以上分析的基础上，提出了一种改进的卷积神经网络模型，用于提高对有遮挡的建筑物的提取能力。模型的主要工作有：（1）首先利用一个5层的卷积网络，分别学习城镇的建筑物、林地、道路这三类样本，得到特征向量集；（2）利用高斯混合建模，获取林地和道路与建筑物混合的条件概率密度函数。

2方法

本文使用FCN（Fully Convolutional Networks）模型作为基础模型，本节将阐述FCN的基本结构及我们需要修改的部分，并根据定量分析结果讨论具体的修改方式，形成了一个完整的能够识别有遮挡建筑物的有效方法。

2.1 FCN模型基本结构

CNN的强大之处在于它的多层结构能自动学习特征，并且可以学习到多个层次的特征：较浅的卷积层感知域较小，学习到一些局部区域的特征；较深的卷积层具有较大的感知域，能够学习到更加抽象一些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低，从而有助于识别性能的提高。这些抽象的特征对分类很有帮助，可以很好地判断出一幅图像中包含什么类别的物体，但是因为丢失了一些物体的细节，不能很好地给出物体的具体轮廓、指出每个像素具体属于哪个物体，因此做到精确的分割就很有难度。

FCN将传统CNN中的全连接层转化成一个个的卷积层，达到从抽象的特征中恢复出每个像素所属类别的目的，即从图像级别的分类进一步延伸到像素级别的分类。

2.2 FCN结构分析

从FCN模型结构可以看出，FCN的卷积部分仍然采用传统的卷积方式，在这种方式下，高一级的特征是对低一级特征聚合和抽象，随着卷积层次的增加，相当于视野越来越大，因此，原始影像中某一噪声像素块对高层次特征的影响必须越来越小，以至于当层次足够高时，原始图像中该像素块的影响可以忽略不计。这个理解与人眼观察现实世界的过程也是相符的，当人眼与被观察物体离得很近的时候，物体上的细节部分就能够被观察到，但当人眼离物体的距离越来越远时，该细节部分对人的视觉感受的影响就越来越小。

噪声像素块对高层次特征的影响，除了和像素块的大小有关外，也和像素的位置有关，同样尺寸的噪声像素块，当其位于物体的中间位置时，随着视野的变大，正样本像素数不断增加，噪声所占的比例就会减小的很快；但当其位于物体边缘时，随着视野的变大，虽然正样本的像素数也在增加，但其他对像的像素数也会同样增加，导致噪声所占的比例会减小的慢。

因此，考虑噪声像素块对提取出的特征的影响程度时，需要综合考虑噪声像素块的大小，噪声像素块与待识别对象的相对位置和卷积的深度这三个方面的因素，我们将通过定量实验的方式获取噪声像素块对特征的影响程度估计值，并将其用于设计新的激活函数，提高对像素判断的准确性。

2.3 FCN与贝叶斯结合建立提取模型

受此启发，我们将首先定量分析像素块大小对不同级别抽象特征的影响，然后对传统FCN加以改进：以定量分析结果为先验知识，引进概率判断的思想，构造新的激活函数，提高对像素的准确性。通过改进，建立起能够用于提取有遮挡建筑物的新模型。

建筑物的遮挡问题，主要是由于建筑物被树木或者其他建筑物的遮挡，影响了被遮挡部分像素的判断，导致分割后形状缺失，进而影响了提取精度。为此，我们将建立一种基于贝叶斯原理的判断方法，将像素判断问题转化为最大后验概率估计问题，提高被遮挡部分像素类别归属判断的准确性。转化步骤如下所述：

（1）在城镇影像中，树木是对建筑物产生遮挡的主要对象，而道路在光谱和纹理上与房顶顶层比较接近，很容易混淆，是主要的噪声来源。基于以上考虑，建立了三类样本库，分别为：SAMPLE-A：没有遮挡的建筑物，这是训练的正样本；SAMPLE-B：林地；SAMPLE-C：道路；SAMPLE-B和SAMPLE-C将作为噪声参与训练。

（2）建立一个5层的卷积网络，分别学习SAMPLE-A、SAMPLE-B、SAMPLE-C的特征；通过学习，获得三个类别的特征矢量集；

（3）对SAMPLE-A与SAMPLE-B、SAMPLE-C的特征矢量集进行混合高斯建模，以估计噪声对象与房顶层混合的条件概率密度函数。

3实验与结果分析

3.1 实验方案

实验的目的是为了对模型的性能进行测试，围绕实验目标，本小节从数据源选择、样本标记等方面对实验方案进行阐述。

3.1.1 数据源选择

我们还获取了4幅包含GF2号遥感影像和同期的高分1号遥感影像，其中GF2全色波段的空间分辨率为0.8m，GF1光学影像的空间分辨率为2米。将GF遥感影像作为无人机影像补充。

3.1.2 样本标记

样本标记是模型运行的关键步骤，标记质量直接决定了测试的效果。与其它样本标记制作方法不同，我们使用JX5摄影测量软件，独具特色的地物采集：该软件道路、建筑物、水系等具有线状地物半自动提取功能，结合人工操作，能够准确地描绘出边角细微处的信息。提取完成后，利用GIS软件将提取得到的矢量数据转为栅格数据，形成标记。

在进行标记时，无人机影像直接用来进行标记。对于高分数据，首先利用ENVI软件，将GF2号的全色波段与GF1号的RGB波段进行融合，获得0.8m空间分辨率的遥感影像，然后进行标记。被标记的类别主要有：建筑物（包括未遮挡的建筑物和被部分遮挡的建筑物）、道路、林地、农田等。其中被遮挡建筑物的标记分三步完成，在利用JX5完成第一步标记后，对被遮挡的部分，以使用全站仪实地测量数据为依据，将边框补充完整，得到完整标记，然后利用PS软件，以同一房顶未被遮挡部分的像素为基础，使用“染料桶”功能对被遮挡的部分渲染。

3.2 实验结果与分析

图2 影响程度曲线

从图中可以看出，同样的噪声像素块尺寸，在不同的相对位置时，对提取结果影响程度差别非常大，在顶角位置时的影响程度明显比在边上的影响程度大，这是因为，当噪声像素块在屋角时，随着卷积层次的增加，虽然视野的扩大引入了更多的屋角所在房顶的像素，但引入的不是屋角所在房顶的像素也在不断增加，虽然模型采用了空洞卷积的方式，但由于两者的增长的比例大致相当，影响了空洞卷积的效果，解决这一问题需要设计新的卷积方式。当噪声像素块位于边上时，随着卷积层次的增加，引入的房顶的像素数增加的速度远远超过引入的非房顶的像素数，为判断提供了更多的特征。结合模型改后的激活函数，基本没有误判断。 3.2.2 道路的影响

树木对提取建筑物产生影响，主要原因是目前硬化路面使用的材料与部分房顶使用的防水材料相似，导致两者在光谱值上相似，影响的房屋提取的精度。在BCNET模型中，光谱特征仅仅是判断像素归属的特征之一，模型还使用了大量的空间特征和抽象特征，特别是模型采用了空洞卷积的方式，能够很快地增加视野，而房顶的宽度一般远远大于路面的宽度，当视野增大时，道路的像素块中混入其它类别（尤其是树木的）远早于房顶混入其它类别像素，导致道路的特征值很容易与房顶产生不同，增加了两者的可分性。同时，激活函数采用了概率密度函数，进一步提高判断的准确性。因此，本文模型较好地解决了道路与房顶区分的问题。 4.结论

高分辨率遥感影像建筑物提取是一项亟待解决的难题，本文针对影像中的树木和道路对提取精度的影响，在FCN模型的基础上，提出了一种BCNET模型，较好地解决了这一问题。但是本文方法依然存在不足，例如，卷积神经网络的层次结构和参数设置是否最优依然是值得研究的问题；当遮挡位于屋角时，模型的区分能力还不够理想，在进一步的研究中，需要结合像素块的位置信息对卷积方式进行改进，提高模型的区分能力，以期得到更高的分类精度。

参考文献：

[1]胡荣明，黄小兵，黄远程．增强形态学建筑物指数应用于高分辨率遥感影像中建筑物提取［Ｊ］．测绘学报，2014，43(5)：514-520.

[2]谭衢霖.高分辨率多光谱影像城区建筑物提取研究. 测绘学报，2010，39（6）：618-623.

论文作者:赵梅,纪聪聪

论文发表刊物:《防护工程》2018年第22期

论文发表时间:2018/12/4

标签：卷积论文; 建筑物论文; 模型论文; 像素论文; 特征论文; 遮挡论文; 噪声论文; 《防护工程》2018年第22期论文;

基于卷积神经网络的建筑物提取方法论文_赵梅,纪聪聪

猜你喜欢