江苏省基础测绘设施技术保障中心 南京 210013
摘要:不动产统一登记的房地历史数据整合是提高不动产统一登记工作效率的必要途径。本文以历史房地数据为研究对象,围绕“地-楼-房”空间拓扑关系,基于面向不动产统一登记的要求,提出了房地坐落分词匹配算法的房地调查数据一体化整合方法和面向房地历史业务数据提出了不动产权利流转生命周期模型;基于此,整合了房地历史业务数据。通过对某区的房地数据整合实践,验证了模型和方法的适用性、可靠性和正确性。
0引言
长期以来,由于国家体制和管理制度的原因,除了上海、深圳等城市的房产和土地由同一个登记机关负责登记外,其余省、直辖市都实施房产和土地分开登记制度,即由建设部门和土地管理部门分别负责房屋和土地的登记。由于登记机关分别使用各自独立登记规程、登记信息系统,造成了房屋调查和土地登记数据之间缺乏有效、一致的数据交换渠道,房产和土地登记数据经常相互矛盾[1]。这种情况既没有为财政、税收、金融、公众等提供公共信息共享服务,也影响了政府的公信力。因此,按照不动产统一登记要求,实施房产与土地历史数据的整合是当务之急。
本文研究的主要目的是通过对历史房地数据的分析,建立了一种高效的不动产数据整合方法,将现存的房地历史调查数据、房地历史业务数据进行有机集成,实现了不动产数据的统一管理,提高当前不动产登记的工作效率。
1 历史房地数据特征分析
不动产统一登记实施前,房产和土地均有各自的登记程序、要求、方法和登记结果。土地登记是以宗地为基本单元,以土地使用者为主体进行登记管理。登记类型包括总登记、初始登记、转移登记、他项权利登记、查封登记和注销登记等,登记的基本流程为登记申请、权属审批、注册登记、核发证书等。所形成数据包括地籍调查数据和土地登记数据库。地籍调查数据主要包含地籍号、土地坐落、土地面积、土地用途、建筑面积、建筑占地面积、使用者名称等。土地登记数据主要包含土地证号、登记类型、地籍号、土地坐落、土地登记面积、权属来源证明文件等字段信息。
而房屋登记则以丘、幢、层和户为基本单元,以房屋所有者为主体进行登记管理。登记业务类型有预告登记、所有权初始登记、转移登记、抵押登记、查封登记和注销登记等。登记的基本流程为申请、受理、审核、登簿、缮证发证以及归档[1]。所形成数据包括房屋调查数据和房屋登记数据库。房屋调查数据主要包含丘号、房屋幢号、层号、室号、房屋坐落、建筑面积等。房屋登记数据主要包含登记申请号、登记类型、房屋幢号、层号、室号、房屋坐落、房屋登记面积、权属来源证明文件等字段信息。
通过对比发现,房产登记与土地登记的业务和流程大体一致;房产数据和土地数据之间有共同的要素:权利人和坐落。一般情况下,房屋所有权人与土地使用权人一致,房屋坐落与土地坐落相一致。
2 整合技术路线分析
房地历史数据整合的目标是,通过特征关键字,将历史上不同部门采集、整理的房产与土地历史数据,进行关联和联接,完成房地调查数据、房地业务数据的集成,从而实现不动产数据的统一管理。
房地调查数据特征关联关键字是:土地坐落和房屋建筑面积与土地面积比。利用房屋坐落和土地坐落的一致性,可建立房地数据关联。因此,本研究将通过房地坐落的分词匹配算法,将土地调查数据中的宗地统一编号和房产调查数据中的房屋幢号、室号等关键信息,互填到对方数据库中。对农村宅基地,利用房屋建筑面积与土地面积间明确的比例关系,在房地坐落分词匹配算法的基础上,给出基于面积比的匹配,细化房产和土地历史调查数据的关联关系。
分析表明:房地登记过程包括总登记、初始登记、转移登记、他项权利登记、查封登记和注销登记等,这个周期过程给出了房地权利的设立、转移、限制等过程。通过提炼总结,可建立房地流转生命周期模型。之后,利用面向对象开发技术,建立不动产数据整合模型系统,实现房产数据和土地历史业务数据整合。
3 数据整合方法
3.1 房地历史调查数据整合方法
房地历史调查数据主要包括房屋调查数据和地籍调查数据。房屋调查基本单元主要包括丘、幢、层、户,地籍调查的基本单元主要为宗地。本文根据房屋和土地调查的共同要素:坐落,来建立房地历史调查数据的关联关系。
3.1.1基于房地坐落分词匹配算法的调查数据匹配
(1)房地坐落分词
房地坐落分词基本原理是:首先,建立一个包含所有可能出现的地名特征词,如:“区、县、乡、路和街”等的词典。其次,对待拆分的字串S,按照从左往右的顺序截取S的子串,若该子串与词典中的特征词一致,则认为该子串是特征词,将其从文本中拆分出来,并截取剩余部分,直到剩余部分为空;若失败,则按照前面的规则,继续重新截取S的子串。重复上述过程,将房地坐落数据一一进行拆分,直至全部完成[2]。
(2)房地坐落匹配
房地坐落匹配是将分词后的土地坐落与房屋坐落,从地址的最高级地名开始,直至最小基本单位,依次往下进行相同级别的地名对比[3],完全相同则房地坐落数据匹配成功,否则,匹配失败。
3.1.2房地历史调查数据关联关系构建及实现
结合上述基于房地坐落的分词匹配算法,从整体的角度,结合面向对象技术,建立房地历史调查数据的关联关系,同时将房地坐落位置分词和匹配算法进行代码实现
图1 不动产业务流转生命周期模型图
3.2 房地历史业务数据整合方法
房地业务数据是以房地初始登记为起点,在经过一系列的买卖、赠与、转让等交易方式后,房地产权发生了流转而产生的一系列的数据[4]。根据房地历史业务数据的时间节点特点和房屋所有权和土地使用权产生、买卖转让、抵押到注销等各个阶段的权利流转特征,提出了房地权利流转生命周期模型,梳理了房产和土地登记业务,建立了房产和土地历史业务数据的关联关系。
3.2.1房地权利流转生命周期模型
本研究所给出的房地权利流转生命周期模型,从整体角度,展示了不动产权利随时间变化的过程,如图1所示。图1将房屋和土地业务办理具体分为6个阶段:在建工程阶段、商品房预售阶段、初始登记、商品房销售阶段、房屋二手买卖阶段以及注销登记。每一阶段内,房地业务办理都具有内在逻辑关系。
该模型以房屋产权和土地使用权的业务流转为线索,整合房地业务数据资源,实现由房屋和土地空间位置“点”,到产生权利周期的“线”,到查看房地综合管理业务“面”的多层次、多视图的房地信息整合共享模式。
3.2.2房地业务数据整合实现
在房地权利流转生命周期模型的基础上,分析房产和土地历史业务数据的逻辑关系,提出房产和土地历史业务数据整合逻辑模型,利用面向对象的编程技术,实现房产和土地历史业务数据的整合。
表2 房地业务流转周期模型实现
4 房地历史数据整合的实践
4.1实验数据来源及分析
试验区的房地历史数据分别由国土局和房产交易中心提供。国土局提供的数据包括地籍调查数据、土地登记业务数据以及用于房地整合参考的1:1000地形图、宗地分布图和城市地籍区、地籍子区等数据。国土局提供的地籍数据库分析后发现,该数据库存在问题:1)独立宗地和土地坐落之间没有形成一对一对应关系,一个门牌号内可能包括多个宗地。2)由于房产数据缺少完整的平面图,房产坐落在地籍登记时,存在许多不规范的问题。
房产交易中心提供了2017年5月2日前的房产数据,主要包括房产调查表、记录清单和房产平面图和房屋产权交易业务数据。该数据库共计25张属性表、记录数约20多万条。房产数据也存在问题,主要表现在:1)数据存在杂质。房屋基本记录条数达576611,但是存在其他非本辖区的数据资料。2)重要字段缺省。和地籍数据一样,房产数据的一些重要信息字段存在空值,如户信息表中户型结构字段,幢信息表中的丘权号、实测建筑面积、实测专有面积和实测分摊建筑面积等都为空。3)房屋坐落无或无法定位。空房屋坐落记录数达123条,无法在1:500地图上进行定位的约24000条记录,房屋案例表中的房屋坐落信息与房产调查中的房屋坐落也不完全匹配。
4.2房地整合过程及结果
在整合过程中,业主单位提供了房地历史数据整合标准。这个《标准》与国家不动产数据建库标准基本一致,也作了一些补充。不过这些补充,破坏了数据库范式要求。
(1)调查数据整合
原房产调查数据库中,房屋户室记录为270347,宗地宗数为26782宗。利用房地坐落分词匹配算法,完成了数据匹配,匹配率达到90%。另外10%的房地调查数据未能匹配成功的原因是因为1)土地坐落的描述范围过大或不实。由于数据资料不规范,部分工业企业、特别是集团企业,其名下的房屋坐落地址多填写工商注册地址,与实际坐落不一致,无法落地到地形图上。部分企业其名下的房屋坐落描述空间过大,例如房屋坐落就填写了南京市。2) 土地设宗与房屋登记设丘不一致。
对于这些数据未能完成整合的的宗地和房屋数据,一个方案是进行补充调查,将新调查资料与历史数据库进行有效匹配。另一个方案是建立预留问题数据库,在今后的日常变更登记中逐步完善。
(2)业务数据整合
原房产调查数据库中,已经完成初始登记、转移登记、抵押查封登记的房屋户室为423211。利用已经建立的房地一体化调查数据,基于生命周期模型,以房屋户室为单位,提取每一户初始登记、变更登记、抵押查封、抵押注销、解封等信息资料,形成了一条完整的房产登记数据链。
(3)数据入库与原库进行比较
将整合后的房地调查数据、业务数据,参照不动产统一登记数据库标准进行数据转换入库。然后编制计算机软件系统,随机提取10%的房屋户室和原房屋、土地数据进行对比,准确率达99.4%,数据整合符合合同要求。
5 结语
本文基于房地调查单元和调查内容,提出了基于房地坐落的分词匹配算法,探讨了房地历史调查数据整合方法;从房地权利流转出发,研究了房地历史业务数据整合方法。并以某地区房地历史数据整合为实例,验证了方法。结果表明:上述方法可高效解决房地数据的整合,方法可靠。
参考文献
[1]黄锦凤,邹峥嵘. 基于Geodatabase的数字房产数据整合研究与应用[J]. 测绘信息与工程.2011(01): 21-23.
[2]张雪英,闾国年, 李伯秋等. 基于规则的中文地址要素解析方法[J]. 地球信息科学学报. 2010(01): 9-16.
[3]臧英斐.基于语义分析的地址匹配研究--以重庆市建筑物普查为例[D].重庆交通大学. 2015.
[4]付丽莉,尹鹏程,李钢等. 基于任务协同的房地登记数据整合模式研究[J].中国土地科学.2015(02): 82-88.
论文作者:唐记城
论文发表刊物:《基层建设》2018年第28期
论文发表时间:2018/11/17
标签:数据论文; 房地论文; 房屋论文; 土地论文; 房产论文; 业务论文; 不动产论文; 《基层建设》2018年第28期论文;