我国城市房地产市场划分:基于供需分布的视角,本文主要内容关键词为:房地产市场论文,供需论文,视角论文,我国论文,城市论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F061.5 文献标志码:A 文章编号:1002-5766(2014)07-140-11 房地产市场划分对于房地产的合理估值(Bourassa,Hamelink & Hoesli,1999;Goodman & Thibodeau,2003)、多样化的房地产投资组合策略(Hepsen & Vatansever,2012)以及差异化房地产调控等都非常重要。目前我国房地产市场还没有一种普遍使用的划分方式,近些年实施的“差异化”房地产调控大多是基于现有的行政区域划分(如省市自治区),或是基于经济区域划分(如东部、中部和西部)展开的。这样是否合理呢?基于这样一种思考,本文借鉴基尼系数的思想,构建房地产开发投资分布系数(IDI)和商品房销售分布系数(SDI),以此测度现有的各种区域内城市房地产市场的供需分布情况,进而评估其房地产差异化调控的合理性。参照基尼系数的简易计算公式(Pyatt,Chen & Fei,1980),得到IDI和SDI的计算公式为: 根据此公式,计算全国和各大经济区域内城市房地产市场供需分布系数,结果如表1所示。除珠三角和长三角地区以外,全国和其他各大经济区域内城市的IDI和SDI都超过基尼系数的国际警戒线水平0.4,其中,全国、京津冀和环渤海地区的IDI和SDI甚至超过了0.6,说明房地产市场在全国范围及大多数经济区域内都存在严重的“贫富分化”现象,而在需求层面表现得更为严重。 而从另一角度看,这种区域失衡也在一定程度上说明,现有的经济区域划分并不适用于房地产市场区域的划分,针对这种区域失衡的房地产市场,实施全国统一的调控政策未必能取得预想效果,反而很有可能加剧我国房地产市场发展不平衡的趋势,从而有损于民生福利和房地产市场的可持续发展。因此,需要更为合理的划分将供需资源获得能力接近的城市归到同类,从而为政府实施差异化的房地产调控政策提供基础。对此,本文基于供需分布均衡的视角,对我国城市房地产市场进行合理划分。 二、文献回顾 1.房地产市场划分相关研究 有关房地产市场划分的研究大致可以分为两种理论视角:基于消费者住房偏好影响要素层面的划分和基于房地产市场表现层面的划分(Kauko,Hooimeijer & Hakfoort,2002;Isiam & Asami,2009)。前者注重从影响房地产市场的关键因素出发,对房地产市场进行分类,是长期性的一种划分视角。后者根据房地产市场实际表现的指标对房地产市场进行划分,是一种偏短期性的划分视角。现有文献以第一种视角居多,并且大部分是针对单一城市内的房地产市场进行细分。其中,Watkins(2001)基于空间因素和结构性因素对格拉斯哥房地产市场进行了分类;Kauko,Hooimeijer & Hakfoort(2002)运用神经网络模型对芬兰赫尔辛基房地产市场进行了划分;Goodman & Thibodeau(1998,2003,2007)运用层次模型对美国达拉斯城市内部房价进行了聚类,并指出这种聚类方法可以提高特征价格模型的预测精度;Helbich,Brunauer & Hagenauer(2013)提出一个住宅市场的分类框架和地理加权回归的分类方法,基于地方的边际住宅价格水平对奥地利住宅市场进行区分,并通过运用特征价格模型的样本外预测误差来论证该方法的有效性。相对而言,针对全国层面和区域层面划分的研究较少。其中,Abraham & Goetzmann(1994)运用统计方法对美国30个大中城市房地产市场进行了划分;Goetzmann & Wachter(1995)对美国21个大中城市的办公楼市场进行了聚类分析;Hepsen & Vatansever(2012)运用多种层次聚类算法对土耳其的71个大中城市进行了聚类分析,根据租金这一指标将71个城市分为了三类。 国内专门针对房地产市场划分的研究很少。其中,中国指数研究院在自2010年以来发布的“中国地级以上城市房地产开发投资吸引力TOP10”中,基于商品房销售额、GDP和常住人口三个指标,对我国地级及以上城市进行了简单分类,将其划分为一线城市、1.5线城市、二线城市、2.5线城市、三线城市、3.5线城市及四线城市。该研究是国内首次开展覆盖全国所有地级及以上城市层面的分类,其划分依据过于简单,但结果可以为本研究提供一定的参考;Guo,Wang,Shi & Gao(2012)提出了一种综合小波分析和DBSCAN算法的时序聚类方法,并运用该方法将我国70个大中城市分为了六类。该研究是偏向第二种划分视角的聚类分析,但对于房地产市场表现的深层次原因未做探讨。本研究将综合两种划分视角,对我国地级及以上城市房地产市场进行两层次的聚类分析,以期得到更为合理的划分结果。 2.聚类算法及聚类效果评价 现有的聚类算法主要有基于划分的算法、基于层次的算法、基于密度的算法、基于图论的算法、基于模型的算法和基于格网的算法。各类算法在发现任意形状数据集、发现密度不均匀的空间、不受噪声影响、识别邻近数据集、较少依赖先验知识、时间复杂度等性能方面都各有优劣。如基于划分的算法对数据集的密度分布不敏感,可以发现密度不均匀的数据集,但聚类结果容易受噪声数据影响。再如基于图论的算法,能够发现任意形状的数据集,且不容易受噪声数据影响,但是对数据集的密度分布比较敏感,不能发现密度不均匀的数据组(Halkidi,2001)。 聚类有效性评价方法大致可以分为三大类:一是外部评价法,它将聚类算法获得的结果与数据集预先划分的结构进行比较,结果相似性程度越高,聚类效果越好;二是内部评价法,它针对数据集结构未知的情况,采用数据集固有的特征和量值对聚类结果进行评价,主要依据紧密型和分离度的原则。通常用簇内方差及相关系数进行度量;三是相对评价法,它通过比较不同算法或者同一算法不同参数设置的聚类结果来确定最佳的聚类划分。经典的相对评价指标有DUNN指数(Dunn,1974)、SD指数(Halkidi,2000)等。外部评价法和内部评价法都属于统计的方法,其应用存在一定的局限性。如外部评价法需要预先知道数据的正确分类,这在很多应用中都是很难获取的。Goodman & Thibodeau(1998,2003,2007)、Helbich,Brunauer & Hagenauer(2013)都是用特征价格模型的样本外预测精度来论证聚类的有效性,其本质上也是一种外部评价的思想。而相对评价法不需要统计检验,是当前应用最为广泛的聚类有效性评价方法。本研究将在相对评价的基础上,进一步围绕供需分布优化的思想,构建一种基于IDI和SDI指标的外部评价条件。 图1 两次聚类的分析流程 三、模型构建 1.两次聚类的分析流程 城市房地产市场表现是由其市场供需基本要素所决定的。如若两个城市占有的要素资源差不多,则从长远上看它们的房地产市场发展水平应该会接近。因此,基于影响要素层面的划分可以将长期性房地产市场发展水平趋近的城市归为一类。但是,当期的市场表现仍然受到投机(况伟大,2010)、政策调整(袁志刚、樊潇彦,2003)等其他特殊性因素的影响,处于同一要素水平的城市房地产市场可能会因为这些特殊性要素的影响而表现不一,基于市场表现层面的划分可以将短期市场表现类似的城市归为一类,以便于分析除基础要素之外的其他因素造成的城市房地产市场波动差异。这两大视角分别把握城市房地产市场的长、短期变化。 本研究兼顾两者,对我国城市房地产市场进行两大层面的聚类,其流程如图1所示。首先,基于影响要素层面进行初步聚类,将样本城市按照潜在的供需要素和基本面水平进行划分。进而,根据城市房地产市场表现进行二次聚类,将短期市场表现接近的城市归为同一子类。两次聚类流程中,都将涉及异常值处理、聚类指标筛选、聚类算法选择、聚类效果评价与筛选等关键步骤。 2.分类立方体与聚类指标筛选 对于第一种划分视角,聚类分析首先需要筛选用于聚类的指标。本文借鉴美国经济周期研究所(ECRI)提出的“经济立方体(ECC)”的思想,构建房地产市场分类立方体(如图2所示)。在此框架下,将影响房地产市场的因素分为供给要素、需求要素和基本面因素三大类。进而,围绕这三方面,从房地产经济学领域的经典文献中,总结影响房地产市场发展的关键指标。 基于文献总结,兼顾数据的可获性,共筛选出12个一次聚类指标。其中,地区生产总值、地区生产总值增长率、第二产业占GDP的比重和第三产业占GDP比重、场景为影响房地产市场的基本面因素,用于表征经济总量、增量和结构性特征(Quigley,1999;况伟大,2010;沈悦、刘洪玉,2004等)。年末总人口、人口自然增长率、城乡居民储蓄年末余额、职工平均工资为影响房地产市场需求的关键因素,用以表征人口存量和增量、居民购买能力(Mankiw & Weil,1989;Hort,1998;李健元、孙刚、李刚,2011;陈斌开、徐帆、谭力,2012等)。当年实际使用外资余额、单位从业人数、行政区域土地面积、年末金融机构存款余额为影响房地产市场供给的关键因素,用于表征房地产相关供给要素的增量和存量水平(Peng & Wheaton,1994;张金清、吴有红,2009;王松涛,2009)。对于二次聚类,运用房地产开发投资额、商品房销售额和商品房销售价格为聚类指标,在一次聚类的基础上,从房地产市场的实际表现进行二次聚类。 3.聚类算法选择与相对评价条件 鉴于六大类算法各有优缺点,本研究将综合运用六大类算法中的经典算法,即K-means(Mac Queen,1967)、层次聚类(Theodoridis & Koutroubas,1999)、DBSCAN(Ester,Kriegel & Sander,1996)、MST(Zahn,1971)、SOM(Kohonen,1995)和WaveCluster(Sheikholeslami等,1998),对城市房地产市场进行聚类。这些算法在性能上能够相互补充(如表2所示),从而充分保证聚类结果的合理性。 图2 房地产市场分类立方体 在运用六种算法进行初步聚类之后,选用相对评价指标——SD指数对初步聚类结果进行筛选。SD指数是基于类内的平均离散度和类间的总体分离性进行定义的,其公式如下: Halkidi(2000)指出,SD指数可以用来确定最佳类别数,当SD指数达到局部最优,并且满足下式时,则为最佳的类别数。 4.供需分布优化与外部评价条件 被划归为一类的城市的供需资源获得能力应该接近,即同类城市供给房地产和购买房地产的能力接近。因此,合理的房地产市场划分,应该是寻找到一种分类方式,使得到的各类区域内城市的房地产开发投资额和商品房销售额分布比较平均。在这种供需资源分布优化的思想下,运用IDI和SDI作为外部评价指标,从满足相对评价条件最优的六种结果中选取IDI和SDI相对最小的分类结果。公式如下: 类内的IDI和SDI越小,则表示该类内城市的供需资源分布越平均,所得聚类效果越好。 在此基础上,进一步设定外部评价指标的阀值,即聚类过程的终止条件。根据收入分配基尼系数的评价标准判断,一般认为低于0.2的基尼系数表明绝对平均,0.2~0.3表示比较平均,0.3~0.4表示相对合理,0.4~0.5表示差距加大,0.5以上则代表严重分化(刘洪玉等,2013)。据此,本研究选取0.3作为外部评价指标的阀值,当各类区域内的IDI和SDI值都小于0.3,则停止聚类过程,所得聚类结果为最终结果。这种基于IDI和SDI的外部评价条件具有统计上的意义,也有相应的经济意义,是对相对评价条件的补充。并且,相对Goodman & Thibodeau(1998,2003,2007)、Helbich,Brunauer & Hagenauer(2013)提出的基于特征价格模型样本外预测精度的外部评价方法,IDI和SDI指标计算相对简单,对数据的要求远低于特征价格模型,是一种更为经济的评价方法。 四、实证分析 1.数据说明与预处理 样本城市包括除西藏以外的30省、市、自治区283个地级及以上城市,通过从中国经济信息网、CEIC数据库、各省市自治区统计年鉴、中国城市统计年鉴、中国指数研究院等数据库收集各城市2009-2011年度的指标数据,对其求平均值,并对各指标数据进行标准化处理,以消除量纲影响。 场景指数这一指标需要利用场景数据进行编制。场景理论指出场景用于衡量城市的宜居性,主要考虑教育文化设施、娱乐设施、医疗设施等方面。本研究选择城市普通高等学校数量、普通中学数量、小学数量、高等学校教师数、普通中学教师数、小学教师数、剧场和影剧院数、每百人公共图书馆藏书、医院和卫生院数、医院和卫生院床位数、医生数、每万人拥有公共汽车、人均城市道路面积、建成区绿化覆盖率等场景指标,运用因子赋权的方法进行编制。 由于聚类结果易受到异常值干扰,因此,在两次聚类之前,都将根据拉依达准则(3σ准则)进行奇异值处理,筛出有指标异常表现的城市进行单独分析,再对剩下的样本城市房地产市场进行聚类分析。 2.异常要素城市分析 基于2009-2011年各指标的平均值,对样本城市进行异常值处理,借此从283个城市中剔出25个异常表现的城市,这些城市都是指标水平远在所有城市平均水平之上或之下的城市群。它们的IDI和SDI分别为0.6110和0.6225,远大于0.3的阀值水平,需要进一步划分。 首先,分别运用K-means、SOM、Hierarchical、MST、DBSCAN和WaveCluster六种算法对25个异常要素城市进行一次聚类分析。针对每一类算法得到的结果,运用相对评价指标SD指数进行择优筛选,得出前5种算法的最佳类别数都为2类,而基于WaveCluster算法没有得到聚类结果,Hierarchical 和MST算法得到的结果一致。进而,针对每种算法各自的择优结果,计算其平均IDI值和SDI值,从中可知,运用Hierarchical和MST算法得出的聚类结果平均IDI值和SDI值最小,为相对最优的聚类结果(如表3所示)。它们将25个城市初步划分为2组,第1组包括北京市和上海市,其IDI值和SDI值都达到了终止条件的要求,归为最终结果的一个子类。第2组包括剩余的23个城市,其IDI值和SDI值分别为0.5974和0.5981,未满足终止条件,进入二次聚类过程。 进而,对23个城市进行市场表现层面的二次聚类,根据相对评价条件和外部评价条件可得(如表3所示),基于K-means、Hierarchical和DBSCAN算法的结果一致,为最优结果。它们将第2组城市进一步划分为3个子类,其中有1个子类IDI值和SDI值满足终止条件,为最终结果中的一个子类。对其他2个子类,进行异常值处理和再聚类,最终得到另外3个子类。 最终,异常要素水平的25个城市被划归为4个子类,各子类的IDI值和SDI值都在0.3以下,达到了终止聚类的要求。其中,第一个子类为北京市和上海市,其房地产市场规模和价格都远高于其他城市。第二个子类为广州市、深圳市、天津市等10个城市,这类城市是房地产供需规模和价格仅次于第1个子类的城市群。第三个子类为贺州市、黑河市等7个城市,它们是房地产市场发展水平低下、房价偏低的城市群。第四个子类为防城港市和玉林市,其房地产市场供需基础较好,房价偏低,有较大的上涨空间。 3.常规要素城市分析 在剔出异常要素城市后,运用六种算法对258个常规要素城市进行一次聚类分析。根据相对评价条件和外部评价条件可得(如表4所示),基于K-means算法的聚类结果为最优结果,它将258个城市初步划分为2组。 第1组23个城市的IDI值和SDI值分别为0.2440和0.2430,都小于阀值0.3,说明不需要对该组城市进行二次聚类,这23个城市可以列为最终结果中的一个子类。第2组235个城市的IDI值和SDI值分别为0.4337和0.4730,均大于阀值0.3,说明这组城市的供需分布情况未达到要求,需要进一步根据房地产市场表现进行二次聚类。 对第2组城市的房地产市场表现做异常值分析,剔出11个异常表现城市,它们都是房地产供需规模和价格都远在第2组其他224个城市之上的城市群。这11个城市的IDI值和SDI值分别为0.2049和0.1756,都低于0.3的阀值水平,可以被归为最终结果中的一个子类。而剩余的224个城市的IDI值和SDI值都未满足终止条件,需要进一步的划分。 在剔出异常表现城市后,运用六种算法对224个常规表现城市进行二次聚类分析。根据相对评价条件和外部评价条件可得(如表5所示),基于K-means算法的结果为最优结果,其将224个城市归为3组,第2-1组包括鞍山市、包头市、海口市等19个城市,它们的IDI值和SDI值满足终止条件,可以归为最终结果的1个子类。第2-2组为桂林市、临沂市、北海市等69个城市,它们的IDI值和SDI值满足终止条件,可以归为一类。第2-3组为剩余的136个城市,它们的IDI值和SDI值分别为0.3207和0.3158,未达到终止条件要求,需要进一步划分。 将第2-3组136个城市返回二次聚类流程,根据相对评价条件和外部评价条件可得,基于SOM算法的结果为最优结果,其将第2-3组的132个城市划分为四类,第一类为宝鸡市、亳州市等58个城市;第二类为安阳市、滨州市等22个城市;第三类为汉中市、广安市等21个城市;第四类为安康市、白银市等65个城市。它们的IDI值和SDI值都满足终止条件的要求,不需要进一步的划分。 4.结果分析与讨论 经过两次聚类过程,从供需要素水平和房地产市场表现两个层面对我国城市房地产市场进行了划分。283个城市房地产市场最终被划归为三大类区域、13个子类城市群(如表6所示)。 其中,重点调控区域包括子类1~子类6的52个城市。子类1和子类2是GDP、资金、场景及居民购买力等要素水平远在其他城市之上的城市群。 子类1中的北京市和上海市分别是我国的政治文化中心和经济金融中心,其房地产市场发展水平高,供需规模庞大,但供不应求的失衡情况严重,城市房价处于相当高位。 子类2以广州市、深圳市、杭州市、天津市等经济发展好的大城市为主,其中,广州市和深圳市房地产市场规模仅次于北京市和上海市,房价处于高位。杭州市在经济总量上及其他供需要素上虽次于广州市和深圳市,但因其是南部城市中的佼佼者及长三角地区的核心城市,由此房地产市场规模大,房价甚至高于广州市。天津市和重庆市都是直辖市,经济总量上不亚于广州市和深圳市,但房地产市场规模不及两者,重庆市房价则处于子类2城市的末位。其他如成都市、大连市、青岛市、沈阳市等城市供需基础面良好,房地产市场供需规模大,且仍有较大的提升空间。 子类3是以武汉市、唐山市、佛山市、济南市、长春市等省会城市或大中城市为代表,这些城市经济发展水平良好,房地产市场规模大,房价较高。 子类4是房地产市场发展水平要高于当地经济基本面和供需要素水平的城市,以鄂尔多斯市、绍兴市、台州市等为代表。其中,鄂尔多斯是典型的投资过热的城市,且最终在2012年经历了房价的暴跌。其他城市则大多是房地产需求相对较为旺盛。 在子类5的城市中,三亚市是国际旅游都市,城市开放度高,房地产市场发展快于当地经济,房价甚至高过上海市。温州市是影子银行最为发达的城市之一,当地投资投机资金充裕,房地产市场发展迅猛,房价也高过上海市。绥化市和营口市也是房地产市场与经济不协调的典型城市,其房地产市场规模相对要素基本面偏大,房价水平在低要素城市中在高位。 子类6的防城港市和玉林市房地产市场发展与当地经济发展出现不协调,它们的基础要素水平与大多数适度扶持区域内的城市接近,但房地产开发投资额和商品房销售额要远高于适度扶持区域内的城市,房价水平在低要素城市中处于较高位。 稳定发展区域包括子类7~子类9的116个城市,它们都是房地产市场规模适中、供需基本平衡、房价处于中位的城市。值得关注的是,子类7中的鞍山市、呼和浩特市、芜湖市房地产市场都存在一定程度的供过于求的现象。而包头市、湖州市、台州市、扬州市、中山市、海口市房地产需求相对较为旺盛,房价在同要素水平城市中相对较高。子类8中的保定市和子类9中的大同市房地产开发投资额都要远高于房地产需求。 适度扶持区域包括子类10~子类13的115个城市,它们都是房地产市场欠发达的城市。其中,大部分城市房地产需求相对要低于当地的房地产供给,部分城市情况较为突出,如子类10中的周口市、通化市和许昌市,及子类11中的永州市、百色市和梧州市。子类12中的城市房地产市场供需存量都较低,且基本平衡。子类13中的城市供需要素水平最低,房地产市场发展较为落后,房价较低。 5.政策启示 根据各子类城市群的供需要素水平和实际市场表现,可以分别设计差异化的调控目标和调控策略。同时,城市配套的金融政策、土地政策、劳动力引进政策、基础设施建设、人口政策及产业政策等,也可参考房地产调控目标进行合理制定(如表7所示)。 针对重点调控区域内的城市,坚持实施从紧的调控政策,其调控目标是适度控制房地产供给和需求规模,抑制房价过快增长。其中,对子类1中的北京、上海和子类2中的广州、深圳等城市,需要注重供需结构调整,重点在优化供给结构和供给规模。而子类5中的城市是房地产市场发展要快于当地经济基础水平、房价虚高的城市,当地投资投机性需求旺盛,需要严厉控制。对其他子类城市的调控力度可略低于这三类城市。 针对稳定发展区域的城市,实时监控房地产市场运行情况,重在稳定当地的房价水平,不需要加大调控力度。但是,对于子类7中的鞍山市、呼和浩特市、芜湖市等存在一定程度的供过于求现象的城市,以及子类8中的保定市和子类9中的大同市等房地产开发投资额都要远高于房地产需求的城市,需要重点关注,避免出现类似子类4中鄂尔多斯投资过热的情况。而对于诸如包头市、湖州市、台州市、扬州市、中山市、海口市房地产需求相对较为旺盛的城市,则要避免出现非理性需求的增长。 针对适度扶持区域的城市,应该适度放松调控,刺激和支持当地居民的购房需求,扶持当地房地产业和房地产市场的发展。但对于子类10中的周口市、通化市和许昌市,及子类11中的永州市、百色市和梧州市等城市,应该以刺激需求为主,注意避免产生类似子类6的防城港市和玉林市投资过热的现象。 在具体实施过程中,地方政府可做一定调整。如目前温州房价已经开始下降、三亚房价也出现松动,当地政府对其调控力度可以适度降低,谨防房地产市场硬着陆带来的风险。此外,针对同一子类的城市也可有适当的差异化调整。如天津市、重庆市、成都市、大连市、青岛市等城市与广州市和深圳市同属子类2,供需要素水平接近,但房地产市场表现略有差异,对这些城市的调控力度要低于广州市和深圳市。 五、结论与展望 本文借鉴基尼系数的思想,提出了一种分析房地产市场区域性特征的全新视角,并从供需资源分布优化的角度探索了我国城市房地产市场的合理划分方式。首先,通过构建城市房地产市场分布情况的测度指标——投资分布系数(IDI)和销售分布系数(SDI),论证了我国房地产市场进行划分的必要性。进而,围绕房地产市场供需分布优化的思想,设计了两次聚类的分析流程,综合运用多种算法对我国地级及以上城市房地产市场进行了聚类分析,最终将283个地级及以上城市归为3大类、13个子类市场,并针对各子类市场的表现设计了分类调控政策。本研究的创新之处体现在:基于供需分布优化的聚类思想、从影响要素到市场表现的两次聚类流程、用于指标筛选的房地产市场分类立方体,以及能够兼顾统计特性和经济意义的IDI和SDI外部评价指标。而从应用层面上讲,本研究的划分结果可以为政府实施差异化调控提供基础框架和参考。当然,城市房地产市场在不断发展中,而本研究是一种静态的聚类分析,未能涵盖房地产市场的短期动态变化。在未来的研究中,将考虑房地产市场在时间维度上的聚类,如对房价波动趋势进行时间聚类,以及考虑聚类结果的动态变化,以实现对房地产市场子类的动态监控。标签:聚类论文; 楼市调控论文; 重庆房价论文; 条件分布论文; 要素市场论文; 房地产业论文; 购房论文; 调控论文;