基于地理加权回归的上海市房价空间分异及其影响因素研究_房价论文

基于地理加权回归的上海市房价空间分异及其影响因子研究,本文主要内容关键词为:上海市论文,因子论文,房价论文,地理论文,空间论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:F293.3 文献标识码:A 文章编号:1000-8462(2012)02-0052-07

修回时间:2011-12-03

近年来,随着城市化进程加速发展,房地产市场发展进入新阶段,大中城市房价上涨过快,城市房价的波动和空间分异越来越受到社会各界的关注。本文试图利用地理加权回归的方法来定量分析上海房价的数据,进而研究大都市的上海房价空间分异结构及其影响因子,从而为相关部门规范当前过热的片区房地产市场提供依据。

1 文献回顾

无论是国内还是国外对城市房价的研究都是广泛而又深入,他们分别从不同维度来分析房价问题。总体来说,主要有以下两种方法来解释城市住房市场中房价的波动和空间分异[1]。首先,从宏观角度来讲,主要集中在国家财政和货币政策如何来影响房价,其分别从供给和需求两方面来加以探讨[2]。需求方面主要从人口和经济增长着手,供给方面则主要从土地供给和房地产市场的收益率等因素来考虑[3-5]。其次,从微观角度来看,城市房价的微观分析使用了各种价格模型,房价被分解成单独的因子来决定价格[6]。房屋的户型,区位和其他一些因素通常被认为是影响房价的重要因子。包括上面提到的宏微观的方法都被用来研究房价在不同时段不同区位是如何来影响房价的空间分异特征[7-8]。

随着地理信息技术的不断发展,空间分析方法也有了极大的提高。英国学者Fotheringham提出了地理加权回归模型(Geographical Weighted Regression),该模型是用于研究空间关系的一种新方法。许多空间问题都用GWR的方法可以很好的解决,它被认为是一种非常有效的方法来揭示被观测者空间非平稳性和空间依赖,城市房价的空间分异正好具有这种特征[9]。苏方林在对R&D知识生产进行参数估计时,得出GWR模型要比OLS模型更显著[10]。李志(2009)等得出GWR模型可以改进传统空间回归方法,能对城市地价影响因素边际价格作用空间变化性进行良好的估计[1]。吕萍等利用GWR模型探索了不同影响因素对北京市住宅用地价格的影响及其空间差异性[12]。这些研究都进一步证实GWR模型是一种很好的方法,在用GWR分析房价空间分布,尤其是对于上海这样的大都市来说,目前涉猎的研究者较少。本文拟以上海市为例,试图通过运用GIS结合GWR的方法对这些因素进行定量分析,旨在进一步研究房价的空间分异规律,为城市的科学规划和和谐发展提供依据。

2 数据来源和研究区域

目前,住宅是上海市房地产的主导类型。本文数据来源于一个非常著名的房产交易网站——安居客(www.anjuke.com)。按照该网站上把住宅分为公寓、老公房、新里洋房、别墅和其它等多种物业类型,但公寓占有绝大部分比重,达到75%,其数量多,空间分布广,因此本文选择公寓作为本文研究的对象(本文未说明的房价均指公寓的价格)以更具有代表性。通过在“安居客”网站上查找上海市外环以内各小区二手房屋(外环以内每年新建住宅不多,建设用地有限),包括小区名称、具体位置、建成时间、绿化率、小区均价等数据。该网站提供的数据比较详尽,所有数据均为2010年12月份该小区房屋的均价,共收集数据1014个。

关于我国房屋市场的价格数据,一般有两类:一是房屋的实际交易销售价格,二是市场列出的价格。房屋实际交易销售价格是由各个城市的房屋交易管理中心管理,对公众公布的只是房屋销售价格的平均数据,具体单个房屋交易以及各类地理单元房屋销售价格不对外公布。各类房屋中介机构同样也掌握所参与房屋交易的销售价格,但这些数据一方面是商业秘密,其次,由于房屋中介机构的规模大小不一,地理覆盖有限,单个中介机构提供的房屋销售数据往往不能覆盖所有的需要研究的地理单元。所以,对中国城市房屋价格的地理分布的研究,往往依赖于房屋市场列出价格。由于传统媒体登出的房屋价格分散零乱,不仅收集完全数据的可能性小,同时很难获得足够的样本数据计算出居住小区的平均价格,但互联网房屋搜索网为收集城市房屋市场列出价格提供了可能。在采集上海房屋价格数据的过程中,我们选择了“安居客”作为基础数据的来源。成立于2007年4月的“安居客”到2009年底已经成为中国最大的房屋信息网站。其发布的租售房源超过100万套,上海地区每10笔二手房交易就有3笔来自安居客[13]。同时,“安居客”也是唯一提供小区房屋历史平均价格的网站,选择“安居客”网站作为基础数据来源不仅仅是因为其在房屋列出价格提供方面的权威性与系统性,同时也在其数据的可靠性。在“安居客”上有正式经纪人会员近3万人,我们将网站上登出的最新房屋价格随机地给房屋经纪人打电话核实,除去房屋已经售出以外,信息基本正确。

此外,所收集到的公园、地铁站点、学校、大型超市和CBD均为各权威官方网站上所找到的最新数据。对所收集到的数据均通过ArcGIS建立空间数据库,并建立相应的点图层,每个属性数据包括小区名称,房屋均价和具体位置等。

本文以上海市外环以内为研究区域,该区域涵盖了上海市10个中心区、2个近郊区,面积663.5,虽然只占上海市总面积的10%,但确是上海市集中成片的城市化区域,也是居民点最为集中分布的区域,对此区域的研究可以最大程度的反映上海市房价住宅空间分异的规律。

3 模型与方法

传统的回归模型是建立在最小二乘法基础上对参数进行估计,OLS在定义了全局因变量和自变量x关系后,i通过最小误差平法和来得出方程参数的估计值。根据Tobler地理学第一定律,地球上的任何事物与其它事物的关系都是距离近的比距离远的关系更大。平稳性假设嵌入到OLS的方法中在地理推理中通常是有问题的。为了解决这个问题,地理加权回归容许一些不平稳的数据直接被模拟,GWR容许局部参数估计而不是全局参数估计。特定区位的回归参数不再是从信息上获得的全部任意参数,而是使用邻近数据的观测值来估计局部回归,这个变量随着空间位置的变化而变化,可以用GWR模型表示为:

β

式中:b是带宽,带宽的建立对GWR模型来说非常重要,带宽的大小直接影响了GWR模型的空间变化。为了取得最优带宽,Fotheringham提出一个标准,当GWR模型的赤池信息准则是最小时,带宽b为最佳。

图1 上海外环内房价空间分异3D展示图

Fig.1 3D visualization of housing price distribution in Shanghai

4 OLS和GWR估计的结果

在建立模型和分析之前应该对房价的数据进行预检,以判断房价是否存在空间相关性。如果空间相关性确实存在,就应该考虑使用GWR方法建模,这种方法对空间度量是非常合适的。否则,整个估计方法就应该用OLS来估计模型参数。

在探测空间相关性时,一个通常使用的指数就是莫兰指数。本文也采用该方法检验房价变量的空间相关性是否存在[14]。通过利用Geoda软件计算,结果显示整个研究区域的全局自相关达到0.542,揭示了房价具有较强的集聚模式特征。房价空间数据被分析后,结果显示房价的数据被曲解。房价数据的对数转换必须被执行,转换后的数据服从正态分布。在对数转换后,莫兰指数达到0.6099,而且大多数点都落在第一和第三象限。

图1展示了上海外环以内房价的3D展示图,可以看出空间集聚特征明显。空间相关的局部指标显示在研究范围内,高地价正相关区集聚在南京路和淮海路沿线,低地价正相关区则处于研究区外围,总体趋势是以人民广场为核心呈现向四周逐渐递减的趋势,并在局部地区发生变异。

借鉴以往学者对房价区位影响因素的研究经验,对房价区位影响因素主要包括距地铁站点的距离,距CBD的距离,距大超市的距离,距学校的距离[15]。本文首次尝试引入了小区的内生变量,包括小区的绿化率和建成时间。根据以上影响因素,构建GWR模型可以表示为:

首先,根据OLS回归结果,模型整体上是显著的,表明该模型能解释上海房价总变异的40.8%。从图2的OLS残差图可以看出,整个模型具有很高的空间自相关,莫兰指数也证实了这种视觉上的估计。通过分析表明OLS的回归结果存在着较大的偏差,全局模型建立在OLS方法上是不合适的,因为存在着较强的空间相关性。

图2 OLS残差图

Fig.2 Residual Plot of OLS

其次,当模型使用了地理加权回归的方法,对房价的解释力度就有了很大的提高。GWR模型是建立在可调整Bi-squared核函数的基础上是以局部系数10%来估计的,GWR在统计上非常显著,它可以解释上海房价总变异的66.6%。与OLS的结果相比,残差也由51.31下降到25.09,Sigma在统计学上的标准也有显著的下降。与此同时,GWR的赤池信息准则比OLS的也有明显下降,从-530.9下降到-129.8。按照Fotheringham提出的评价标准,只要两者之差大于3,即为最佳带宽。即使把GWR模型的复杂性考虑在内,GWR模型也要远比OLS模型更好,该模型两者之差远远超过该值。图3展示的是GWR的残差空间分布,这时空间自相关虽然仍然在残差中存在,但是要低于OLS的方法。

图3 GWR残差图

Fig.3 Residual Plot of GWR

表2和表3列出了OLS和GWR估计的回归系数,从所选择的四个影响因子OLS估计来说,距地铁站的距离、距CBD的距离、绿化率和建成时间都是显著的,但是其它三个影响因子,距大超市、距公园和距学校是不显著的。所有OLS模型估计的系数都可以从表2中可以看出来。

来自局部GWR估计系数可以很好的揭示出房价和各影响因子之间复杂的关系,每一个影响因子对房价的影响是随着区位的变化而变化,而一些因子诸如绿化率在不同程度上有着一致的影响,还有一些因子在上海特定的区位上对房价则有着不同的影响。为了揭示房价和它们影响因子与特定区位之间的关系,下面的部分将是展开利用GWR对系数的估计。

5 GWR模型各影响因子系数的分布

5.1 小区内生变量对房价的影响

绿化率和建成时间是小区内生因素对房价的影响,它们也是影响房价最重要的因子。在上海外环以内绿化率表现得尤为明显,绿化率与房价有着非常紧密的联系。表现为绿化率每提高1%,房屋的均价将会提高0.4%,可能的解释是在上海外环以内是人口密集和集中建成的连片城市区域,这里居住环境不是十分理想,绿地也就显得尤为稀缺。因此,城市内部小区的绿地也就变成了非常昂贵的资源。这也与实际的情况相符合,凡是高档小区,其绿化率明显高于其它小区。然而,从图4也可以进一步验证,小区绿地对房价的影响并不相一致,最高影响集中在虹桥,它属于上海最为集中的高档社区之一,而较弱的则位于上海西北部的桃浦和黄浦江南岸。

房屋的建成时间对房价的影响也是一个非常重要的因子。建成时间是与房屋的质量和有形磨损有关,房价会伴随着建成时间每年减低0.89%。从图5可以看出,在城市的中心,诸如传统的别墅区域,房屋的建成时间对房价的影响并不遵循这一趋势。相反,房价会随着建成时间的久远而倍增。总体来说,越远离市中心对房价的影响越明显。

5.2 CBD和大超市对房价的影响

距CBD的远近也是影响房价的重要因素。每远离CBD一公里房价就会下降7%。图6显示的是距CBD对房价的影响,距离衰减的作用非常明显。CBD对房价的影响在上海中心区域非常明显。越远离CBD,对房价的影响越开始趋向平稳。值得注意的是,由于近年来上海市副中心的快速发展,CBD对房价的影响在某些区域被打乱,尤其是在徐家汇,虹桥和五角场地区,这些地区的房价基本和人民广场附近持平,有些甚至超过人民广场附近,尤其是虹桥的古北片区发展势头迅猛,已逐渐形成一个集中连片的高档社区。除此之外,居民们也更加关注小区附近是否有无大超市,它也会对房价产生一定的影响,从图7可以看出,传统的CBD区域附近都有较大的超市,尤其是在人民广场和静安寺附近,对房价也会产生一定的影响,这也从一个侧面说明居民更加重视生活的便利程度。

图4 绿化率对房价的影响

Fig.4 Impacts of greening rate on the housing price

图5 建成时间对房价的影响

Fig.5 Impacts of completion year on the housing price

5.3 地铁对房价的影响

交通状况被看做是影响房价最重要的因子,尤其是在大城市,地铁站点对房价的影响尤为明显。OLS模型的结果揭示出地铁站对房价的影响是消极的,且在统计学上显著,每远离地铁站1km,房价会下降3.4%。从图8可以看出,当利用GWR来估计时,地铁对房价的影响被分解,从而揭示出这种影响对房价的影响是随着区域的变化而变化。对中心区大多数房价的影响是可以忽略的。有时,在地铁沿线往往伴随着拥挤和噪音,这些因素都会对房价起负面影响,对下四分位数的区位来说,距地铁站每公里房价会下降7%,这些区位很大程度上被分散在中心区域。上海外环内有182个地铁站,平均大约每3就有一个地铁站点,地铁站点的密集使对某些区域的房价影响不是那么很明显。然而,对于远离城市中心区的区域来说,靠近地铁站对房价影响很大。距离中心区越远,地铁对房价的影响越大,地铁站点附近的房价明显高于其他地区。

图6 CBD对房价的影响

Fig.6 Impacts of CBD on housing prices

图7 大超市对房价的影响

Fig.7 Impacts of supermarket on housing prices

图8 地铁站点对房价的影响

Fig.8 Impacts of Metro on Housing Prices

5.4 学校和公园对房价的影响

按照OLS估计的结果,学校和公园对房价的影响统计意义上不显著。从GWR的估算结果来看,学校对房价的影响从图9可以看出,对房价影响最强的是以静安寺为中心,呈依次向外递减的趋势。在上海,每个学区都有自己的中小学,学生只能进入自己学区的学校,尤其是重点中小学对周边房价影响极大,每远离重点学校一公里,其在学校附近下四分位数的地区房价就会下降5%。

图9 学校对房价的影响

Fig.9 Impacts of schools on housing prices

图10则展示了公园对房价的影响,每远离公园1km房价就会下降3%。在公园下四分位数附近,房价会下降更多,达到6%。有两个地段受此因素影响最大。一个是在中山公园附近,另一个是靠近上海火车站附近。对于其它地区来说,公园对房价的影响不是很明显。这可能是因为大部分公园面积都比较小,缺乏足够的吸引力,新建的小区大都建有很好的绿地和配套的健身设施,在一定程度上抵消了对周边房价的影响。

6 上海房价的未来空间趋势

图10 公园对房价的影响

Fig.10 Impacts of parks on housing prices

利用ArcGIS的地统计分析模块中的趋势分析功能,生成上海市公寓价格的空间变化趋势图。图10表明,上海市公寓价格在南北、东西2个方向上均存在明显的多中心结构,上海目前已经形成了除以人民广场为中心的单中心逐渐发展到多中心结构,由中心向边缘递减的趋势非常明显,南北向的递减幅度和东西向的变化幅度大体相当,从一个侧面反映出上海市的建设是由人民广场为中心向四周辐射,并在局部地区逐渐形成了次中心,尤其以西南片区崛起最为迅速,大有赶超主中心的趋势。

图11 上海外环内房价的空间变化趋势

Fig.11 Spatial variations in housing price trend in the inner city of Shanghai

7 结论和讨论

当空间数据存在自相关时,GWR模型提供了一个优于传统OLS模型的估计方法。GWR模型提供了影响房价区位因子的特定区位信息,同时可视化的工具也用地图的形式展现出来,可以更详细的呈现出城市房价的整体景观。传统的OLS方法仅仅提供的是全局参数的估计,GWR容许分解成局部参数估计,这将更深刻的揭示出房价和空间影响因子之间复杂的关系,这些都是传统OLS无法比拟的。

本研究详细地论述了除传统影响因子之外,首次增加了绿化率和建成时间两个变量,选择的传统影响因子也参阅了大量的参考文献,发现运用GWR可以更加有效地对住宅价格的空间波动趋势进行建模分析。

当然GWR是处理具有空间效应房价空间分异问题的一个很好的方法,但是在复杂的社会关系里,相邻区域间的实际联系已经不仅仅局限于空间的相连,历史文化,政策制度等也会形成虚拟空间上的关联,这方面的研究还有待学者们进一步探讨。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

基于地理加权回归的上海市房价空间分异及其影响因素研究_房价论文
下载Doc文档

猜你喜欢