基于多元回归模型对房价的探索
戴上闳
(浙江省杭州学军中学,浙江 杭州 310000)
摘要: 2003年起,我国政府对房价的调控力度逐渐加大,越来越多的年轻人为房价而忧心忡忡。而房价的增长究竟与城市的人均收入、基础设施建设等是否有无关联?本文结合前人的见解,以北京、上海两城市的相关数据通过逐步回归模型和主成分分析法选取了三个角度、十余个可能相关的因子加以分析,从而对房价有一个清晰的认识,同时根据结果提供了新的观察城市发展的角度。
关键词: 多元回归模型;房价
房价是我国社会经济发展过程中的一大热点问题和难题。自2003年6月国家出台121号文件起,我国政府开始以政策的形式对房价进行宏观压制性调控。2008年以后,各大城市的房价进入了快速增长的时期。随后,一线城市相继推出限购制度,一度压低房价。而今,优质学区房、高档科技房等房源紧张,导致价格持续飙涨,毫无消停之势。归根到底,一是我国教育事业尚不发达,家长为了学区不惜花费重金去购买学区房;二是我国环境问题严峻,高档科技房凭借自动调温、自动净化空气等优点吸引了不少有实力的买家为之买单,继而让炒房团有机可乘,致使房价越来越高。
中国地质调查局地球物理地球化学勘查研究所(物化探所)通过近1年的技术攻关,使航空电磁脉冲发射技术取得重要进展:创新研发了10 kW阵列级联式直流隔离电源、大功率电源滤波器、800 V特高压充能器,形成了具有100 kW瞬时输出功率的供电电源子系统,解决了多波发射波形控制、关断反冲抑制、过流保护、过功率保护等技术难题,成功研发了iFTEM-II型千安级航空电磁脉冲发射系统样机。
研究房价的影响因素对社会发展颇有助益。一者合理的房价可以为当地政府带来巨大的GDP贡献,促进地区经济发展,推动相关基础设施建设;二来在人们传统的生产生活观念之中,户口有着不可取代的重要地位,因而合理的房价能为当地引进更多的人才,同时促进年轻人的奋斗热情,反作用于当地的经济,达成良性循环。
北京和上海作为北方和南方的两座一线城市,在全国范围内经济发展水平高,城市基础设施较为完善,是近年来房价迅速增长的典型代表。我们希望通过分析相关因素,进而建立一个房价的预测机制,分析各个影响因素对两座城市房价增长的相关性,以回归结果为依据,从而对房价有一个清晰的认识,同时为城市的发展提供新角度和新方法。
一、文献综述
前人对房价的研究与预测已经从很多角度采用了多种方法研究得出了相关参考结果。冷建飞、高旭、朱嘉平通过研究多元线性回归的本质及作用,以1998年~2013年的民航客运量数据为基础,进行分析预测,得到了相对准确的结果。刘丽泽曾选取了房价、城市GDP、人均收入、施工面积、竣工面积等五个因子,收集了北京市2000年~2014年的数据,分别通过多元线性回归模型和ARIMA模型加以预测,与真实结果对比后发现多元线性回归模型预测的拟合度更好,ARIMA模型拟合度较低。何承朔在进行武汉市房价预测时,选取了房屋竣工面积、商品房销售面积、人均生产总值、生产总值、人员平均工资等五个自变量,以平均房价为因变量,从武汉市统计局网站收集了2008年~2016年的相关数据,通过多元线性回归模型加以分析,进行合理预测,得出的结果与真实房价拟合度很高。由此可见,不同的学者在进行建模的时候都有自己的指标选择体系和建模方法。
二、方法简介
1.回归模型
设因变量为y,k个自变量分别为x 1,x 2,…x k ,描述因变量y如何依赖于自变量为x 1,x 2,…x k 和误差项ε的方程称为多元回归模型。其一般形式可表示为:
因子4上海高等教育类=0.976×高等学校预计毕业生数+0.976×研究生毕业生数
综上所述,超声引导下的胸神经阻滞可为乳腺癌改良根治术患者提供良好的术后镇痛,减少不良反应的发生,值得临床推广应用。
该主成分对原始变量的解释程度达到了0.953。在统计学意义上认为该因子可以代替原有的两项自变量。
在以前的实践经验中不难发现,很多学生平时学习很努力而且基础知识掌握得也很踏实,但是一旦考试,成绩并不是那么的理想,而且总是会出现很多的小问题,这就是他们审题不准确的后果,找不到隐藏的信息,不能从整体把握题目.而通过这样的审题训练可以帮助学生快速地读出题目的隐藏信息,从而解答这道题,提高学生答题的准确率.
称取0.013 g甲基橙,加入1 000 mL去离子水中配置甲基橙溶液;用紫外可见分光光度计在460 nm测定加入硅酸镁、硅酸钙、硅胶、硅胶复合材料吸附剂前后吸光度。
2.逐步回归方法原理
逐步回归分析是多元回归分析中的一种方法。它往往用于建立最优或合适的回归模型,从而更加深入地研究变量之间的依赖关系。其基本思想是逐个引入新变量,每引入一个新变量时考虑是否剔除已选变量,直至不再引入新变量。此方法既保障了方程能保留影响显著的变量,又能够剔除非显著的变量。
3.主成分分析法
主成分分析是利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。主成分分析的降维的基本原理就是将一个矩阵中的样本数据投影到一个新的空间中去。
三、相关因素分析
北京、上海等一线城市经济发展较为成熟,房价相对稳定,但还是不可避免政策等因素的影响。本选题以北京、上海这两个一线城市为例,选取几个较为科学的要素加以分析,从而对房价进行预测,为之后的年轻人选择就业城市和就业方向提供一些参考依据。
首先,供求影响价格,故城市房产的供需必然会对房价产生一些影响;其次,一个城市的社会福利对人才的涌入起到了不可忽视的作用,社会福利的建设不仅能保障公民的医疗健康、教育保障,而且相关政策对创业的支持能带来良好的创业环境,让更多的年轻人愿意到该城市生活,为城市发展带来新的动力与活力;再者,城市的物价水平也对社会不同阶层的人起到了程度不同的影响,对于刚刚步入社会,经济条件较差的青年一代,自然会优先选择物价水平较低的城市发展,故城市的物价水平对其房价也有不同程度的影响。因此,本文综合前人已有的分析,我们从以下三个维度选取了影响房价的因素:城市供需、城市社会福利、城市物价水平。城市供需维度选择以下九个因素:常住人口、城镇人口、乡村人口数、出生人数、户籍人口数、高等学校预计毕业生数、研究生毕业生数、普通小学招生数、人口密度。城市社会福利维度选择以下四个因素:公园面积、人均绿地面积、人均道路面积、城市建设用地面积。城市物价水平维度选取了以下一个因素:CPI水电燃料。依据上述的影响因素,我从国家统计局、北京市统计局和上海市统计局以年为频率收集了2004年~2017年的数据。
四、建立回归模型
因子1北京人口类=0.995×常住人口+0.996×城镇人口+0.998×乡村人口数+0.981×出生人数+0.994×户籍人口数
我们利用SPSS进行数据分析与建模,在多元回归的过程中,首先,为了避免回归中的自变量共线性问题,对各个变量进行相关性分析,变量之间相关性在0.8以上的显著相关的有以下两组数据:一组是常住人口、城镇人口、乡村人口数、出生人数、户籍人口数,另一组是高等学校预计毕业生数、研究生毕业生数。
其次,结合主成分分析的方法,将具有强相关性的自变量进行主成分提取。
该主成分对原始变量的解释程度达到了0.787。在统计学意义上认为该因子可以代替原有的五项自变量。
低温等离子体净化法的原理是在外加电场的作用下,通过介质放电产生大量的高能粒子,高能粒子与有机污染物分子发生一系列复杂的等离子体物理-化学反应,从而将有机污染物降解为无毒无害的物质[16];该法是一种新型的净化工艺,可以处理甲苯废气等。低温等离子体净化法适用于处理VOCs质量分数低(1~1000 μL/L)的有机废气,与传统方法相比具有处理效率高、反应流程短等优点,但该技术还不成熟,容易造成二次污染,且能耗较高。
表1 北京市强相关性数据主成分分析结果一
表2 北京市主成分分析成分矩阵一
因此,对北京市常住人口、城镇人口、乡村人口数、出生人数、户籍人口数几项强相关性变量的主成分建模结果的因子表达是:
以上述方面作为自变量,建立有关房价的多元回归模型。
对北京数据,进行两组主成分提取,结果如下:
此次发布的报告从“中国健康养老服务的重大进展”“老年人健康养老服务需求急速增加”“中国健康养老服务发展面临的挑战”和“中国健康养老服务的发展趋势”4个方面阐述了中国健康养老发展趋势。
表3 北京市强相关性数据主成分分析结果二
表4 北京市主成分分析成分矩阵二
因此,对北京市高等学校预计毕业生数、研究生毕业生数几项强相关性变量的主成分建模结果的因子表达是:
因子2北京高等教育类=0.963×高等学校预计毕业生数+0.963×研究生毕业生数
同伴阅读活动,受益的不仅是低年级学生,高年级的同学收获也很多。他们认识到二年级的小同学并不像想的那样头脑简单,他们也有思想,他们也会思考,做他们的“老师”也有压力,要敦促自己不断提高水平。同伴阅读让同学们感到自己拥有知识值得骄傲,但是更值得骄傲的是能把自己的知识以别人乐于接受的方式传授给他人。每次参与同伴阅读,“小老师”都特别开心,觉得自己被需要,很有价值。
该主成分对原始变量的解释程度达到了0.927。在统计学意义上认为该因子可以代替原有的两项自变量。
对上海数据,也进行了两组主成分提取,结果如下:
表5 上海市强相关性数据主成分分析结果一
表6 上海市主成分分析成分矩阵一
因此,对上海市常住人口、城镇人口、乡村人口数、出生人数、户籍人口数几项强相关性变量的主成分建模结果的因子表达是:
因子3上海人口类=0.962×常住人口+0.974×城镇人口+0.954×乡村人口数+0.918×出生人数+0.992×户籍人口数
该主成分对原始变量的解释程度达到了0.922。在统计学意义上认为该因子可以代替原有的五项自变量。
表7 上海市强相关性数据主成分分析结果二
表8 上海市主成分分析成分矩阵二
重复相关性分析数次,我们确认了剩余的变量不存在数据内部的相关性问题了。
y =B 0+B 1x 1+B 2x 2+…+B k x k +ε
式中,B 0,B 1,B 2…B k 是自变量x 1,x 2,…x k 的系数,ε为误差项。
因此,对上海市高等学校预计毕业生数、研究生毕业生数几项强相关性变量的主成分建模结果的因子表达是:
接下来,将普通小学招生数、人口密度、公园面积、人均绿地面积、人均道路面积、城市建设用地面积、CPI水电燃料、因子1(人口类)、因子2(高等教育类)进行逐步回归分析。回归分析后,为了去除量纲的影响,将数据标准化,得到如下结果。
北京市房价价格指数=0.966×因子1(人口类)+0.758×城市公园面积。
两人怎么想,也没想出万全之策,本想谋求捷径,岂料处处有陷阱。唯有一个办法,就是钻戒怎么来,就让它怎么去,而且必须做得巧妙,不露声色。
通过监控能力和应用系统的建设,部分实现水量分配、水资源调度、水资源论证、取水许可、用水计划、节约用水、水功能区与水源地保护等过程的定量化、精细化管理,为各级管理部门全面及时掌握上海市水资源的状况及发展趋势提供支撑,为水资源规划配置、水资源调度方案编制、水资源应急处置中提供决策辅助支持。
上海市房价价格指数=0.943×因子3(人口类)+0.769×城市建设用地面积+0.505×城市人均公园绿地面积。
五、结论
经过多元线性回归和相关性分析后,得到了以下结论:北京市的房价与人口、城市公园面积两个因子强相关;上海市的房价与人口、城市建设用地面积、城市人均公园绿地面积三个因子强相关。两座城市重合的部分有人口和城市公园建设两方面。由此可见,人口对于一个城市的经济发展、科技发展带来的市基础性的影响。
对于城市来说,人口中包含了人才引进这一部分,只有大量优秀人才的涌入才能给城市带来新的生机,从而反作用于城市的发展,为城市带来巨大的经济效益;而城市的公园建设对房价的影响也较为明显,公园的建设代表着一个城市的绿化程度和环境管理水平,从侧面反映出了一个城市政府的管理建设和经济发展水平,适当的绿化也能让城市的整体环境得到改善,吸引更多的人才涌入。因此,不同城市要根据自己的定位制定相应的政策:对于经济发达的一线城市,应当适当控制人口,使优秀的社会精英拥有更多的机会和社会资源,政府也要适当地出台相关政策来遏制房价的盲目增长。倘若一味地追求人口数量和房价增长,就可能会出现泡沫经济的风险,同时巨大的社会压力也会使大量人才流失,从长远来看对社会经济发展是不利的;对于经济相对富裕的二线、三线城市,应当大力加强社会基础设施的建设以及公园等环境绿化的建设,更好的就业环境和空气质量往往能吸引更多的年轻人来此就业,逐渐形成良性循环,促进城市经济发展的同时也能美化环境、建设美丽城市。
对于青年一代来说,刚刚离开校园步入社会,可以适当地选择房价、物价较为合理的二线城市发展。倘若大学在北上广深等城市学习,有政府提供的相关政策支持,例如上海市的打分入户制,则可以考虑留在本地区就业,这样也能充分地利用好周围的人脉资源和就业支持。
参考文献:
[1]何承朔.基于多元线性回归建模的武汉市房价预测[J].科技经济导刊,2018,26(28):213~215.
[2]贾俊平,何晓群,金勇进.统计学(第7版)21世纪统计学系列教材[M].中国人民大学出版社,2018.
[3]冷建飞,高旭,朱嘉平.多元线性回归统计预测模型的应用[J].统计与决策,2016,(7):82~85.
[4]刘丽泽.基于多元线性回归模型及ARIMA模型的北京市房价预测[J].科技经济导刊,2018,26(29):176~177.
[5]吴昌耀,刘钰靖,谭希丽,吴旭韩,王雪婷.基于多元逐步回归对均衡房价影响因素的研究——以长春市、吉林市为例[J].东北电力大学学报,2018,38(3):90~95.
[6]张文彤.SPSS统计分析高级教程[M].高等教育出版社,2004-9.
中图分类号: F299.23
文献识别码: A
文章编号: 2096-3157(2019)18-0128-03
作者简介:
戴上闳,浙江省杭州学军中学学生。
Characteristics of Parent-Child Travel in Rural Areas under the Background of “Walking by Leading the Child” and Developing New Countermeasures___________________________CHEN Xiaolong,WANG Kai 34
标签:多元回归模型论文; 房价论文; 浙江省杭州学军中学论文;