中国城镇居民家庭消费性支出的聚类分析及比较研究论文

中国城镇居民家庭消费性支出的聚类分析及比较研究

林珊屹长春财经学院

摘要：随着经济发展，收入水平的提高和社会的进步，居民消费需求结构方面也发生了变化，居民消费性支出情况是衡量人民生活水平的重要标准。本文利用聚类分析的方法分析、比较我国31 个地区城镇居民消费水平的差异。

关键词：家庭消费性支出；系统聚类；K-均值聚类

引言

随着社会的不断进步与发展，尤其是国家对农村扶贫力度的不断增强，我国居民的生活水平普遍提高。但是我国各个地区的经济基础、地理环境不尽相同，导致了各地区的消费能力有所不同，为了更好地了解我国居民生活状态、明确我国城镇居民消费性支出差异的原因，并对其消费情况做出科学、准确的评价，本文采用聚类分析方法对我国31 个地区城市城镇居民消费水平的差异进行研究。

一、研究方法及数据来源

1.研究方法

聚类分析是多元统计中的方法，它依据研究对象的特征，对其进行分类并减少研究对象的数目。对于缺乏可靠历史资料的各类事物，无法确定共有多少组类别，运用聚类分析就可以将性质相近的事物归为一类。一言以蔽之，聚类分析是将研究对象划分为相对同质群组的一种统计分析技术。由于它能够很好地解决很多实际问题，因此非常受人们的重视，并且发展地很快，同时也被广泛应用到很多领域。由于被分类对象的不同及分类研究目的的不同而产生了不同的聚类方法，大体上分为系统聚类法、动态聚类法、模糊聚类法、有序样品聚类法和分解法这五大类，本篇文章选用的是系统聚类法中的类平均法、Ward 聚类法和动态聚类法中的K-均值聚类法进行分析。

From the two linear equations above,the complex amplitudes can be solved for the forward and backward propagating waves,respectively.This is actually the principle of the two-microphone method.24–26Then,according to Eq.(2),the velocity potential on the source plane is calculated as below:

图1 类平均法聚类的树形图

2.数据来源

本篇文章数据来源于2017 年《中国统计年鉴》，对2016 年我国31 个地区城镇居民人均消费性支出进行聚类分析。选取食品烟酒、衣着、居住、生活用品、交通通信、教育文化、医疗保健和其他用品这8 项指标。

二、实证分析

1.应用系统聚类法对中国城镇居民家庭消费性支出进行分析

利用统计软件SPSS V21.0，选取系统聚类法中的类平均法和Ward 法，结合8 项指标对31 个地区城镇居民消费性支出进行系统聚类，并生成树形图，如图1 和图2 所示。

第Ⅰ类：上海和北京。

使用统计软件SPSS 对8 个指标采用动态聚类法中的K-均值法进行聚类分析，在聚类之前，需要先对这8 个变量依次进行标准化处理，聚类的结果如下：

第Ⅱ类：江苏、广东、浙江。此类地区是我国东南沿海的经济发达地区，城镇居民消费水平仅次于北京和上海。

第Ⅰ类：上海和北京。北京是首都，是国家的中心城市也是国际化大都市，是全国的政治中心和文化中心，上海又是首批沿海开放城市，地处长江入海口，是长江经济带的龙头城市，东隔中国海并与日本九州岛相望，南濒杭州湾，北、西与江苏、浙江两省相接，又是中国的经济、交通、贸易、会展和航运中心，它们的地理位置决定了它们是我国经济最发达、城镇居民消费水平最高的两个直辖市。

图2 Ward 法聚类的树形图

Feasibility Study on 1 000 MW New Generation Ultra-supercritical Unit with Double Re-heating Cycles at 630 ℃ WANG Donglei,ZHANG Peng,HUO Peiqiang(33)

第Ⅱ类：天津、江苏、浙江、福建、广东。

第Ⅴ类：内蒙古、辽宁和天津。这类地区土地较为辽阔，牧业、传统工业以及旅游业较为发达，综合起来是我国经济发展水平中等城镇居民消费水平也处于中等位置。

第Ⅵ类：西藏。西藏位于中国青藏高原西南部，地势较高，属于我国相对较为落后的地区，该地区城镇居民消费也略低于其它城市。

2.应用K-均值聚类法对中国城镇居民家庭消费性支出进行分析

（2）云计算技术的应用能有效的降低油田企业信息化生产运营的成本费用。目前，我国油田企业对于信息化技术投资的力度越来越大，各项新基础设施以及系统也在不断的服务于油田，油田企业在享受信息化技术给予其便利的同时，也需要承担相对应的运维费用。所以，必须要构建数据中心平台费用，把油田内所有的数据中心基础设和运维人员整合在一起，构成相对统一的运营油田数据中心。其并不会影响到ERP核心系统的运营状态，另外其还可以有效的减少系统的运行成本费用。

从树形图结果来看，可以把我国31 个省市自治区分为如下六类，并对比各地区的八项消费指标的均值可得到下列结论：

第Ⅲ类：吉林、黑龙江、山西、宁夏、河北、甘肃、河南、湖北、陕西、青海、新疆、山东、重庆、四川、福建、湖南。这些基本上是我国北部地区以及少数中部地区，这些地区的发展水平有待提高，并且城镇居民消费情况较低。

第Ⅳ类：广西、海南、安徽、贵州、江西和云南。此类地区是我国少数民族比较集中的地区，是我国西南部地区，其经济发展相对落后。

1.图画内容生动有趣，能充分引起学生共鸣。小学低年级学生在自控能力上的表现仍与高年级学生存在一定差距，因此，教师必须保证实际教学内容可以吸引学生的关注，辅助低年级学生将注意力集中到课堂上来。以《我爸爸》这本书为例，这一绘本封面主要描绘了一位穿着睡衣的爸爸在做着可笑的鬼脸，这样的形象能很好的让学生联系到自己的爸爸，进而对绘本中的内容产生兴趣。

第Ⅲ类：西藏。

表1 类均值之间的距离

第Ⅳ类：、山西、河北、河南、湖北、陕西、广西、海南、安徽、贵州、江西和云南。

第Ⅴ类：吉林、黑龙江、内蒙古、辽宁、山东、重庆、四川、青海、新疆、湖南、甘肃、宁夏。

在这段语料中，从宾利先生对本内特太太提议的回答可以看出，宾利先生的话语中存在着明显的语用模糊现象。宾利先生想要达西先生和伊丽莎白两个人单独出门。但是他询问的却是伊丽莎白的妹妹（Kitty）是否觉得路程太远了。这种语用模糊的现象，通常使得话语的言外之意的不确定性带有一定的动机。一方面为达西先生和伊丽莎白的独处创造了条件，另一方面又从礼貌原则出发保存了伊丽莎白妹妹在对话中的面子。

类均值之间的距离列于表1，K-均值聚类的结果不同于系统聚类法，同时可以从类均值之间的距离看出类与类之间的差距。

三、结语

聚类过程中确定类的个数是聚类分析的核心问题，采用不同的聚类方法得到的聚类结果也不同，系统聚类法的主观性较强，而动态聚类法的客观性较强，为了增强结果的可信度，本文采用了系统聚类法和K-均值聚类法两种方法进行对比分析。我们可以发现：无论用哪种聚类方法，北京和上海都属于一类城市，同时西藏属于发展相对落后的城市，这与其经济基础、地理位置和发展状态密不可分。为了使各地居民消费性支出更加均衡，不仅需要国家的正确引导，同时也需要各地区政府的大力配合，充分利用本地区的特色，发展独有的特色经济。

参考文献：

[1]王学民.我国各地区城镇居民消费性支出的分析研究[J].财经研究,2002,28(1)：64-69.

[2]朱歆玥.聚类分析在研究全国城镇居民消费结构地区差异中的应用[J].统计与咨询,2008,2(1)：32-33.

[3]冯建中,何先平.基于因子和聚类分析的城镇居民家庭消费性支出应用研究[J].长江大学学报,2010,7(1)：97-100.

[4]姚琦,雷伟.全国各地区城镇居民家庭消费性支出因素的研究[J].消费经济,2015,5(1)：95-96.

[5]陈方樱.数据分析方法及spss 应用[M].北京：科学出版社,2016.

[6]杜子芳.多元统计分析[M].北京：清华大学出版社,2016.

中图分类号： F224；F126

文献识别码： A

文章编号： 1001-828X(2019)031-0005-02

标签：家庭消费性支出论文; 系统聚类论文; K-均值聚类论文; 长春财经学院论文;