基于spss数据分析的陕西省各地区城市建设与发展状况研究
陈智波,尹 红
(昆明理工大学 机电学院,云南 昆明 650000)
摘 要:为了研究陕西省各地区城市的建设与发展状况,本文以陕西省的11个主要城市为研究对象,选取2015年度各个地区城市的年底城市总人口数、地方财政收入、城市用水普及率、城市燃气普及率、住宅面积等15个因素作为评价指标,从陕西省统计年鉴中提取出各个城市的相关数据。采用聚类分析法(系统聚类分析、k-均值聚类分析)和主成分分析法两种多元统计学方法,运用spss软件进行分析,最后对陕西省主要地区的城市建设和发展状况进行综合评价。
关键词:城市发展;SPSS统计软件;聚类分析;主成分分析
0 引言
城市建设是城市管理的重要组成部分。城市建设以规划为依据,通过建设工程对城市人居环境进行改造,对城市系统内各物质设施进行建设,城市建设的内容包括城市系统内各个物质设施的实物形态,是为管理城市创造良好条件的基础性、阶段性工作,是过程性和周期性比较明显的一种特殊经济工作[1]。对于省内的各个城市来说,如何掌握它们现阶段的发展情况,并对之后发展做出规划,服务城市经济社会发展,真正为市民创造良好的人居环境是非常重要的。本文运用聚类分析和主成分分析法,借助spss软件进行数据分析[2],根据结果对陕西省各地区城市建设与发展状况做出分析与评价。
当然,笔者并不是说,赋予人工智能法律人格迫在眉睫。正如本文开头所言,当前人工智能的发展仍处在弱人工智能之阶段,这种情况下,试图在现有法律框架下解决人工智能带来的法律争议,既是可行的,更是可以理解的。然则,面对人工智能的飞速发展,我们也许必须保持一种开放性态度,即,不应将固守现有法律框架作为解决人工智能法律争议的前提,并因此而对其他路径遽然否定。
随着水库大坝的不断隆起,下游河道开始日渐干涸。一只只乌龟蜷缩在龟裂、僵硬的土地上艰难爬行、奄奄一息。忽然,一只野鹤翩跹而至,用细长的喙叼起一只乌龟向上游飞去,奋力飞跃大坝,将乌龟扔到水中。随后,更多的野鹤飞来,纷纷叼起乌龟,将它们叼到上游的水域中。乌龟得救了,在水中欢快地游动,野鹤们在水面上盘弋低旋,鸣叫声此起彼伏。一阵阵声情并茂的天簌交汇之后,群群野鹤才向南方飞去。这是一场动物之间的传奇盛举,它为我的家乡九台,播下了善良和爱的神奇。
1 聚类分析
聚类分析是建立一种分析方法,将一批样本和变量,按照他们在性质上的亲疏、相似程度进行分类的一种多元统计分析方法。聚类分析的内容十分丰富,按其聚类的方法可以分为:系统聚类法、动态聚类法、最优化聚类法、模糊聚类法、图论聚类法和聚类预报法[3]。
另外,按照分类对象不同可以分为R型聚类和 Q型聚类,R型是对变量进行聚类,Q型是对样本进行聚类。
在施罗德和普京的一片笑声中,希拉克还提起前北约秘书长乔治·罗伯逊请他吃过一种“令人胃口大伤”的东西(暗指苏格兰特产哈吉斯肠)。他说:“这正是北约的问题所在。”
从表9成分矩阵表可以看出,第一主成分可以看做表示经济、教育等,支持从x1,x2,x3,x4,x5,x8, x10,x11,x12,x13,x14,x15 的指标,而第二主成分支持x6,x9这两个指标。
地基处理采用3∶7灰土垫层。灰土垫层每边宽出基础外边线2.0 m,灰土厚度为2.0 m。灰土换填应分层进行夯填,符合地基处理规范。地基处理后的承载力特征值应≮200 kPa。
(1)
其中:其中表示第i个样品的第k个指标的观测值,表示第j个样品的第k个指标的观测值,为第i个样品和第j个样品之间的欧式距离。若越小,那么第i与j之间两个样品之间的性质就越来越接近。性质接近的样品就可以化为一类[5]。
2 主成分分析
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指
x1:年底总人口数(万人)、x2:地方财政收入(亿元)、x3:街道办事处(个)、x4:住宅面积(万平方米)、x5:卫生机构数(个)、x6:人均公园绿地面积(平方米)x7:城市用水普及率(%)、x8:城市燃气普及率(%)、x9:高速公路(公里)、x10:中学个数(个)、x11:社会消费品零售总额(亿元)、x12:生产总值(亿元)、x13:农林牧渔业总产值(亿元)、x14:工业企业单位个数(个)、x15:国内旅游人数(万人次)原始数据如表1所示[8]。
(1)(5)
(2)
由于可以任意地对原始变量进行上述线性变换,由不同的线性变换得到的综合变量Y的统计特性也不尽相同。因此为了取得更好的效果,我们总是希望的方差尽可能大且各Yi之间互相独立,由于:
(3)
而对任意地常数C有:
(4)
因此对ui不加限制,可使var(Yi)任意增大,问题将变得没有意义。我们将线性变换约束在下面的原则之一:
设对某一事物的研究涉及p个指标,分别用X1,X2,…,Xp表示,这p个指标构成的p维随机变量为X=(X1,X2,…,Xp)¢ 。设随机向量X的均值为μ,协方差矩阵为∑。对X进行线性变换,可以形新的综合变量,用Y表示,也就是说,新的综合变量可以由原来的变量线性表示,即满足下式[6]。
根据K-均值聚类最终得到的表6聚类成员表我们可以看出11个样本被聚为3类第一类为西安,第二类为榆林、渭南、咸阳、汉中、延安、宝鸡、安康,第三类为铜川、商洛、杨凌,由此可见两种聚类方法得到的结果是一致的。
一是灌溉组织管理。比较普遍的做法是吸纳、邀请村里有威望的村民代表(或村委会成员)作为管理员参与灌溉管理,每个村的收益果农都按照大家认可的次序进行灌溉。受益农民按照合理确定的灌溉次序,合理安排灌溉时间,一户灌溉结束时能够自觉通知到下一个灌溉农户,并自觉核对灌溉时间记录,这样以此类推,直到全村的果园全部灌溉完毕,由最后一家农户将灌溉记录反馈给管理员。这种灌溉组织方式既减少了受益农民的用水矛盾,能够互惠互利、互相帮助,还减轻了管理者的负担,可以投入更多精力管理、维护工程,保证工程持久运行和发挥效益。
(3)Y1是X1,X2,…,Xp的一切满足原则(1)的线性组合中方差最大者;Y2是与Y1不相关的X1,X2,…,Xp所有线性组合中方差最大者,…,Yp是与Y1,Y2,…,Yp-1都不相关的X1,X2,…,Xp的所有线性组合中方差最大者。
混合装配流水线的突出特征即装配工位上零部件的多样化。如图6所示,每个工作站上既有产品A的零部件,又有产品B的零部件,两种产品的零部件之间可能差距很小;同时也有通用的零部件。
基于以上三条原则决定的综合变量Y1,Y2,…,Yp分别称为原始变量的第一、第二…第P个主成分。其中,各综合变量在总方差中所占的比重依次递减。在实际研究工作中,通常只挑选几个方差最大的主成分,从而简化系统、抓住问题实质的目的[7]。
3 数据来源
所用数据均摘选自2015年陕西省统计年鉴。
选取的各个指标如下:
标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。
4 数据分析
4.1 聚类分析
利用SPSS软件首先对数据进行系统聚类分析,分析过程及结果如下[9]。
通过表3样本聚类表,我们可以看出当11个样本分别分成2个聚类和3个聚类时的样本聚类情况。
表1 原始数据
Tab.1 Raw data
数据来源:http://www.shaanxitj.gov.cn/
表2 个案处理摘要
Tab.2 Summary of case processing
a. 平方欧氏距离使用中 b. 平均联接(组间)
表3 样本聚类
Tab.3 Sample clustering
通过表2个案处理摘要表,我们可以看出,在整个聚类过程中,所选取的11个城市均参与了聚类分析过程,没有遗失或未参与的样本。这充分说明此次聚类分析已经对11个样本的各项指标进行了相似聚类,因而可以进行下一步分析。
结合表3样本归类表和图1聚类树形图,当将样本聚为3类时,我们可以得出表4的聚类结果。
接下来我们再使用K-均值聚类方法对样本进行分析:
a. 由于聚类中心中不存在变动或者仅有小幅变动,因此实现了收敛。任何中心的最大绝对坐标变动为0.000。当前迭代为2。初始中心之间的最小距离为6775.821。
(2)Yi与Yj相互无关(i≠j;j=1,2,…,p)
4.2 主成分分析
由于选取的各个指标的单位不相同,因此在进行主成分分析前需要将所有的数据进行标准化处理,经过标准化处理后的数据如表7所示。
图1 聚类树形图
Fig.1 Cluster tree
表4 聚类结果
Tab.4 Clustering results
表5 迭代记录表
Tab.5 Iterative History
表6 聚类成员表
Tab.6 Cluster membership table
将标准化后的数据导入spss中,进行主成分分析可以得到如下的表:
由表8总方差解释表可知特征根λ1=9.667,特征根λ2=2.367,前两个主成分的累积方差贡献率达到了80.229%,即涵盖了大部分信息,这表明前两个主成分能够代表最初的15个指标来分析陕西省各地区的城市发展与建设情况,故提取两个主成分即可[10],分别记为z1,z2。
聚类分析依据的基本原则是:直接比较样本中各事物之间的性质,将性质相近的的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间性质差异小,类与类之间的事物性质相差较大。描述样品间的亲属程度最常用的是距离,其中欧式距离在聚类分析中用的最广,它的表达式如下[4]。
从表10成分得分系数矩阵表,可以得到两个主成分z1,z2的线性组合方程如下所示[11]:
“糖人国的糖龙?那你来我房间干吗?快说实话,不然我就把你吃掉!”唐小果盯着糖龙,用舌头舔着嘴唇威胁道。
(6)
(7)
根据上面的两个主成分的线性组合方程,我们可以将标准化后的数据带入计算,最终可以得到表11综合得分与排名表。
表7 标准化数据表
Tab.7 Standardized data
表8 总方差解释
Tab.8 Explanation of total variance
提取方法:主成分分析法。
表9 成分矩阵
Tab.9 Component matrix
提取方法:主成分分析法。
a. 提取了2个成分。
表10 成分得分系数矩阵
Tab.10 Component score coefficient matrix
提取方法:主成分分析法。
组件得分。
表11 综合得分与排名表
Tab.11 Comprehensive scores and ranking table
在运用主成分分析方法对陕西省各地区的城市建设与发展时,我们最后选取了两个主成分因子即2个主要指标代表了15个指标进行分析,表11综合得分与排名表给出了各城市的综合得分与排名,其中综合得分为正值的,说明城市建设与发展高于平均水平,反之,综合得分为负值的,说明其城市建设与发展低于平均水平。排名一列我们可以看出11个城市在综合两个主成分因子下的排名,由大到小一次为:西安、咸阳、榆林、渭南、宝鸡、汉中、安康、延安、商洛、铜川、杨凌。
在这样的情境教学中学生扮演的角色与他的年龄特点与身份相适应,这样的命题就能相对准确地了解学生在这方面的能力。
5 结论
在进行对陕西省各地区的城市建设与发展状况进行分析时我们采用了聚类分析和主成分分析的方法,综合聚类分析和主成分分析的结果,我们可以得到下表12综合得分与聚类状况表。
表12 综合得分排名与聚类状况表
Tab.12 Comprehensive score ranking and clustering status table
从表中我们可以看出在陕西省的城市中,西安市作为陕西省的省会城市,无论在哪个方面都处于龙头地位,其城市建设与发展远远高于同地区的其他城市,不仅在综合得分上处于第一位,同时与其他城市相比自为一类。
本研究就女性免疫性不孕与慢性生殖道炎症及微量元素的关系进行探究与分析,结果显示,免疫性不孕的女性患者其阴道分泌物炎性因子(IL-6、IL-8及TNF-α)及血清铜均高于健康正常孕妇,血清硒及锌均低于健康正常孕妇,且不同分类与病程免疫性不孕者的阴道分泌物炎性因子及血清微量元素指标差异有统计学意义,Logistic分析显示,上述检测指标均与女性免疫性不孕有密切关系,进而肯定了上述指标与女性免疫性不孕的关系。其中慢性生殖道炎症导致的炎性细胞因子表达增强可较大程度反映生殖道的炎性损伤,微量元素对于子宫内膜及生殖系统其他方面的影响也较大程度存在,且对免疫的失调影响较大[17-19]。
咸阳市居于第二位,近几年来陕西省政府在咸阳市成立西咸新区,加大对咸阳市的建设和发展投入,使得咸阳市成为西安国际化大都市的核心组成部分,成为西部高端化和先进的制造业基地,其余6个城市与咸阳建设发展状况较为接近。
40年来,中国金融业无论在速度上还是规模上,都取得了令人瞩目的成就,但也存在自身特色不够鲜明等特征,加之不当行政干预一直存在,因此金融业对经济活动应有的效率激励功能并未能充分发挥出来。
商洛、铜川、杨凌同为一类,这说明其城市建设与发展状况与上面的八个城市相比还是很有差距的,这就要求政府在以后的发展中加大对基础城市建设的投资,努力提高各方面的水平。
参考文献
[1] 宁越敏, 唐礼智. 城市竞争力的概念和指标体系[J]. 现代城市研究, 2001, 10(3).
[2] 赵楠, 王昕, 李英娜, 等. 利用 spss 软件分析校园霸凌事件的发生规律以及预防[J]. 软件, 2018, 39(1): 159-164.
[3] 陈磊磊.不同距离测度的K-Means 文本聚类研究[J]. 软件, 2015, 36(1): 56-61.
[4] 田明光, 翟旭, 江颖洁, 等. 基于K均值聚类及高斯过程回归集成的铅酸电池荷电状态预测[J]. 软件, 2018, 39(1): 132-137.
[5] 何晓群. 多元统计分析[M]. 北京: 中国人民大学出版社, 2015.
[6] 张文宇, 王秀秀, 任露, 等. 改进的主成分聚类分析法在教育信息化中的应用[J]. 软件, 2015, 36(7): 10-16.
[7] 高惠璇编著, 《应用多元统计分析》北京大学出版社, 2005. 1.
[8] 陕西省统计局. 陕西省统计年鉴[Z]. 北京: 中国统计出版社.
[9] 吴荣强, 李晋宏. 基于聚类分析的铝电解槽阳极压降的分类[J]. 软件, 2018, 39(3): 166-169.
[10] 唐功爽. 基于spss的主成分分析于因子分析的辨析[J]. 统计教育, 2007(2).
[11] 张士杰. 基于主成分分析的阜阳市城市竞争力评价[J]. 安徽广播电视大学学报, 2011, (4).
Research on Urban Construction and Development in Shanxi Province Based on Spss Data Analysis
CHEN Zhi-bo, YIN Hong
(Kunming University of Science and Technology Mechanic and Electronic, Yun Nan Kun Ming 650000)
【Abstract】: In order to study the construction and development of regional cities in Shaanxi Province, this paper takes 11 major cities in Shaanxi Province as the research object. Fifteen factors such as total urban population, local financial revenue, urban water use penetration rate, urban gas penetration rate and residential area at the end of 2015 are selected as evaluation indexes, and each city is extracted from the statistical yearbook of Shaanxi Province. Relevant data. Cluster analysis (system cluster analysis, K-means cluster analysis) and principal component analysis are used to analyze the situation of urban construction and development in Shaanxi Province. Finally, the comprehensive evaluation of urban construction and development in the main areas of Shaanxi Province is carried out.
【Key words】: Urban development; SPSS statistical software; Cluster analysis; Principal component analysis
中图分类号:TP391. 41
文献标识码:A
DOI:10.3969/j.issn.1003-6970.2019.03.019
作者简介:陈智波(1994- ),男,昆明理工大学机电学院在读研究生,主要研究方向:生产及制造系统。
本文著录格式:陈智波,尹红. 基于spss数据分析的陕西省各地区城市建设与发展状况研究[J]. 软件,2019,40(3):98- 103
标签:城市发展论文; SPSS统计软件论文; 聚类分析论文; 主成分分析论文; 昆明理工大学机电学院论文;