统计分析方法在省直管县消费结构研究中的应用
王 露 黄淮学院数学与统计学院
摘要: 自2014 年起,河南省对兰考县等10 个县实行全面直管;至今已经实行省直管5 年,经过这几年的发展,这10 个直管县与原隶属市在消费结构是否还保持一致?本文使用2018 年全国城市分级划分中河南省17 个市的数据,运用多元统计分析中的判别分析方法对河南省10 个直管县的消费结构进行研究分析。
关键词: 数据挖掘;直管县;消费结构;判别分析
一、引言
随着行政体制改革的不断深入,原来的“市管县”模式的弊端逐渐显现。在此背景下,推行“省直管县”模式是县域经济发展的迫切需要[1]。省直管模式对县域经济发展影响如何?当前国内经济正经历着由投资拉动向消费拉动增长的转变,研究各地的消费结构有着重要的意义。河南省10 个省直管县实行省全面直管已经5 年,消费结构是否有变化?这一问题的研究,对地区经济政策的制定、调整有着重要的指导意义。
近年来,国内关于省管县相关问题也进行了一些研究,但主要集中政策理论上的研究,缺乏相关的实证研究。魏向前(2010)[2]对宁夏直管县的财政体制运行效率进行了调查与研究;李杰云(2012)[3]等从财政制度改革的角度研究广西省直管县发展现状;梁家豪(2016)[4]通过运用常用描述性统计方法对河南省直管县取得的相关成效进行了研究。随着大数据时代的到来,数据挖掘技术不断的丰富;同时随着直管县模式的深入推行,数据也不断的完善和丰富。利用数据挖掘相关技术对省直管模式下的相关问题进行研究也成为了可能。
3.3.3 性别划分。近几年我国女性工作者的社会地位有所提升,但是在就业、各项福利待遇方面仍亟待进行完善,在进行保险业务金额调整的过程中也应该结合男女岗位发展的不同情况,针对性的给与女性关怀与照顾,女性能够获得的保险业务金额相较于男性有小幅度提高,使个税递延保险的发展更好的促进社会公平。
二、判别分析
本文拟使用数据挖掘技术中的判别分析的方法研究直管县消费结构的变化。判别分析是数据挖掘技术中统计方法的典型代表,它在现实中有着广泛应用。比如在金融业,根据客户的信息对其信用等级的分类;在医学上,根据临床特征对病人是否染上某种疾病做出诊断;常用的判别分析方法有贝叶斯判别法及费歇尔判别法[5]。
(一)贝叶斯判别法
设有k 个p 维总体G1,G2,…,Gk,其概率密度分别为p1(x),p2(x),…,pk(x),已知这个k 个总体的先验分布为q1,q2,…,qk。
对于新样本x 计算其后验概率
使得p(Gi|x)取最大值的i,可判定x 来自于总体Gi。
(二)费歇尔判别法
郜教授提出,两个小数相乘已失去了“相同加数求和”的含义,对于一个算式,如果仅知道怎么算,不知道何时这样算,显然是计算教学的缺失,他认为小数乘法的起点不应该是怎样算的问题,而是如何理解两个小数相乘的过程。
数据集中共27 个城市数据,其中17 个样本参与判别分析,10个样本为待判样本。
由表2 可得,标准化的典型判别函数:
未知(待判):兰考县、汝州市、巩义市、永城市、滑县、邓州市、长垣县、固始县、鹿邑县、新蔡县。
(1)、…、Gk : a'x1(k),…,a'xnkk,寻找向量a 使组间差异尽可能大。从方差分析角度,即寻找向量a 使尽可能大记为。其中(i)和分别为第i 组均值和总均值向量。
实测粉尘浓度通过调控装置3个参数的综合调控,表6出风口距掘进端头5 m下,司机位置处的测点质量浓度从154.6 mg/m3下降至102.1 mg/m3,相比降低了34%;而回风侧的粉尘质量浓度从139.8 mg/m3下降至99.8 mg/m3,相比降低了28.6%;出风口距掘进端头10 m下,在司机位置处的粉尘质量浓度也有明显降低,其测点质量浓度从187.6 mg/m3下降至142.1 mg/m3,相比降低了24.3%;回风侧的测点粉尘质量浓度从168.9 mg/m3下降至120.5 mg/m3,降低了28.7%。
对于待判样本x,若对任意的,存在使得成立,则x 属于第k 组。
断奶仔猪饲料(保育料):断奶仔猪前期饲料(5~10 kg)通常也含有较高比例的乳清粉和热敏性添加剂,因此,宜采用与教槽料相同的大料预调质熟化加工+低温制粒工艺,调质参数也基本相同。断奶仔猪后期(10~20 kg)消化系统逐渐发育良好,饲料中乳清粉、奶粉的比例已经较低,此时,可以采用调质器(85~90 ℃,20~30 s)+保持器(50~90 s)+制粒的一次制粒工艺。如果考虑最大限度保留热敏性饲料添加剂的活性,也可以采用大料预调质熟化加工+低温制粒工艺。
三、实证分析
从2014 年1 月1 日起,河南省将对兰考县、长垣县、汝州市等10 个县实行由省全面直管。2018 年国家公布了中国城市一二三四五分级最新名单,其中有河南省17 个市分级情况(省直管县不参与分级)。为了进一步研究这10 个省直管县居民消费结构,与省内第几线城市属于同一水平?实行省全面直管这4 年来,直管县与原隶属市的消费结构是否仍保持一致?
表1
(一)数据选取
数据来源于《2018 年河南省统计年鉴》,选取8 个指标分别是消费支出X1、衣着支出X2、居住支出X3、生活用品及服务支出X4、交通通信及服务支出X5、教育及娱乐支出X6、医疗保健及服务支出X7、其他商品及服务支出X8。
(二)数据分类
本文根据2018 年公布的中国城市一二三四五分级名单,其中河南省一线城市只有郑州、三线城市7 个、四线城市7 个、五线城市2 个。考虑一线城市、五线城市个数太少,信息过少,不适合单独分类;将17 个城市分成两类,一、三线城市分为第一类,第四、五线城市分为第二类。
表4 中Dis-1 代表预测的分类,Dis-1 代表样本代入判别函数所的判别分数;Dis2-1 和Dis2-2 分别代表待判别样本属于第一类、第二类的后验概率,哪个后验概率大就属于哪一类。本文中使用的先验概率为0.5,0.5,即属于这第一类、第二类的先验概率各为0.5。
第二类:开封市、平顶山市、安阳市、鹤壁市、濮阳市、周口市、三门峡市、漯河市。
律师解答:我国《侵权责任法》第78条规定,饲养的动物造成他人损害的,动物饲养人或者管理人应当承担侵权责任,但能够证明损害是因被侵权人故意或者重大过失造成的,可以不承担或者减轻责任。本案中,刘某作为伤人动物的饲养人,因其管理不善致其伤人,故应当承担相应责任。
(三)数据分析
本文使用SPSS20.0 软件进行判别分析,分析结果如下。
到了黑夜,王宝生就来到2楼的瞭望台,透明的玻璃墙壁把呼啸的寒风隔离开,他独自一人站在这个山头上,冷了就搓搓手、哈哈气,无聊了就来回踱步,默默地瞭望着万亩大山,想想那孤寂之感就让人喘不过气。
令a 为Rp 中的任一单位向量,μ(x)=a'x 为x 向以a 方向的投影,则上述数据的投影为:G1 : a'x1(1),…,a'xn1
由表1 可知,一个典型判别函数就可以进行分类判别。
设从k 个总体分别取得k 组p 维观测值:其中n=n1+…+nk。通过把这n 个p 维观测值向某个方向a 上投影,使得这n 个数据的投影在组上能够尽可能的区分开。
同时,对于上市问题,宗庆后此前一直坚持娃哈哈不差钱、不上市。而今年3月,也有媒体报道称,娃哈哈开始为上市而瘦身——清退员工股份。宗庆后也改口表示,未来如果有大的产业要投资,娃哈哈也要上市募集资金。
其中x*表示对该变量进行标准化处理。
根据表3 可得贝叶斯判别函数的数学表达式:
对于使用贝叶斯判别函数,将待判样本代入上述两个贝叶斯判别函数中,哪个函数值大就可以判别该样本属于哪一类。
第一类:郑州市、新乡市、洛阳市、商丘市、许昌市、信阳市、驻马店市、南阳市。
1.游戏精神的本质。在中国,班马是较早关注儿童文学中“游戏精神”的理论研究者。他在1984年首次全国儿童文学理论讨论会上提出探讨有关“游戏精神”的话题。他是从一个比较宽泛的角度去阐释“游戏精神”的。内容涉及到儿童生理学、儿童心理学、人类文化等诸多方面。
表2 STANDARDIZED FUNCTION COEFF...
表3 Classification Function Coefficients
由表4 的预测分类结果可以得到原分组中17 个样本,被误判的有4 个样本,原分组判别正确率76.5%,误判率23.5%。
对于待判的10 个样本的判别情况如下:
第一类:巩义市、兰考县、汝州市、滑县、长垣县、邓州市。
第二类:永城市、固始县、鹿邑县、新蔡县。
从分类上来看,第一类有6 个县(市),第二类有4 个县(市),这也说明直管县之间的消费结构还是有较大的差异。这种差异接近于三线城市和四线城市之间消费结构的差异。
从直管县与原隶属城市是否在同一类来看,只有巩义市、汝州市、长垣县、邓州市、鹿邑县这5 个直管县与原隶属市在同一类。
四、结语
本文通过运用判别分析方法研究河南省10 个直管县的消费结构,通过研究发现直管县之间消费结构差异较大,并且随着实行省全面直管这4 年来,部分直管县消费结构已与原隶属城市的消费结构有了一定的差异。这也充分说明实行省全面直管在一定程度能促进消费结构的变动。本文不足之处,研究的指标只局限于消费领域,对其他领域未进行研究;但若选取指标过多,会造成数据维数过高,对判别分析的判断准确率有一定的影响。
表4
参考文献:
[1]赵建吉,吕可文,田光辉等.省直管能提升县域经济绩效吗?——基于河南省直管县改革的探索[J].经济经纬,2017(3):1-6.
[2]魏向前.宁夏直管县财政体制运转效能的调查与研究[J].宁夏党校学报,2010(12):81-83.
[3]李杰云,黎基钦,吴胜泽等.广西财政直管县背景下的财政体制问题研究[J].经济研究参考,2012(35):10-17.
[4]梁家豪.省直管县体制改革的成效分析与推进路径——基于河南省的实证研究[D].郑州:郑州大学硕士论文,2016.
[5]何晓群.多元统计分析[M].北京:中国人民大学出版社,2015:89-111.
中图分类号: F224.7
文献识别码: A
文章编号: 1001-828X(2019)022-0144-02
作者简介: 王 露(1988-),男,河南信阳人,助教,硕士,主要从事应用统计研究。
基金项目: 黄淮学院校级教育教学改革项目(编号:2018XJGL X0315)。
标签:数据挖掘论文; 直管县论文; 消费结构论文; 判别分析论文; 黄淮学院数学与统计学院论文;