社会养老保险缴费总额预测的等长基数法,本文主要内容关键词为:基数论文,养老保险论文,总额论文,社会论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、问题的提出
在社会养老保险缴费总人数和社平工资预测已知时,缴费总额精确预测的关键问题是拟合出各基数下的缴费人数函数。
一般预测前先有若干年(比如是k年)的缴费人数数据:
缴费人按一定基数缴费。预测时可将基数从最低缴费基数(每年不变)到最高缴费基数(每年提高)分成等间隔的左开右闭的小区间。某人缴费额如属于某区间,则将其缴费基数视为区间右端点的值。产生的误差会因区间的间隔变小而减少。
我们希望用一个二元函数(年序数和基数的函数)来拟合每年缴费人数的数据,但由于各年数据是不等长的,这给拟合各基数下的缴费人数函数带来困难。为此可先分几个步骤对数据进行改造:
我们把它称为缴费随机序列。将其中每个随机变量的概率函数构成的函数列称为缴费概率函数列,将其中每个随机变量的分布函数构成的函数列称为缴费分布函数列。我们把在上面的基础上对缴费概率函数或缴费分布函数进行拟合,得到各基数下的缴费人数,进而预测缴费总额的方法称为等长基数法。
在缴费总人数的预测和社平工资有稳定的远期预测值时(缴费总人数和社平工资是受限增长,预测时常有稳定的远期预测值),自然考虑缴费总额是否有稳定的远期的预测值。如果缴费分布函数列是稳定的,缴费总额当然就是稳定的了。随着社会养老保险覆盖面的扩大,社会养老保险制度的日益完善,缴费分布函数应是单调增加并趋于稳定的。同时人们收入上的差距不断缩小,全社会养老保险的平均基数应会日益渐小而趋于稳定。这种认识为我们拟合缴费分布函数提供了方向。
二、实证分析
我们利用北京市某区2000~2004年的社会养老保险的缴费数据,对该区缴费规模作出的预测。以此为例说明等长基数法这一方法。
首先利用等长基数法的步骤对2000~2004年各年基数下缴费原始数据进行改造,得到如表1的数据。这里各行的数据分别是各年对应着32个基数的人数累加百分比,即缴费分布函数值。
表1 2000~2004年各基数下缴费人数原始数据
2000年 2001年
2002年2003年 2004年
缴费基数(元) 人数人数 人数 人数
人数
400 50441
5685964857 73828 85139
500 10952
1132411890 12394 13100
600 89108856 8856 8997
9317
700 96519256 8761 8167
7316
800 12029
1205512118 12237 12635
900 11964
1187011700 11421 10771
100012258
1253912956 13377 14208
110010589
1054510197 9725
9012
120011769
1208912499 12956 13471
1300 98589823 9783 9828 10000
140010363
10182 9901 9517
8928
150011141
1146511829 12156 12607
1600 90879165 9287 9232
9165
1700 87358614 8478 9608
9585
1800 96079475 9380 9402
9700
190010652
1040910012 9285
8004
200011549
1233913302 14383 15771
2100 66606771 6889 6986
7097
2200 58605986 6110 6281
6370
2300 50895091 5102 5143
5192
2400 50235035 5022 4980
4887
2500 48104950 5109 5275
5489
2600 39864021 4059 4113
4193
2700 37783776 3768 3741
3696
2800 37773792 3821 3880
3980
2900 37263689 3628 3534
3375
3000 37843892 4032 4178
4368
3100 31203129 3103 3194
3180
3200 31443175 3208 3242
3266
3300 29392954 2987 3010
3117
3400 28572851 2841 2811
2760
3500 28442893 2950 3017
3079
3600 2547 2570 2595
2626
3700 2431 2416 2426
2432
3800 2331 2343 2358
2395
3900 2271 2275 2254
2166
4000 2226 2259 2399
2568
4100 2041 2057
2136
4200 1819 1841
1858
430050441 1732 1754
1750
4400 1624 1603
1558
4500 1682 1750
1838
4600 1279 1284
1290
47001247
1249
48001245
1235
49001330
1273
50001623
1627
51001506
1593
52001042
1051
5300990
5400900
5500995
5600790
5700810
5800867
5900737
年缴费额(元) 1271240419
1433109096 1595554723 1753695734 1891466923
2000~2004年五年的缴费分布函数的散点图见图1。
图1
注意:这里和后面我们都将缴费分布函数与它在[0,32]上的限制视为等同,这是因为缴费分布函数在(- ∞)内都等于0,在(32,∞)内都等于1,也就是缴费分布函数完全由它在[0,32]上的限制所确定。
从散点图上可以看出五年的缴费分布函数是单调不减的。基于前面的认识,应拟合一个单调不减的缴费分布函数,并使时间(年)变量t→∞时,缴费分布函数是收敛的。我们分以下几步骤来拟合缴费分布函数:
(1)根据上述对拟合函数的要求,选择函数
作为拟合函数。其中t为时间变量,x为基数变量,x=1,2,…,32,a(t、b(t)为待定函数。如F(1,k)表示2000年第1个基数到第k个基数缴费人数占总人数的累加百分比(缴费分布函数值)。
其中令t=1,2,…,5,拟合F(t,x)(5个x的函数)可得
a(1)=-0.1812, b(1)=0.05515
a(2)=-0.1237, b(2)=0.06432
a(3)=-0.08415,b(3)=0.07437
a(4)=-0.05571;b(4)=0.08525
a(5)=-0.03619,b(5)=0.09690
拟合优度分别为:0.99525;0.99639;0.99704;0.99749;0.99824。
可见拟合有很好的优度。拟会函数的图像见图1。
(2)由b(1)、b(2)、b(3)、b(4)、b(5)对b(t)拟合(希望b(t)是远期稳定的,故选择Logistic函数):
图2
三、预测分析
在缴费分布函数拟会的基础上,可以对缴费总额进行预测。但这之前先要对社平工资和缴费总人数进行预测。
(一)社平工资的预测
由2000~2004年的缴费数据(见表1),可计算出这五年的社平工资(用最高缴费基数的三分之一)。社平工资函数(t是年份数)应是有阻滞作用的有界函数,所以取Logistic函数用matlab软件做拟合,拟合的结果如下:
检验结果——R平方值为R=97.8%。
(二)缴费总人数的预测
同样地,仍由2000~2004年的缴费数据,对缴费总人数进行拟合,其结果如下:
表示第m-1个基数至第m个基数月缴费额与社平工资的平均百分比。
表示第m-1个基数至第m个基数月平均缴费额。
0.8×0.28+0.2×0.22是企业职工和个人缴费者缴费比例的加权平均(0.8和0.2的比例来自社保中心)。
用这个数学模型检验和预测的50年的缴费额如表2。
表2
年份缴费额(元)年份 缴费额(元)年份缴费额(元)
1998 921963749 2019 9578185058 204020218223655
19991081587398 202010351917900 204120377283597
20001255725192 202111128947380 204220517827394
20011443159120 202211900616525 204320641824882
20021643014896 202312658706564 204420751082431
20031855326368 202413395742546 204520847244663
20042081499054 202514105231530 204620931799873
20052324504262 202614781821602 204721006087967
20062588722111 202715421379319 204821071309983
20072879482596 202816020991474 204921128538455
20083202451229 202916578903283 205021178728111
20093563019835 203017094408632 205121222726484
20103965807143 203117567709071 205221261284187
20114414300093 203217999757124 205321295064668
20124910617902 203318392097130 205421324653321
20135455367116 203418746713641 205521350565912
20146047564816 203519065894248 205621373256290
20156684622360 203619352110774 205721393123394
20167362393249 203719607920392 205821410517576
20178075292464 203819835886473 205921425746280
20188816491424 203920038517740 206021439079125
用2000~2004年的数据进行检验最大相对误差仅为5%,模型效果比较理想。
标签:分布函数论文; 数据拟合论文; 社会保险论文; matlab函数论文;