社会养老保险缴费总额预测的等长基法_分布函数论文

社会养老保险缴费总额预测的等长基数法,本文主要内容关键词为:基数论文,养老保险论文,总额论文,社会论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、问题的提出

在社会养老保险缴费总人数和社平工资预测已知时,缴费总额精确预测的关键问题是拟合出各基数下的缴费人数函数。

一般预测前先有若干年(比如是k年)的缴费人数数据:

缴费人按一定基数缴费。预测时可将基数从最低缴费基数(每年不变)到最高缴费基数(每年提高)分成等间隔的左开右闭的小区间。某人缴费额如属于某区间,则将其缴费基数视为区间右端点的值。产生的误差会因区间的间隔变小而减少。

我们希望用一个二元函数(年序数和基数的函数)来拟合每年缴费人数的数据,但由于各年数据是不等长的,这给拟合各基数下的缴费人数函数带来困难。为此可先分几个步骤对数据进行改造:

我们把它称为缴费随机序列。将其中每个随机变量的概率函数构成的函数列称为缴费概率函数列,将其中每个随机变量的分布函数构成的函数列称为缴费分布函数列。我们把在上面的基础上对缴费概率函数或缴费分布函数进行拟合,得到各基数下的缴费人数,进而预测缴费总额的方法称为等长基数法。

在缴费总人数的预测和社平工资有稳定的远期预测值时(缴费总人数和社平工资是受限增长,预测时常有稳定的远期预测值),自然考虑缴费总额是否有稳定的远期的预测值。如果缴费分布函数列是稳定的,缴费总额当然就是稳定的了。随着社会养老保险覆盖面的扩大,社会养老保险制度的日益完善,缴费分布函数应是单调增加并趋于稳定的。同时人们收入上的差距不断缩小,全社会养老保险的平均基数应会日益渐小而趋于稳定。这种认识为我们拟合缴费分布函数提供了方向。

二、实证分析

我们利用北京市某区2000~2004年的社会养老保险的缴费数据,对该区缴费规模作出的预测。以此为例说明等长基数法这一方法。

首先利用等长基数法的步骤对2000~2004年各年基数下缴费原始数据进行改造,得到如表1的数据。这里各行的数据分别是各年对应着32个基数的人数累加百分比,即缴费分布函数值。

表1 2000~2004年各基数下缴费人数原始数据

2000年 2001年

2002年2003年 2004年

缴费基数(元) 人数人数 人数 人数

人数

400 50441

5685964857 73828 85139

500 10952

1132411890 12394 13100

600 89108856 8856 8997

9317

700 96519256 8761 8167

7316

800 12029

1205512118 12237 12635

900 11964

1187011700 11421 10771

100012258

1253912956 13377 14208

110010589

1054510197 9725

9012

120011769

1208912499 12956 13471

1300 98589823 9783 9828 10000

140010363

10182 9901 9517

8928

150011141

1146511829 12156 12607

1600 90879165 9287 9232

9165

1700 87358614 8478 9608

9585

1800 96079475 9380 9402

9700

190010652

1040910012 9285

8004

200011549

1233913302 14383 15771

2100 66606771 6889 6986

7097

2200 58605986 6110 6281

6370

2300 50895091 5102 5143

5192

2400 50235035 5022 4980

4887

2500 48104950 5109 5275

5489

2600 39864021 4059 4113

4193

2700 37783776 3768 3741

3696

2800 37773792 3821 3880

3980

2900 37263689 3628 3534

3375

3000 37843892 4032 4178

4368

3100 31203129 3103 3194

3180

3200 31443175 3208 3242

3266

3300 29392954 2987 3010

3117

3400 28572851 2841 2811

2760

3500 28442893 2950 3017

3079

3600 2547 2570 2595

2626

3700 2431 2416 2426

2432

3800 2331 2343 2358

2395

3900 2271 2275 2254

2166

4000 2226 2259 2399

2568

4100 2041 2057

2136

4200 1819 1841

1858

430050441 1732 1754

1750

4400 1624 1603

1558

4500 1682 1750

1838

4600 1279 1284

1290

47001247

1249

48001245

1235

49001330

1273

50001623

1627

51001506

1593

52001042

1051

5300990

5400900

5500995

5600790

5700810

5800867

5900737

年缴费额(元) 1271240419

1433109096 1595554723 1753695734 1891466923

2000~2004年五年的缴费分布函数的散点图见图1。

图1

注意:这里和后面我们都将缴费分布函数与它在[0,32]上的限制视为等同,这是因为缴费分布函数在(- ∞)内都等于0,在(32,∞)内都等于1,也就是缴费分布函数完全由它在[0,32]上的限制所确定。

从散点图上可以看出五年的缴费分布函数是单调不减的。基于前面的认识,应拟合一个单调不减的缴费分布函数,并使时间(年)变量t→∞时,缴费分布函数是收敛的。我们分以下几步骤来拟合缴费分布函数:

(1)根据上述对拟合函数的要求,选择函数

作为拟合函数。其中t为时间变量,x为基数变量,x=1,2,…,32,a(t、b(t)为待定函数。如F(1,k)表示2000年第1个基数到第k个基数缴费人数占总人数的累加百分比(缴费分布函数值)。

其中令t=1,2,…,5,拟合F(t,x)(5个x的函数)可得

a(1)=-0.1812, b(1)=0.05515

a(2)=-0.1237, b(2)=0.06432

a(3)=-0.08415,b(3)=0.07437

a(4)=-0.05571;b(4)=0.08525

a(5)=-0.03619,b(5)=0.09690

拟合优度分别为:0.99525;0.99639;0.99704;0.99749;0.99824。

可见拟合有很好的优度。拟会函数的图像见图1。

(2)由b(1)、b(2)、b(3)、b(4)、b(5)对b(t)拟合(希望b(t)是远期稳定的,故选择Logistic函数):

图2

三、预测分析

在缴费分布函数拟会的基础上,可以对缴费总额进行预测。但这之前先要对社平工资和缴费总人数进行预测。

(一)社平工资的预测

由2000~2004年的缴费数据(见表1),可计算出这五年的社平工资(用最高缴费基数的三分之一)。社平工资函数(t是年份数)应是有阻滞作用的有界函数,所以取Logistic函数用matlab软件做拟合,拟合的结果如下:

检验结果——R平方值为R=97.8%。

(二)缴费总人数的预测

同样地,仍由2000~2004年的缴费数据,对缴费总人数进行拟合,其结果如下:

表示第m-1个基数至第m个基数月缴费额与社平工资的平均百分比。

表示第m-1个基数至第m个基数月平均缴费额。

0.8×0.28+0.2×0.22是企业职工和个人缴费者缴费比例的加权平均(0.8和0.2的比例来自社保中心)。

用这个数学模型检验和预测的50年的缴费额如表2。

表2

年份缴费额(元)年份 缴费额(元)年份缴费额(元)

1998 921963749 2019 9578185058 204020218223655

19991081587398 202010351917900 204120377283597

20001255725192 202111128947380 204220517827394

20011443159120 202211900616525 204320641824882

20021643014896 202312658706564 204420751082431

20031855326368 202413395742546 204520847244663

20042081499054 202514105231530 204620931799873

20052324504262 202614781821602 204721006087967

20062588722111 202715421379319 204821071309983

20072879482596 202816020991474 204921128538455

20083202451229 202916578903283 205021178728111

20093563019835 203017094408632 205121222726484

20103965807143 203117567709071 205221261284187

20114414300093 203217999757124 205321295064668

20124910617902 203318392097130 205421324653321

20135455367116 203418746713641 205521350565912

20146047564816 203519065894248 205621373256290

20156684622360 203619352110774 205721393123394

20167362393249 203719607920392 205821410517576

20178075292464 203819835886473 205921425746280

20188816491424 203920038517740 206021439079125

用2000~2004年的数据进行检验最大相对误差仅为5%,模型效果比较理想。

标签:;  ;  ;  ;  

社会养老保险缴费总额预测的等长基法_分布函数论文
下载Doc文档

猜你喜欢