指数平滑法预测信息业实例分析,本文主要内容关键词为:平滑论文,实例论文,指数论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着信息产业的迅速崛起,其研究方法日益丰富多彩,特别是相关学科的交叉和渗透,数理方法在这里得到长足应用。诸如在信息产业的投入产出、规模结构、信息化水平和前景预测等方面,自20世纪80年代中期以来,陆续出现了一些量化研究的范例。本文试以勃朗三次指数平滑方法对河北省信息产业规模结构进行预测分析。
一、指数平滑法的模型特点
指数平滑法属趋势外推预测,它的数学特性是历史统计数据的大致平滑,是趋势外延。也就是说,它假定过去的发展规律还将继续进行下去。指数平滑又是一种自适应的数学模型,分为一次指数平滑、二次指数平滑和三次指数平滑。
指数平滑法的初始条件是在运算时要知道指数平均值S[,t] 的前一量值S[,t-1],当过程只是刚刚开始时,应取某一S[,0]值作为S[,1] 的前一量值。若在平滑时有历史数据,则可以把已有数据的算术平均值、加权平均值和指数平均值作为初始值S[,0]。
平滑常数a值的选择十分重要。 因为它既代表模型对过程变化的反映速度,又决定预测系统修匀随机误差的能力。充分相信初始值即可选择a=0,完全不相信过去的数据即可选择a=1,一般说来这两种极端情况都是不正确的。勃朗认为a值在0.01~0.3之间选择是可以接受的折衷值,多数研究者使用时主要是依据经验视具体问题而定。
二、信息产业的适应特性
信息产业在全球属新兴的经济,它被看作未来知识经济的主体成份,它的发展与人类的关系会愈来愈紧密,社会对其产业需求不象某些具体商品,时涨时落,而是随着经济的全球化,也会如日中天。这种发展的总趋势恰好符合上述勃朗指数平滑的数学特点。一、二次指数平滑法预测只适用于线性倾向的数列,当数列具有曲线型倾向时就必须采用三次指数平滑法。本实例所收集的河北省信息产业的数据并非直线式上升,亦呈曲线发展态势,在这种情况下,较适合使用三次指数平滑的预测方法。
三、河北省信息产业规模结构的指数平滑计算和预测模型
对信息产业规模结构的研究,目前国内外通常使用美国学者波拉特提出的信息经济测度方法,其内容主要包括信息业增加值在国民生产总值中的比重和信息业就业人员在社会总就业人员中的比重,这两项指标被视为信息业宏观规模结构分析的重要结论。笔者曾使用波拉特法对河北省信息业增加值及其就业人数的比例进行了测度分析,并得出了1988~1997年的时间序列数据。本文也以此成果为基础进行三次指数平滑计算。
1.信息业增加值规模指数平滑计算及预测模型
表1列出了河北省信息业增加值规模指数平滑计算过程。 在计算之中,初始值的确定考虑到对整个预测影响很大且十分敏感,故不是简单使用第一年的原始数据,S[(1)][,0]、S[(2)][,0]和S[(3)][,0]的选择是取前三个数的平均值。即:
15.98+16.36+16.76
S[(1)][,0]=───────────=16.37
3
16.25+16.29+16.43
S[(2)][,0]=───────────=16.32
3
16.3+16.3+16.34
S[(3)][,0]=───────────=16.31
3
表1 河北省信息业增加值三次指数平滑计算
年代 信息业增加值
一次指数平滑值
%
1988
X[,1]=15.98 0.3×15.98+0.7×16.37=16.25
1989
X[,2]=16.36 0.3×16.36+0.7×16.25=16.29
1990
X[,3]=16.76 0.3×16.76+0.7×16.29=16.43
1991
X[,4]=17.16 0.3×17.16+0.7×16.49=16.69
1992
X[,5]=18.72 0.3×18.72+0.7×16.69=17.30
1993
X[,6]=19.82 0.3×19.82+0.7×17.30=18.06
1994
X[,7]=21.02 0.3×21.02+0.7×18.06=18.95
1995
X[,8]=22.51 0.3×22.51+0.7×18.95=20.02
1996
X[,9]=23.22 0.3×23.22+0.7×20.02=20.98
1997
X[,0]=24.82 0.3×24.82+0.7×20.98=22.14
年代二次指数平滑值 三次指数平滑值
1988
0.3×16.25+0.7×16.32=16.30.3×16.3+0.7×16.31=16.31
1989
0.3×16.29+0.7×16.3=16.3 0.3×16.3+0.7×16.31= 16.31
1990
0.3×16.43+0.7×16.3=16.340.3×16.34+0.7×16.31=16.32
1991
0.3×16.69+0.7×16.34=16.45
0.3×16.45+0.7×16.32=16.36
1992
0.3×17.3+0.7×16.45=16.710.3×16.71+0.7×16.36=16.46
1993
0.3×18.06+0.7×16.71=17.12
0.3×17.12+0.7×16.46=16.66
1994
0.3×18.95+0.7×17.12=17.67
0.3×17.67+0.7×16.66=16.96
1995
0.3×20.02+0.7×17.67=18.38
0.3×18.38+0.7×16.96=17.83
1996
0.3×20.98+0.7×18.38=19.16
0.3×19.16+0.7×17.38=17.92
1997
0.3×22.14+0.7×19.16=20.05
0.3×20.05+0.7×17.92=18.56
根据勃朗三次指数平滑公式,将信息业增加值三次指数平滑得出的数据代入其中,加权系数a值一般是根据经验而定,这里取0.155比较适中平稳。计算过程和结果如下:
a[,10]=3[(1)][,10]-3S[(2)][,10]+S[(3)][,10]
=3×22.14-3×20.05+18.56
=24.83
a
b[,10]=──────[(6-5a)S[(1)][,10]-(10-8a)
2(1-a)[2]
S[(2)][,10]+(4-3a)S[(3)][,10]
0.155
=────────[(6-5×0.155)×
2(1-0.155)[2]
22.14-(10-8×0.155)×
20.05+(4-3×0.155)×
18.56]
=0.6134
a[2]
c[,10]=──────(S[(1)][,10]-2S[(2)][,10]+
2(1-a)[2]
S[(3)][,10])
0.155[2]
=────────(22.14-2×20.05+18.56)
2(1-0.155)[2]
=0.0101
将上述a[,10]、b[,10]、c[,10]数值代入公式:
1
Y[,t+r]=a[,t]+b[,t]Υ+─c[,t]Υ[2]
2
由此得出信息业增加值预测模型如下:
Y[,97+Υ]=24.83+0.6134Υ+0.0051Υ[2]
式中r是从1997年到预测之年相隔的年数。
2.四产业就业结构预测模型
按照四产业划分法将整个社会的就业结构分为农业、工业、服务业和信息业,从而测度出信息业就业人数在整个社会总就业人数中的比重,这是信息业结构分析的重要指标。以四产业就业指数得出的时间序列数据进行三次指数平滑计算和确立预测模型,这里的纯数学推导量大且复杂,其步骤方法也与上述信息业增加值的推导相同,为了使本文有别于数学研究报告和减少繁琐,在此不再具体赘述过程,而直接归纳列出农业、工业、服务业和信息业就业比重三次指数平滑法得出的预测模型分别如下:
农业
Y[,97+Υ]=48.01-1.085Υ-0.0102Υ[2]
工业
Y[,97+Υ]=21.13+0.3368Υ+0.0034Υ[2]
服务业
Y[,97+Υ]=13.36+0.4493Υ+0.0046Υ[2]
信息业
Y[,97+Υ]=17.55+0.3331Υ+0.0034Υ[2]
表2河北省信息业增加值及就业结构预测结果
相隔
年代 年数 增加值% 农业%工业%服务业%
信息业%
1998
125.4546.9121.4713.81 17.89
2001
427.3743.5122.5315.23 18.94
2005
830.0638.6824.0417.25 20.43
2007 1031.4736.1424.8418.31 21.22
2010 1334.6732.1826.0319.89 22.45
2015 1836.3225.1828.2922.94 24.65
2020 2341.6417.6630.6826.13 27.01
四、预测结果
由表2预测结果可知,在现有条件不变的情况下, 河北省信息产业增加值2010年总体上相当于20世纪美国60年代水平、日本70年代水平、北京80年代水平。从就业结构上看,河北省2015年前后,才能由农业社会进入到工业社会,这时的信息业增加值比重以及农业、工业、服务业和信息业四大产业就业结构分别为36%、25%、28%、23%和25%,此种比例应该说是一种较理想的模式,根据发达国家(如日本)的发展经验,在这样的历史时期其经济结构将会发生剧烈的变动,预计再用10年左右的时间,即到2025年前后完成由工业化社会到信息化社会的转变。
五、几点讨论
1.勃朗三次指数平滑方法用于信息产业的预测,较之其它线性模型有更大的适应性。但该方法的数学特点决定了其预测是假定过去的演变规律延续和重复,三次指数平滑对预测值的修正,目的是为了准确的跟踪线性趋势的变化,这里的运算比一般线性模型要复杂得多。而信息产业作为一种复杂的社会经济现象,随机性很大,尤其目前我国宏观经济正处在由计划调节向市场调节的转轨之中,其发展既受市场需求的制约,又受政府政策的调控,还受经济全球化的影响。在这种情况下,信息产业的波动变化难以预料,其数据的获得,在现行统计指标不足的条件下,充其量只能是从大的方面采集随机变量,因此,信息产业的非线性态势是显而易见的。勃朗三次指数平滑尽管能最大限度地缩小预测误差,但它毕竟是一种数理逻辑,和常青的生活之树仍有很大的距离,预测失灵不验也在所难免,这并不影响我们的研究。实际上,一种模型出来之后,还要根据客观情况变化适时修正。预测过程是一个不断深化认识的过程,任何预测模型只有在实践中不断检验,才能趋于合理和大致准确。
2.信息产业是本世纪奉献给新世纪的主导经济,它从定性的描述进入到定量的分析是渐趋成熟的必然。但从我国的现状来看,前者远远多于后者,甚至国家还没有制定科学的产业标准和统计体系,许多问题只能是以个人的主观经验和能力去判断,无法定量计算,众说纷纭,缺少客观性和可比性,非量化分析的路子越来越窄。在这种情况下,多视角地对信息产业量化研究则十分必要。科学的发展史表明,没有数学支持的学科是苍白无力的。数学语言、定量分析和逻辑证明所引申出的规律和认识,往往超出我们的感性世界,或比美丽动听的描述更有力量和更加准确。当然,目前我们所使用的数据,有的水分很大,因而,往往需要去伪存真,由表及里的辨析“脱水”之后才能使用。否则,不仅会影响预测的精度和价值,且假数据得出的假结论,或许比没有数据影响更大和更糟,这是在目前我们进行量化分析时必须注意的问题。
3.预测理应成为信息研究领域的强项。传统信息观看重过去和现在已有的静态信息,满足于信息“守成”。在“知识爆炸”的今天,人们不仅关注信息的现实价值,更乐知于其未来的发展趋势。无论是决策层还是公众,当他们了解了事物的前景之后,才能做出正确的判断和抉择,增强驾驭、征服和创造未来的能力和信心。因此,信息工作者依据系统的观点、联系的观点、变化的观点和运动的观点,利用自己的信息优势,采用定性定量结合的方法,在预测领域应有所作为,信息或情报专家亦应成为预测专家。