生物种群的一类统计模型,本文主要内容关键词为:种群论文,模型论文,生物论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:O212. 1; Q144
生态学家对生物种群增长模型的研究已有了不短的历史。但以前的模型大都是对参数λ(生长率)与群体数量的关系,或对其在群体数量的概率分布做出某些假定后推导出方程,然后用概率分布或微分方程求解。以确定性模型为例,将种群增长情况看作一确定性事件,同时认为生长率λ为一常数(即不随其它因素的变化而变化),若记N[,t]为t时刻种群的数量,N[,0]为初始时刻种群的数量,可得最简单的线性增长模型:N[,t]=N[,0]+λt。
若假设出生率λ与种群数N[,t]成正比,则可得指数模型:N[,t]=N[,0]e[λt]。
若假设出生率随种群数量的增长而下降,则模型为:
N[,t]=N[,0]+(k-N[,0])(1-e[-λt])
其中k为环境的最大受能力。
我们从另一角度,以统计学的角度出发来研究生物种群增长的数学模型。假定生物种群数量的主要影响因素是时间t,除此以外还要受到环境等大量影响较小的因素的影响,如食物、水分、空间等。因此,种群数量是一个随机变量,记为Y(其为统计值或实测值)。可采用统计拟合的方法作模型。
设采集到的试验或统计值为m对(t[,i],y[,i]),其中t[,i]为第i个时间,y[,i]为第i个时间采集到的种群数量的取值。例如,t[,i]为第i个间隔年,y[,i]为第i个间隔年某地区人口总数等。可假定
Y[,i]=f(t[,i])+ε[,i],i=1,2,…,m
其中f(t)是一个待估的函数,ε[,i]是随机误差。
下面采用回归分析的方法对其进行多项式或其它函数的逼近。
根据以往的知识及资料,我们首先选如下的逼近方法:
首先对变量Y作对数变换,记Z[,i]=ln(y[,i]),备选变量为:t,t[-1],t[2],t[-2],t[3],t[-3],于是回归分析模型化为:
其中e[,i]~N(0,σ[2]),i=1,2,…,m。
σ>0为常数,β[,j]为待估的参数,j=0,±1,±2,±3。
不论采用指定变量法、逐增变量法、递减变量法还是采用逐步回归、最优回归法,均可得到最优回归方程:
这里的A可能为{±1,±2,±3},或其某个子集合(包括空集)。
值得注意的是,回归方程及留下的每一个系数都要经得起显著性检验。
成立,即模型
成立,如果A={1},则(2)式为
即本文开头所提到的生物种群增长的指数模型。
我们从WILLIAMF.LUCAS主编的“生命科学模型”中获得美国人口1800~1960年的数据(除阿拉斯加和夏威夷):
单位:百万人
年(n) 1800
1820
1840
1860
1880
1900
1920
1940
1960
人口数(Y[,i])
5.39.6
17.1
31.4
50.2
76.0
105.7 131.7 178.5
下面我们采用上文的方法对此进行具体研究。
首先对数据进行变换
Z[,i]=ln(y[,i])
1
t=──(n-1800)
20
得
t
0
1
2
3
4
5
6
7
8
Z[,i] 1.6677 2.2618 2.8391 3.4468 3.9160 4.3307 4.6540 4.8828 5.1842
第二步我们选x[,1]=t,x[,2]=t[2],x[,3]=t[3]使用“均匀设计软件V3.0”分别计算出回归方程
Z[,1]=β[,0]+β[,1]t
的系数点估计及方差分析如下:
(1)对Z[,1]
项次
系数 F值
c1.9242
224.74
t0.4407
267.23
来源 SSR
SSE SST
平方和 11.65360.3053
11.9588
自由度1 78
均方11.65360.0436
F值267.234
相关系数 0.9872
F[,0.91] (1,7)=12.2回归方程及系数皆显著。
(2)对Z[,2]
项次 系数 F值
c
1.6351
2478.9
t
0.6885
1293.5
t[2]
-0.031 180.98
来源SSR SSE
SST
平方和11.9490.0098
11.9588
自由度 2 68
均方 5.97450.0016
F值
3659.5
相关系数 0.9996
F[,0.01] (1,6)=13.74
F[,0.01] (2,6)=10.92回归方程及系数皆显著
(3)对Z[,3]
项次系数 F值
c
1.6445 1684.7
t
0.6682 208.82
t[,2]
0.0242 3.017
t[,3]
0.00056 0.239
来源
SSRSSE SST
平方和11.94950.0093
11.9588
自由度 3
58
均方 3.9832 0.0019
F值
2130.48
相关系数
0.9996
F[,0.01] (1,5)=16.3
F[,0.01] (3,5)=12.1回归方程显著,但二次方和三次方的系数不显著。
前两个回归拟合图如下:(第一个回归拟合线L1,第二个回归拟合线L2)。
由表中可以看出,回归方程及系数皆显著且丰满的为第二个回归方程。第一个方程的方差估计为S=0.2,而第二个方程的方差估计为S=0.04,显然第二个方程拟合的更好,从上图也可以得到同样的结论。
对第二个回归方程进行残差的Q-Q检验。
残差为:
x[,i]=0.032
-0.031
-0.0490.025
0.022
0.027
0.003
-0.054
0.023
按大小重新排序为
x[,i]=-0.054
-0.049
-0.031
0.003
0.022
0.023
0.025
0.027
0.032
相应的
p[,i]=0.056 0.167
0.278
0.389
0.5 0.611
0.722 0.833
0.944
查表得出相应的
q[,i]=-1.592 -0.967
-0.589 -0.283
0
0.283
0.589
0.967
1.592
计算出
r[,Q]=0.9069
查n=9,α=0.05的相应系数表,显著。于是最后的回归模型为:
z=1.6351+0.6885t-0.031t[2]
即,其中t=(n-1800)/20。
这是个预测公式,但要谨慎外推,这和通常统计推断的道理是一样的。
对这个模型我们有以下的看法:
1.模型是有限区间内的拟合,它也像任何一个统计拟合一样,不能无限制的前验或外推预测。我们的模型正是正态函数的前升区段。因此我们的模型称之为“正态前升模型”。
2.这里自然增长率是时间的函数,λ(t)=β[,1]- 丨β[,2]丨t,其道理是显然的。从1800~1960年,美国处于自然良性的发展之中。首先没有遇到大的灾难性的瘟疫,且躲过了两次世界大战,没有突发的人口减少。其次,随着社会物质文明的发展和科学技术的进步,死亡率逐年降低,生育成活率不断增高;又随着精神文明的发展,出生率逐渐受到控制,最后必然要出现负增长,正如模型所预示的那样。
3.我们预测这个最大值点存在。尽管它可能不会像我们模型预测的那样在t=11.1,即2022年出现。但是,随着新的实际数据的补充,不断修正模型的系数,会逐渐逼近且能校准的预测这个最大值点。