基于双尺度产量统计模型的农作物多灾种产量险费率厘定研究,本文主要内容关键词为:产量论文,费率论文,农作物论文,尺度论文,模型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
2007年,我国启动了新一轮农业保险试点。在中央和各级地方财政的有力支持下,我国农业保险得到了快速发展。2011年,我国农业保险保费收入达到173.8亿元,为农业提供风险保障6 523亿元[1]。与市场的蓬勃发展相比,我国农业保险的科学性与专业化程度仍然较低。到目前为止,仍然缺乏一套经过科学精算得出的种植业保险费率方案。在这样的情况下,无论是经营主体、国际再保险人,抑或监管、财政等相关部门,均无法准确了解我国各地区种植业保险的真实成本、掌握农险经营主体所承担的风险大小。这一问题已经成为我国农业保险可持续发展的首要掣肘因素。因此,必须加强农业保险风险区划的研究,提高农业保险产品定价的科学化水平[1]。
自上世纪90年代以来,我国学者就已经开始了对农业保险风险评估与费率精算的研究。例如,庹国柱和丁少群等人曾系统地分析了农作物保险费率的厘定技术,比较了不同的纯费率的精算方法[2-3]。邓国等人利用全国各省份历年粮食单产资料,确定了全国30个省份和262个粮食专区的保险费率4-5]。邢鹂则提出了社会损失率的概念与计算方法,并依据该指标进行了种植业保险区划[6]。张峭等对中国主产区玉米生产风险进行了分析和评估[7]。杨纳华等基于全国第二次农业普查数据在省级尺度对农作物产量损失风险水平进行了评估[8]。上述研究有力地推动了我国农作物保险的风险评估、费率厘定和区划等方面的工作,却未能有效地解决当前我国种植业保险面临的精算问题。当前我国执行的多灾种农作物保险以农户级别的产量波动为定损标准。研究表明,地区一级(如县级或省级)的平均产量相对波动水平与区域内各农户单产的相对波动的平均状况所表现出的统计特征完全不同[9]。单纯依靠地区一级的统计数据进行统计分析,得出的费率水平仅适于区域产量指数保险,而不能用作农户级别的多灾种产量保险的费率。
北美地区的农户级别产量险在承保过程中,均要求投保农户至少提供5年以上的农田单产记录[10]。这种作法对积累基础数据、确定理论单产、厘定保险费率是至关重要的。然而,我国的农业保险统计制度一直滞后于农业保险本身的发展,在进行风险区划与费率厘定时不能提供有力的支持[11]。针对这一问题,本文开发了一套基于农户级别抽样产量与区域级别统计产量的双尺度数据源的农作物多灾种保险定价模型,并对全国省一级行政单元的水稻、小麦、玉米三种作物进行了案例分析。文章首先依据保险相关原理对我国当前农作物保险的执行条款进行界定,并据此推导了纯费率与农户级别相对减产率之间的关系。据此构建了基于农户级别抽样产量数据的费率厘定方案。在此基础上,通过搜集全国水稻、小麦、玉米等三种作物的省级统计单产序列和各省农业气象站点记录的大田单产序列,测算了各省(直辖市、自治区)的费率水平,并进行了相关讨论。
一、理论框架
根据保险原理,保险人的纯保费收入应足够支付期望保险赔付,纯费率应等于保险人的期望赔付支出与其承保规模的比值。保险人所承担的赔付支出风险由保险标的承担的损失风险(外部风险)与保险合同对赔付条件和方法的界定共同确定。当前我国执行的财政支持下的农作物保险,是以多种灾因作为触发条件、以作物产量的相对减产率为定损标准、以农作物生产的物化成本为最大保险金额的一种产品。此类保险的定损与理赔单元是在农户、地块级别。从触发机制与定损标准的角度来看,与美国和加拿大执行的多灾种产量保险基本一致[10,12,13]。
根据定义,若不实施差别费率,该区域的农险经营主体要求的纯保费收入应为:
对比式(1)、(4)与(5)可知,δ=v的唯一前提是即每块大田的多年平均单产水平相同。在研究区域较小(如生产小组)的情况下这一假设有可能成立。然而,随着区域增大(例如到县或省),地块之间的异质性增强,上述假设便很难再成立。因此,由大田尺度和区域尺度的单产数据分别计算得出的减产率极难相同,在实际定价工作中不能简单地依据区域统计单产估计保险人所承担的风险。
由式可知,在理想情况下只需利用产量统计模型[14]对区域内所有农户的历史单产序列进行建模,并相应计算期望相对减产率即可实现准确定价。在实践中,掌握一个地区(如一个省)全部大田的单产序列数据十分困难,而必须采用统计抽样的方法来进行。式中表达的是一个典型的二阶统计推断模型。首先,求平均值的过程可以采用点估计的方法实现,即通过对大田的期望相对减产率进行随机抽样推断总体的均值。这与我国当前统计部门采用的抽样测产的原理是一致的。其次,随机样本中的大田期望相对减产率可以通过对抽样大田单产的时间序列数据进行统计建模得到。至此,本文设计了一套基于省一级单产序列和大田级别单产序列双尺度数据源的纯费率厘定模型(图1)。
该模型分为三个部分:
(1)在各研究区确定若干抽样大田,获取抽样大田历史产量序列数据,并利用产量统计模型估计各个抽样大田单产的期望相对减产率。
(2)以省(直辖市、自治区)为研究单元,将抽样大田单产的期望相对减产率视作随机样本,对总体(即省内所有大田单产的期望相对减产率)的均值进行估计,从而得出各省的平均大田单产期望减产率,即需要求解的纯费率。
(3)在抽样大田单产数据不足或是缺失的地区,首先依据省级统计单产数据(即省总产量/省播种面积)求解省一级统计单产的期望相对减产率。通过在省级单产期望减产率与省平均大田单产期望减产率之间建立经验关系,即可预测抽样大田单产数据不足的省(直辖市、自治区)的费率。
二、数据与实施
(一)数据来源
本研究使用的数据包括省级和农业气象站点级别的水稻、小麦和玉米的产量数据。省级产量数据涵盖全国31个省(直辖市、自治区)的三种主要粮食作物(水稻、小麦和玉米)的1978年—2008年(长度为31年)的逐年产量数据①,一个序列包含三个属性列:总产量(千克)、总播种面积(亩)和单产(千克/亩)。数据来源为中国统计局、中国农业部等国家权威部门机构发布的中国统计年鉴(1979年—2009年)、中国农村统计年鉴等出版物和种植业信息网(http://zzys.agri.gov.cn/)。
本研究中使用的抽样大田数据来自国家气象局在各地设立的农业气象站点记录的大田尺度的作物产量数据(国家气象局档案资料馆),时间范围为1994年—2005年(部分大田的记录的单产长度少于12年)。各省市的抽样大田数量的统计结果见图2。
(二)期望减产率估计
本文主要利用产量统计模型估计各单产序列的期望减产率。这一方法的核心是估计农作物产量随机变量所服从的概率密度分布,从而找出其均值作为“理论产量”,并相应计算在不同免赔条款下的期望减产率。产量统计模型的核心技术流程包括对单产序列的趋势处理与分布拟合(图3)。产量统计模型可以用于任何尺度上的单产序列数据,但估计结果的物理意义因尺度不同而不同。在本文中,产量统计模型就将分别应用于各农气站点记录的大田单产序列和各个省级统计单产序列。
(1)趋势处理
在利用历史产量数据拟合产量概率密度分布时,一项重要的前提假设是不同年份的产量间相互独立。然而,由于技术进步、自然环境的趋势性变化、农田基础设施改善和劳动者素质提高等原因,使得不同年份期望产量之间具有一定的上升或者下降的趋势,导致独立同分布的假设失效,因此必须先对农作物历史产量数据去趋势处理。在单产去趋势处理中有许多成熟的模型,例如线性趋势模型[15-17]、非线性趋势模型[18-20]、自回归综合滑动平均趋势模型[21-23],卡尔曼滤波器[24]等。
在本文中,首先利用ARIMA模型[21]进行单产的趋势分析。分析结果若通过显著性检验的模型是ARIMA(0,0,0),表示该模型的检验出的单产并未存在长期的趋势变化,原始的单产数据即为无趋势的单产,无需去趋势处理。若趋势模型为ARIMA(0,1,0),模型只是对原始单产数据在时间维度上进行了一个简单的平移处理(一阶差分),说明有趋势存在,然而其本身对趋势捕捉的效果很差。在这种情况下,选取对数线性模型[25]替代ARIMA(0,1,0)模拟单产的趋势变化。
(2)概率密度拟合
在当前模型框架下,共有三个环节需要对概率密度函数进行拟合:(a)各抽样大田单产所服从的概率密度分布,用于估计各抽样大田单产的期望相对减产率;(b)省级单产所服从的概率密度分布,用于估计各省级单产的期望相对减产率;(c)抽样大田的期望相对减产率服从的概率密度分布,用于估计该省的平均期望相对减产率(即纯费率)。在充分考虑样本个数情况的条件下,(a)选取了最优高斯窗宽核密度估计;(b)和(c)均选取了最优参数估计。
由于各省农气站点记录的抽样大田数据时间序列较短,只有1994年—2005年的12年的单产数据(部分大田记录的单产长度少于12年),在实际估计中进行了数据的“扩充”。本文采用了模拟“假”产量数据(pseudo yield)的方法[26]。该方法将大田单产视作省级单产基础上的一个随机波动,且这种随机变化不依赖于省级单产的实际值:
在假定这种基于省级单产的随机波动是对省级单产无差别的情况下,可将某一年的产量波动用于其他年份,从而达到数据样本扩充的目的。基于省级去趋势单产和上述的波动序列,因此通过下式可以模拟大量的大田数据,
基于上述扩展的大田单产数据,利用最优高斯窗宽核密度估计方法(Kernel estimation)[1998]拟合单块大田的单产概率密度分布。
在对(b)和(c)进行估计时,本研究中选用的参数估计模型,主要考虑了Normal,Lognormal,Beta,Weibull四种函数。采用的方法是最大似然法,优度检验则采用了K-S拟合优度检验,从而确定符合对象样本的概率密度最优分布模型。
(3)期望相对减产率
在求解得出目标单产服从的概率密度分布(省级和大田级别)的基础之上,可依据下式计算单产期望减产率。
(三)经验关系
在前期求解得出各省的省级单产减产率期望值,以及部分省份的省平均大田单产减产率期望值的基础上,对二者之间的经验关系进行分析(图4),用于推测对缺少抽样大田数据省份的纯费率。
从图4中可以看出,三种作物的省级单产期望减产率与省平均大田单产期望减产率的相关性分析的决定系数值均较高,两者间存在显著的相关性(均通过了5%显著性检验),即样本大田表现出的平均单产波动越大,区域尺度的省级总单产的波动性也就越大。同时,拟合的三个关系式的斜率参数均大于1,并且截距大于0,反映出省平均大田单产期望减产率要高于省级统计单产期望减产率。究其原因,农作物生产存在着较明显的省内丰欠互补现象,省级的作物单产波动和作物种植面积呈现出一定的负相关关系,即作物种植面积越大,省级单产越稳定。因此,使用省级统计单产数据极易造成对农户级别的单产波动和期望减产率的低估。三种作物中,小麦显现出的低估效应最为明显(斜率最大)。
三、纯费率测算结果
经过上述计算,最终得到各省(直辖市、自治区)3种农作物的综合纯费率水平(见表1)。在测算过程中进行了如下处理:(1)凡抽样大田数据个数满足推断省平均减产率的数目时,依据省内所有抽样大田的期望减产率进行参数估计的最优分布拟合,从而得到该省平均大田期望减产率,即对应的纯费率。(2)凡抽样大田数据不足,无法直接利用抽样数据进行推断,且种植规模达到10万亩以上的,依据前文节导出的经验关系,基于省级单产期望减产率推算出省平均大田单产期望减产率,并作为对应的纯费率。(3)凡抽样大田数据不足,无法直接利用抽样数据进行推断,且种植规模未达到10万亩的,认为省级单产期望减产率可以近似为纯费率。
从表中可以看出,各省市水稻纯费率的分布范围在5.9%~18.4%,费率均值为9.0%;小麦纯费率最小值和最大值分别为6.9%和20.5%,均值为12.3%;玉米对应的纯费率分布范围为7.0%~12.7%,均值为9.9%。三种作物中,小麦的纯费率均值最高,玉米次之,水稻最小,揭示出小麦在全国范围内的平均减产率和生产风险的平均状况要高于玉米和水稻。旱灾是造成我国粮食减产的最主要的自然灾害之一[27]。我国旱灾的高发区主要位于西南地区(云、贵、川南及周边地区)、华北地区和北方(内蒙古、辽宁、吉林交界区域)[27],是我国小麦、玉米等夏粮作物主产区。相比之下,水稻生产受到的影响相对较小。因此,降低和防范小麦的种植风险应该受到更多的重视。
除了位于我国西部和北部地区的西藏、吉林、天津、甘肃和新疆等少部分省市的水稻费率在10%以上,我国大部分地区的水稻费率均在10%以下。我国西部和北部地区自然地理环境恶劣、气候系统不稳定且波动性较强,导致了西部和北部地区的水稻生产具有较高风险,为较不适宜水稻种植区。东北三省、内蒙古、甘肃、陕西、北京和天津等北方地区的小麦费率均高于全国平均水平,是小麦种植的高风险区。我国广大中部地区和南方部分地区的小麦生产风险较低。全国所有省市的玉米纯费率均在10%左右浮动,变化幅度很小,费率最大的安徽省与费率最小的新疆自治区差值仅为5.7%,远远小于小麦和水稻的费率变化区间(区间长度分布为12.5%和13.6%),显示出我国的玉米生产在全国范围内风险的地域差异相对较小。
四、结论与讨论
为了克服单纯基于省级单产数据计算农户尺度农作物保险费率可能导致的误差,本文辨析了农户尺度单产平均减产率与省级尺度单产平均减产率的差异,发展了基于双尺度产量数据序列进行多灾种产量险费率厘定的方法,结合省级统计单产序列和农气站点抽样大田单产序列两类数据,厘定了全国31省(直辖市、自治区)的水稻、小麦和玉米三种作物的纯费率,得出以下初步结论:
(1)省级单产期望减产率与省平均大田单产期望减产率有本质的区别,但二者之间存在一定的相关性,可以基于省级单产期望减产率推算省平均大田单产期望减产率的大小。
(2)全国范围内各省(直辖市、自治区)小麦纯费率均值最高,反应了小麦的生产风险平均状况要高于玉米和水稻。相比之下,应该更加关注和防范小麦种植的减产风险。
(3)水稻在我国西部和北部的费率值较高,东北三省、内蒙古和甘肃等北方地区的小麦费率也相对平均水平要高。水稻和小麦的纯费率在全国范围内的分布差异较大,而玉米的较小。
本文所提出的此套模型在方法上是可行的。除了上述示例中的应用方法外,地区级别的统计单产序列亦可以更换为市、县(区)一级的单产数据。抽样的农户单产也可以是农气站点记录的数据以外的数据序列。例如,我国统计部门的农业调查队每年进行抽样测产时所记录的大量大田级别的抽样单产数据就是十分理想的数据源。除此之外,在确保抽样对象的空间尺度与保险标的一致的前提下,该方法亦可拓展到其他以产量为触发和定损标准的种植业保险产品。因此,这一方法在我国进行种植业保险定价时具有较强的适用性与应用前景。
注释:
①重庆市于1997年成为直辖市。本文依据《四川统计年鉴》(1987-1997)记录的分地区农作物产量数据,将重庆市与四川省其他地区分离,形成两个独立的序列,分别与行政区划变动后的重庆(直辖)市和四川省对接。在测算过程中,重庆市与四川省的数据序列为1986年—2008年(长度为23年)。