论计量经济学识别理论与统计应用的关系,本文主要内容关键词为:经济学论文,理论论文,关系论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
模型识别理论的背景是考虑模型是否可以估计的,但从不同的角度可以有不同的定义,按照识别的原意,一个方程是否可以识别就是看它是否具有确定的统计形式(若一个方程与模型中部分或全部方程的线性组合具有相同的统计形式,则该方程不具有确定的统计形式,否则该方程具有确定的统计形式)。当一个方程具有确定的统计形式时,即该方程可以识别时,我们可以得到它的参数估计;否则,无论使用何种估计方法都无法得到它的参数估计。
从简化式模型与结构式模型的关系角度,可以说识别问题是考虑能否从所估计的简化式系数求得结构式系数,如果能,则结构方程是可以识别的,反之则不可以识别。我们要注意这里应有一个前提,那就是我们首先要得到简化式系数的估计值;同时还要注意它的估计值与理论值是有差别的。
上述识别概念的论述中,有若干值得讨论的问题,已引起许多学者(参见文献①②③④)的考虑。本文从识别理论与统计应用的关系这一角度对这些问题进行讨论,以给出更清晰的论述。
我们认为,对于识别理论,首先应明确它的地位以及它与统计应用的关系。计量经济学考虑问题的一般步骤是:建立模型,识别模型,参数估计,显著性检验及应用。模型识别是连接模型设定与参数估计之间的桥梁,建立了联立方程计量经济学模型以后,要进行参数估计,必须先判别方程是否可识别,只有可识别的方程才能得出其结构式参数,可以认为此时识别作为得以严谨的概念化的理论,已成为相对独立的部分,被从模型设定与估计中分离出来,正像有的学者分析到:“由于识别涉及结构式方程参数的定值问题,是先于估计的逻辑问题,所以识别不是统计推断中的问题,而是产生于模型建立与对变量概率分布解释之间的一个先验问题,从这一角度出发,有必要对识别单独考虑”。“识别是模型自身的内在性质,它完全独立于结构估计统计抽样方面的任何问题,必须将识别与估计区分开来”。但是在对可识别的方程进行参数估计时,不同的识别类型(恰好识别或过度识别)与参数估计方法联系起来了,实际上,对于识别理论我们应考虑二个问题:一是如何确定哪些方程具有“相对稳定的参数”(或参数可识别)?二是对这些可识别的参数进行估计的条件是什么?识别条件与变量X、Y的分布形式密切相关,与误差的分布状态密切相关,虽然可以认为识别问题严格地讲不属于统计推断问题,但识别理论必须探讨统计推断的界限,此时应强调识别与统计推断的联系,识别将作为从观测变量的概率分布出发对其真正内在的结构进行推断的问题,对识别进一步加上统计的含义,当识别理论一旦由统计方法来表述,其内容便更加充实,才有实际意义。
有了上述对识别的认识,可以清楚地了解识别理论的双重性,作为连接模型设定与参数估计之间的桥梁,识别问题具有一定的独立性,必须先判别方程是否可识别;但对可识别的方程进行参数估计时,识别与估计是联系在一起的。所以理论上说只有可以识别与不可识别之分,在可以识别时不存在恰好识别与过度识别之分;当对可识别的方程实际进行参数估计时,却必须考虑恰好识别与过度识别的区别。我们以下面的实例纠正以往的几个不恰当的论述。
上述说明有若干不妥之处。首先,从纯数学的角度讲,8个简化式参数(或对应8个方程)确定7个结构式参数并不一定能获得(多组)解,而可能无解;但从该具体模型本身讲,这8个简化式参数中有些成比例(理论上),对应地8个方程中有些成比例,于是可能正是由7个简化式参数确定7个结构式参数;再次,如果根据识别的原意,需求方程与供给方程都是可识别的,此时结构型秩条件满足,可以由简化式参数惟一求出结构式参数,而与k-k[,i]>g[,i]-1无关。
对于过度识别问题应当准确理解为:首先,理论上不存在过度识别问题,只有识别与不可识别之分;苟玉玺[1,2]已对此进行过讨论。其次,实际应用中考虑过度识别问题是因为:一、实际的参数估计存在误差,在k-k[,i]>g[,i]-1时可能导致由简化式参数的估计值求得结构式参数的多组值;对应地,本来理论上互成比例的简化式参数估计值并不成比例;所以有必要对此种情况进行考虑。从另一角度看,在简化式参数个数多于结构式参数时,最好拥有附加约束条件,否则在从简化式估计结构式时就会产生信息的浪费,所以此时确实为一种值得考虑的情况。二、虽然有的学者认为应将识别与估计区别开来,但识别问题与估计方法却是密切联系的。当可识别时,在具体的估计方法应用上,对于k-k[,i]=g[,i]-1与k-k[,i]>g[,i]-1两种情况是不同的。对k-k[,i]=g[,i]-1,我们称为恰好识别,此时应用各种估计方法将得到相同的参数估计量:主要根据估计方法的简易性选择应用。对k-k[,i]>g[,i]-1,不同的估计方法将得到不同的方法参数估计量;并且对于工具变量法,此时从k-k[,i]个先决变量中选择g[,i]-1个作为工具变量,有一定的任意性,而且有(k-k[,i])-(g[,i]-1)个先决变量未被应用,估计参数时就失去了这部分经济变量所提供的信息,或者认为模型是过度识别的;所以对过度识别模型来说,估计方法的选择就特别重要,这正是我们要考虑过度识别模型的最主要原因。