最优税收理论及其政策含义,本文主要内容关键词为:最优论文,税收论文,含义论文,理论论文,政策论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
税收问题是一个古老的话题。但是,讲究征税的优化,税制的优化,是20世纪经济学的一种进步。尽管从休谟以来的经济学家都已认识到,一项税收,如果是针对供给无法改变的生产活动或产品而开征,便可以最大限度地降低税收的扭曲效应。然而,真正在理论上阐明税收优化的基本原理,是由兰姆斯开始的。兰姆斯在20世纪30年代撰写的《对税收理论的一个贡献》一文一直被理论界所忽视,只有在50年代和70年代初被讨论过两次。1951年法国经济学家布尔塔克斯在设计法国国有铁路的运输定价时遇到了国有企业向政府财政的上缴问题,他发现国有企业的产品价格实质上包含了税收,国有企业通过向广大消费者收取含税价格,可以为政府筹措财政岁入,但问题是,含税价格会引起资源配置的扭曲。于是,布尔塔克斯发现了兰姆斯论文的价值,他研究的题目是价格如何分摊政府的财政岁入从而使扭曲程度最低?这实质上给出了一个关于国有企业产品定价的理论模型,这直到今天对中国相当部分的国有企业定价仍有启发。几乎同时,美国经济学家萨缪尔逊从一般均衡理论出发,解出了兰姆斯提出的问题,给出了最优税收的一般形式,并以此为基础,就征税向美国财政部提出了9条具体意见。
如果说50年代的讨论只是初级的,那么20世纪70年代的讨论,则使兰姆斯理论模型在深度与广度上都有了重大突破。正是70年代的讨论,使最优税收理论形成了体系。参加讨论的人物主要有米尔利斯、代尔蒙、鲍莫尔和迪斯特等,这场讨论之所以能够深入,是由于经济学家们有了新的经济学概念、体系与方法,并且在经济研究中运用了新的数学方法。这场讨论的理论成果在1996年获得了诺贝尔经济学奖。
税收是一项十分具体、操作性很强的工作,但是,要在理论上对此进行分析,则需要极强的抽象能力。这是由于,如何征税是属于规范经济学的内容:又要求最优税收,而最优化又是实证经济学的核心内容。这样,最优税制理论必然牵涉到微观经济学的基本内容。事实上,最优税收之所以被兰姆斯加以研究,并使这种研究富有成果,也是由于微观经济学在当时已有了诸如一般均衡、斯拉茨基替代矩阵、间接效用函数,罗尔恒等式等等新的理论范畴与发现。至于20世纪70年代那场讨论更是以不确定性、代理问题、信息经济学在60年代的初步成果为基础,并在方法论上借用了60年代最优增长理论的成果,由米尔利斯和代尔蒙这两位原本是研究最优经济增长的理论家来突破的。而这场讨论所产生的委托——代理理论、信息不对称条件下的契约理论、激励理论等等,反过来对当代微观经济学产生了革命性的影响。
税收与税制研究已经成为我国财政学研究的一个重要方面,但“优化”这一理念还不够深入。我们往往强调以征税来加强政府宏观调控、调节收入分配等作用,而在政府与政策研究中很少见到优化税制的讨论。税收优化的实质是政府行为与规制的优化。这无疑是推进中国经济体制改革与经济发展所必需的。为此,我们应该研究最优税收理论,并联系实际,使政策与税制设计体现最优税制的基本准则。
一、什么是最优税收原则?
最优税收理论有许多基本定理,因而最优税收也就有许多原则。但是,如果从一般意义上说,有两个最基本的最优税收原则,它们听起来非常简单,又一目了然,同时还具有强大的、广泛的含义。这就是米尔利斯1994年在欧洲经济学年会的“马歇尔讲座”的演说中加以归纳的两条最优税收基本原则。
第一,“税收原则”,即当对行为的观察是不完美时,一般说来就需要对交易进行征税。这一原则以信息不对称为前提。强调了信息不完全或不完美对于征税的限制,同时也指出了在这种限制下如何征税的途径。在分析过程中,它按照信息经济学的传统,把观察不完美的行为变量称为“私人变量”。比如在典型的委托——代理框架中,纳税人是代理人,对于自己的行为具有完全信息;而政府作为委托人,对于代理人的特征的信息是不充分的,这里就发生道德风险,纳税人(代理人)可以进行选择,于是“私人变量”就产生作用;但即使是代理人,对于其私人选择所带来的后果也是不确知的,他们可以欺君,但要承担这种私人选择所带来的风险。既然对于私人行为的观察不完美,政府征税就只能按行为的结果——那就是可以观察的交易额来收税。这便是对产品与劳务的交易所征收的税。
第二,“非税原则”,即当人们对一组商品中不同商品之间的偏好是独立于私人变量时,则关于该组商品的相对价格就不应被税收扭曲。这一原则是以私人变量与个人偏好相分离为前提的,即它承认私人信息、私人变量的存在,但假定它们不改变人们对不同商品的偏好。比如,在一个一般均衡模型中,私人变量就是个人的特征,但若考虑总体生产的有效性,就要撇开这些私人变量,专门研究税收与生产者之间的关系,按照这一原则,对生产者之间的交易就不应该征税。又比如,如果已知在纳税——征税关系中存在信息不对称,但如果个人之间对于任一组商品的偏好是相同的,那也相当于偏好独立于私人变量,这时,按第一原则,信息不完全要求对交易征税,从而税是免不了的;但按第二原则,征税在偏好独立于私人变量时不应扭曲人们的偏好,那么一旦征税,也应该对消费者偏好相同的不同物品或劳务开征税率相同的税。
简而言之,第一原则是关于在私人变量起作用条件下如何征税的问题,这是米尔利斯——代尔蒙在20世纪70年代初研究的问题。第二原则是关于私人变量不起作用的条件下或不征(退)税、或在不得不征税时如何避免扭曲效应的问题,这是兰姆斯在1927年研究的主要问题。
二、兰姆斯规则
在兰姆斯之前,在英国经济学界占统治地位的税收原则是埃奇沃恩原则。埃奇沃恩的税制设计基于以下四个假定:(1)社会福利是个人效用函数的简单加总(未加总);(2)所有的个人效用函数是相同的;(3)效用是收入的增函数,但收入的边际效用递减;(4)社会总收入为固定常数。按这四个假定,只有当每个人在消费上所花费的最后——单位货币的边际效用都相等时,社会福利才极大。但由假定(2)与(3),要使每人边际效用相等,便要求每人可支持的收入相等。这样,通过一种累进的所得税制将富人收入转移给穷人,实现收入均等,便是满足社会福利极大的最优税收。不难看出,埃奇沃恩的税收原则,在效率与公平的天平上,明显地偏向于公平。
庇古与凯恩斯对这种偏重公平、忽视效率的税收原则有异议。但是,如何按效率原则来设计税制?他们并没有拿出理论的证明。于是任务就交给他俩的学生兰姆斯。
兰姆斯的出色之处在于他从现实中提炼出一个简单而又有穿透力的问题:设一个竞赛性的经济,其中有n种商品,但劳动的形式只有一种;劳动是唯一的投入品。又设每一生产部门只生产一种产品,且生产的规模报酬不变;又假设经济中的人口由相同的家庭构成,即家庭间偏好相同,这样,可以假定经济中只存在一个家庭。在此,生产的规模报酬不变的假定具有边际成本(等于平均成本)都不变的含义,即对于每一类产品i的产出,为了每一个单位产出品,便需要c[i]的劳动投入量。设工资率为w。这样,在完全竞争条件下,由价格等于边际成本的原理,就是税前价格的决定公式:P[,i]=c[i]w(I=1,2,3,……,n)。现在考虑政府财政开支为R,它必须通过对商品开征商品税来实现,这样,对消费者支付的含税价格(记为q[,i])就等于税前价格p[,i]与税额t[,i]之和,即:q[,i]=p[,i]+t[,i](i=1,2,3,……,n)。设家庭(这里只有一个)对商品i的消费量为x[,i],则政府必须维持的财政总收入R对于经济来说便是一个必须遵从的约束,称为岁入约束。该岁入约束可以写为政府拿R干什么呢?兰姆斯假定政府用R去雇一部分劳动,从事不提供任何消费品的服务(如国防)。由于社会中只有一个家庭,因此社会福利就由该家庭的效用函数表达。但是,值得注意的是,兰姆斯巧妙地运用了间接效用函数U=V(q[,1],q[,2],q[,3],…,q[,n],w,I),在这函数中,间接效用V是税后价格(q[,1],q[,2],q[,3],…,q[,n]),工资率w,与收入I的函数。由于生产呈规模报酬不变,利润为零,因此家庭无利润收入。只有工资收入,它由w决定。但由于工资又全用于买自己生产的产品,交易发生于一家之内,最后总额的工资收入也为零。
有鉴于此,兰姆斯的问题就是,为了保证政府财政收入R得以实现,又要使社会福利极大,那么设计什么样的税制即t[,i](i=1,2,3,……,n)等于多少,才是最适合的呢?应该说,兰姆斯所提炼的问题实质上是每一个政府都面临的。中国政府在设计分税制时,就考虑过,在保证现有的财政总收入不减少的前提下,如何将现行的建筑安装业的营业税改为增值税,则增值税的税率要定得多高才合适?这不就是兰姆斯提到的那个问题吗?R是不能变的,是必须服从的,但t[,i]可以选择。因此,我们在讨论最优税收时,一定是在保证中央政府的财政总收入不下降的前提下进行的;但在这一前提下,如何选择t[,i],使是大有作为的。
对兰姆斯的上述表述,也许有人会对经济中只有一个家庭的假设提出疑问。对此,萨缪尔逊在1986年发表的《最优税收理论》一文中作出了解释。萨缪尔逊认为,“一个家庭”的假设在下列两种情况下是合理的:(1)如果税收项目对于全体公民的效应是方向相同的,这时,不同的家庭实质上会相当于同一个家庭来对税收作出反应;(2)这种“一个家庭”的假设是以现存的收入分配已达到了合理为前提的,即它实际上假定个人之间的公平问题在征税以前就已经按某一社会准则达到了最佳,从而,不考虑税收在个人之间的公平问题,社会相当于一个联合体,即一个家庭。从此我们可以看出,“一个家庭”的假设事实上将“收入公平”问题从最优税制设计中排除了出去。因此,兰姆斯所讨论最优税收原则,就只是一个效率原则。这正是与埃奇沃思相反的另一个极端。它同样具有片面性。由此给我们的启发是,兰姆斯的《对税收理论的一个贡献》的论文之所以在20世纪30~70年代前期长期被西方学界与政府忽视,一个可能的社会原因就是,那个时期正是西方国家盛行福利国家的时期,公平被置于效率之上。而70年代初兰姆斯的论文之所以受到如此青睐,其中也有着深刻的社会背景;连西方也需要改革福利国家这种体制了,从而使理论的重心从公平这一头倾斜于效率的那一头。
三、理论推导与结论
根据兰姆斯规则的基本内涵,兰姆斯问题可以由下列数学规划表示:
其相对应的拉格朗日函数为:
上式对任何一种商品征税都是成立的。也就是说,若对所有产品中任一产品K开征一道税,则其引起的效用成本是与其他产品分担相同比例的财政负担。换句话说,为了多征收一单位财政岁入,不管税对哪一种产品开征,消费者所放弃的效用都应该相同。
如果用Roy恒等式与斯拉茨基公式将会把上述思想表达得更清楚一些。从Roy恒等式出发,可知:
这里,I为家庭的一次性总额收入,a是收入的边际效用。I中没有利润收入,I只代表劳动收入与出售禀赋后的收入。如果将(7)式代入(6)式,就可以得到:
公式(11)就是著名的兰姆斯规则。这一规则的含义是:第一,开征商品税后最小的扭曲效应为多少?由于斯拉茨基公式中的替代效应,所以公式(11)说明,若政府对所有产品开征了税t[,i](i=1,2,,n),这全部的征税活动对于购买消费品X[,k]的扭曲效应如加总起来,则相当于税前消费者对K的购买量减少了一个常数为θ的比例。由于X[,k]任意给定的,θ对每一种商品K是相同的,所以,兰姆斯规则实质上是说,若政府对所有商品征了税,又假定个人的纳税损失经过了补偿,则最优税收便要求税后消费者减少对于任一种商品K来说都是同比例的。第二、兰姆斯规则并不要求税后使每一种价格同比例上升,却要求每一种商品的消费同比例下降。关于这一点,我们只要将公式(11)稍作改进就一目了然:在公式(11)两边同除以X[,k],便有=-θ。在这里,左端的分母是一个实物量X[,k],即商品K的税前购买量,左端的分子也是实物量,这个分子只是度量所有的商品税(t[,1],t[,2],…t[,n])对于商品K的希克斯需求量的替代效应,也是以购买量变化来衡量的。因此,在这里,公式的左端只是表达征税后商品K的消费量所发生的相对比例变化,而决不是K的价格所发生的相对变化。这一点必须加以澄清,因为在经济学文献里,有人认为兰姆斯规则只要求税后价格变动相同;而且我们在实际税务工作中,也往往认为对税前价格加一个比例相同的税率会容易操作。但这不符合兰姆斯规则的原意。实质上这里说的是,在最优商品税时,消费者在每一种商品K的消费上的比例下降应该相同,即:d[,k]=其中d[,k]中的d表示比例“下降”。为什么用“d”?那是由于米尔利斯(1976年)用它来表示“沮丧指数”,即征税给消费者所带来的沮丧程度。因此,兰姆斯规则是说,一种税制若是最优的,则它给消费者带来的沮丧指数在每一种商品上都应当相同。那么,θ是否会负?不会。为什么?因为在公式(11)两边同乘上t[,k],然后再对K加总,使得等式的左端相当于将斯拉茨基矩阵的每一项都相加,由于S[,ki]<0,t[,i]>0(同理t[,k]>0),所以,等式的左端为负,于是-θR<0,即θ与R同向;但已知R>0(政府财政收入必为正),所以θ<0。
兰姆斯规则是在一个竞争性的经济中最优商品税必须具备的必要条件。它所表达的含义是,如果为了保证政府开支R而不得不对商品和劳务征税,那么,征税之后,消费者对每一种产品的实际消费应等比例减少,然后将这减下来的资源以财政上缴的形式供政府去使用,但消费者的消费结构以及资源配置的初始结构仍保持不变,这样,便使税收的扭曲作用降到了最低限度,使经济效率的破坏程度降到了最低限度。从这个意义上说,兰姆斯规则其实就是效率准则。
更进一步地说,兰姆斯规则实际上是以一般均衡为前提的,它考虑到对一种产品征税之后所涉及到的全部相关效应。在公式(8)中,商品K的含税价格变动(由t[,k]变化所导致的)会引起别的商品i的需求量的变动,从而有这一加和项。这一加和项,就是对征税后的一般均衡效应的考虑。
四、理论引伸:鲍莫尔——布兰福特的“反弹性原则”
但是,如果商品需求只对自身价格变动作出反应,而不对别的商品的价格变化作出反应,即如果不存在商品需求之间的交叉效应,那么就有(只要i≠k),把它代入公式(8),公式(8)就递退为:
公式(14)表示“反弹性原则”。它表明,若商品之间不存在交叉效应,则税收与含税价格之比就应该与需求的价格弹性成反向变动;需求的价格弹性越高,(绝对值)越大,则税率就越低;反之,税率越高。这个“反弹性原则”是由鲍莫尔和布兰福特(1970年)推导出来的。需要指出的是,鲍莫尔——布兰福特的“反弹性原则”只是在极端条件下对兰姆斯规则的一个引伸,即它排除了商品需求之间、价格之间的相互影响,实质上它将兰姆斯的一般均衡分析降为局部均衡分析。这种分析的好处是,将商品税税率的高度与商品本身的需求弹性的大小联系了起来,对于千百年来政府对需求弹性低的物品(如盐、烟、酒等)开征高税的政策作出了理论说明。
然而,这种“引伸”是应该非常谨慎的,否则,我们就可能犯错误。因为,(1)商品需求之间完全互相独立这种情形是不大可能的,土地、酒、烟等物品看上去与别的商品在需求或供给上关系不大,但事实上仍是有关系的。撇开对这种商品征税会产生的间接的交叉效应,是片面的。(2)兰姆斯规则的本意并不在于找出税额与含税价格之间的相对比率,而只是找出征税后在实物量的相对损伤程度,并且,他强调的不是弹性,而是替代效应的作用,但鲍莫尔——布兰福特的引伸就转向了税率,而且不谈替代效应、只谈弹性,这在分析层次上是更为粗糙的,由此可能发生分析失真。(3)“反弹性”原则在实践上的应用会引起一国的税基过窄,即政府岁入主要依赖于几个主要的消费税。