基于贝叶斯分类器的税收评估模型研究_贝叶斯论文

基于贝叶斯分类器的纳税评估模型研究,本文主要内容关键词为:模型论文,贝叶斯论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

作为申报征收与税务稽查之间的一道“过滤网”,[1]纳税评估是一种在信息化手段支持下的风险审查纠错机制,[2]是构建税收征管体系的核心内容。[3]纳税评估已经成为税务机关新时期强化税源管理、为纳税人提供深层次的服务、促进诚信纳税的一种具有综合效益的征管手段。[4]

运用科学、先进的评估模型手段,降低评估风险和成本,提高纳税评估工作的整体效率和效果,成为纳税评估工作的关键问题。[5]本文试图构建贝叶斯分类纳税评估模型以辨明纳税人的税收遵从状况。贝叶斯分类纳税评估模型可以同时考虑各项指标进行综合分析,并随着数据库的累积,通过学习机制,及时揭示各类群对象属性的动态变化过程,在连续分析过程中自动地逐渐提高分析的准确性和可靠度。

二、现有纳税评估方法评价

税务机关一般通过定性和定量方法对评估对象的纳税资料进行评估。[6]定性分析是运用税收政策和实践经验,对纳税人、扣缴义务人的生产经营和税收发展趋势做出判断,并结合其现状,判断分析其是否诚信纳税的经验判断方法。定量分析主要是指标分析,税务机关根据所掌握的纳税人的各方面信息,将纳税人的纳税能力与其财务状况,以及其他相关信息进行整合,利用财务指标的内在联系性和财务指标与纳税能力的逻辑关联,并根据实际情况制定相应的预警值进行分析,从而判断纳税申报的数据是否合理属实的分析方法。纳税评估必须同时使用定性和定量的两类分析方法,才能获得各种税源管理必备的决策信息。

目前,纳税评估分析主要是通过由防伪税控系统开具的进、销项税额的分析,销售额变动率分析,税负率差异幅度分析等单项指标的对比分析,判别纳税人是否“异常”。再通过加权计分判断等方法进行综合分析,确定纳税人、扣缴义务人是否存在税法执行偏差。这些基于单一指标对比分析、简单加权综合处理的方法,[7]并不能够真正有效地揭示各指标之间的综合效应,也不能通过数据分析过程自我学习,适应环境和评估对象的改变。也有学者尝试使用logit分类模型[8]等方法做了一些有益的探索,取得了较满意的效果。

三、纳税评估指标体系的构建

纳税评估指标是税务机关筛选评估对象时,对纳税申报的真实性、合理性、合法性做出判断的重要依据。[9]构建的纳税评估指标体系应能系统地反映纳税人、扣缴义务人纳税申报的情况,企业申报税负与企业应纳税水平的相符情况。[10]建立纳税评估指标体系的基础是获取纳税人、扣缴义务人及其相关各种信息资料。[11]

纳税指标体系应该分行业、分税种设置。[12]本文为分析表述简化明了起见,以生产型企业的综合纳税状况评估为基础进行分析。综合考虑实践经验判定数据、相关专家意见和数据可得性后,设定以下九项分析指标(见表1)并运用专家意见法征询纳税征管实际工作者和有关研究所、高校相关人士意见的基础上,给出了各指标异常的判定标准。

 

四、贝叶斯分类纳税评估模型

贝叶斯分类判断模型是基于贝叶斯定理构造出来的一个统计分类器,能够预测数据对象类别所属的概率。在处理大规模数据库时,贝叶斯分类判断模型表现出较高的分类准确性和运算性能。[13]从理论上讲,贝叶斯分类模型具有最小的错误率[14]。

将贝叶斯分类判断模型应用于纳税评估过程,形成贝叶斯分类纳税评估模型。它可以根据需要,依靠已有数据库对评估对象按照不同统计口径分别从综合分析和各具体税种分析两个方面进行是否依法纳税的分类属性做出预测。分类类别的数量可以根据需要自行设定。为了简便起见,我们在这里做以下假设:

(1)每个企业是一个样本记录,由一个n维特征向量X来描述其n个属性的具体取值。

为了估计各类别的事前概率,需要具有训练样本集。可以以税务局数据库中各企业相关信息和当年是否有偷逃税记录为类别属性,构建当前的训练样本集,以后各年可以随着训练样本集中样本量的增大,分析计算基础变得更加接近于实际状况。

五、模型实证分析

1.样本确定、数据采集与分析前处理

笔者通过相关数据采集表格,随机抽取了某市某区32家生产型企业作为样本,采集了它们是否属于税法执行偏差者和各分析指标的相关数据,其中22家存在税法执行偏差,10家不存在税法执行偏差。为了便于分析识别结果的可靠性,用spss15.0软件按照所有记录的70%比例将所有数据随机划分为训练样本数据和验证样本数据两类,前者计24个数据,后者计8个数据。对训练样本数据做分析前处理,凡是符合异常情况的数据设定为1,凡是其他情况的数据设定为0。对于缺失数据,均视为异常数据。

2.实证分析及结果

在验证性样本中,8个待检验数据预测结果仅有2个与实际状况不一致。据此计算出评价模型预测准确性的五个主要指标[15]结果如下:(1)预测总正确率,指被正确分类的企业占全部企业数量的比例,为75%;(2)敏感度,指正确预测税法执行偏差者的程度,为预测正确税法执行偏差者人数占税法执行偏差者总人数的比例,为50%;(3)指定度,准确预测的诚实纳税人人数占全部诚实纳税人人数的比例,为100%;(4)纳伪率,即误将税法执行偏差者判定为诚实纳税人的人数占所有被预测为诚实纳税人总人数的比例,为33.3%;(5)弃真率,即误将诚实纳税人判定为税法执行偏差者的人数占所有被预测为税法执行偏差者总人数的比例,为0%。可见预测准确性较好,判定的税法执行偏差者都是实际存在问题的对象,但是敏感度有待进一步提高,纳伪率有待进一步降低。由于贝叶斯分类模型是一种基于海量训练样本的分类方法,随着样本数量的增多,预测结果将进一步得到改善。

由于训练样本和验证样本中样本企业数量较少,且申报表信息核对与营业税负比较两项指标的缺失值较多,致使本实证分析准确率有所下降,纳伪率较高。实证分析的结果并不能完全揭示模型的优缺点,但是已经能够对模型的有效性进行证明。

六、结束语

税收评估模型是税收评估工作是否能高效顺利完成的关键。贝叶斯分类纳税评估模型能够有效地发现税法执行偏差,能够较为准确地发现税法执行偏差者,但是在小样本实证分析中,也表现出了对于税收征管工作有较强的实践指导意义。但是由于样本数量较少,部分指标缺失值较多等原因,模型的预测准确性评价指标显示还有待进一步提高。在样本逐渐积累过程中,随着样本数目的增多,该模型的预测准确性将有较大水平的提高。从总体上说,实证结果显示贝叶斯纳税评估模型在税收评估实践中具有很大的应用价值。

注释:

①各指标值计算公式如下:

申报表信息核对=(申报表收入-财务报表收入)/财务报表收入×100%

营业税税负比较=(本期营业税税负-上期营业税税负)/上期营业税税负×100%

个人所得税额变动率=(本期个人所得税入库税额-上期个人所得税入库税额)/上期个人所得税入库税额×100%

毛利率变动比对=(本期毛利率-上期毛利率)/上期毛利率×100%

总资产周转率分析=(本期总资产周转率-上期总资产周转率)/上期总资产周转率×100%

管理费用变动比率=(本期管理费用-上期管理费用)/上期管理费用×100%

主营业务收入变动率=(本期主营业务收入-上期主营业务收入)/上期主营业务收入×100%

主营业务成本变动率=(本期主营业务成本-上期主营业务成本)/上期主营业务成本×100%

单位产成品原材料耗用率变动率=(本期单位产成品原材料耗用率-上期单位产成品原材料耗用率)/上期单位产成品原材料耗用率×100%

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于贝叶斯分类器的税收评估模型研究_贝叶斯论文
下载Doc文档

猜你喜欢