【经贸管理】
数据包络分析中面板数据的常用 处理方式对比研究
——以国有能源上市公司为例
向 冰
(广东理工学院 经济管理学院,广东 肇庆 526000)
[摘 要] 数据包络分析(DEA)是分析横截面数据的一种方法。其中面板数据的处理主要有三种:直接按面板数据处理、按年分成几个横截面数据处理、所有数据放一个横截面处理。基于DEAP2.1软件以2012—2017年的国有能源上市公司为例,分别用这三种方法进行实证分析并对比结果。结果表明:直接按面板数据处理和按年分成几个横截面处理的实证结果完成相同。而把所有数据放一个横截面处理和面板数据处理的实证结果不具有一致性。
[关键词] DEA(数据包络分析);面板数据;对比研究
一、导论
数据包络分析(DEA)是一种分析横截面数据的方法。而绝大部分研究使用DEA模型都需要处理面板数据。目前最常用的处理DEA模型数据的软件是DEAP软件。本文以DEAP2.1软件来处理DEA模型的数据。对于面板数据如何处理,很多文章都没有明确说明。但根据已有的文献,可主要分为三类:一是以Malmquist-DEA为基础,直接按面板数据处理。这种处理方式能测算出决策单元的综合技术效率和纯技术效率值,也能以之为基础通过相除计算出规模效率值。但无法得到规模报酬的变化,也无法得知投入冗余这种可以提高效率的改进方向。有较多研究用了这种方法,如于丽英[1]等运用Malmquist-DEA研究了我国长江经济带的物流效率,并在此基础上提出相应对策。二是按年分成几个横截面数据来处理。这种方式处理,能测算出决策单元的综合技术效率、纯技术效率值、规模效率值、规模报酬的变化和投入冗余。但无法对各年的值进行比较。如果研究需要进行纵向比较时,往往再用Malmquist-DEA进行测算。有较多研究用了这种方法。如:朱震锋和曹玉昆[2]按这种方式分析了多种经营产业的综合技术效率、纯技术效率值、规模效率值、规模报酬的变化和投入冗余。再用Malmquist-DEA进行纵向分析。三是所有数据放一个横截面处理。这种处理方式是使所有的决策单位都在同一个效率边界上,以便不同年度的效率值可以进行比较。亦能测算出决策单元的综合技术效率、纯技术效率值、规模效率值、规模报酬的变化和投入冗余。也有一些研究用这样的方式处理面板数据,如:刘文君和向冰[3]把所有数据放在一个横截面,求出各钢铁上市公司的超效率技术效率值,然后利用tobit模型来定量分析技术效率的影响因素。本文以2012—2017的国有能源上市公司为例,分别用这三种不同的处理方式进行实证分析。通过实证结果对比,来找出最适合的处理方式。
社会统计学与数理统计学的根本区别在于前者在统计研究中以事物的质为前提,强调认识事物质的重要性,后者则不关心事物的质.
二、模型、指标与数据
DEA是一种非参数方法,运用线性规划方法来计算效率值。只需要知道投入和产出的值,通过决策单元的生产曲面和最佳前沿面的距离来计算效率值,以此衡量决策单元是否达到最有效。优点在于计算简单,不需要知道生产函数的具体形式,也不需要确定评价指标的权重,具有客观性的特点。DEA模型最初由Charnes,Cooper与Rhodes[4]提出,以规模报酬不变为基础。Banker,Charnes和Cooper[5]在此基础上提出了以规模报酬可变为基础的BCC-DEA模型。该模型放宽了规模报酬不变的假设,使研究的面更广,更贴近于实际[6]。
(一) BCC-DEA模型
本文选择规模报酬可变的BCC-DEA模型进行实证。BCC-DEA模型如下:假设有n个同类型的多投入多产出的DMU(Decision Making Unit,决策单元),对于每一个DMUj(j=1,2…n)都有m个投入向量Xj=(x1j,x2j…xmj)T和k个产出向量yj=(y1j,y2j, …ykj)T。那么,第j0个DMU的能源效率评价模型为:
minθ
其中,θ为DMUj0的效率值;λj为有效DMU的组合比例;为松弛变量向量。
把240个数据放一个横截面,用普通DEA处理。得到Crste、Vrste和Scale的值。计算均衡、最小值、方差及综合技术效率=1的公司数,归纳至表3中。
基于上述模型,使用DEAP2.1软件,以投入为导向,规模报酬可变为基础,分别按面板数据、六个横截面数据、全部数据放一个横截面数据对2012—2017年40家国有能源上市公司投入-产出效率进行测算。
(二)指标
直接使用MALMQUIST-DEA直接做面板数据的实证分析,把结果的“DISTANCES SUMMARY”中的Crste(综合技术效率)的t年的数据和Vrste(纯技术效率)数据导出,再根据公式:Scale(规模效率)=crste/Vrste算出规模效率。把实证结果算出的Mean(均值)、Min(最小值)、Var(方差)及综合技术效率=1的公司数归纳在表1中。
(三)数据
把面板数据按六年分别作为六个横截面数据用普通DEA处理。得到Crste、Vrste和Scale的值。计算均衡、最小值、方差及综合技术效率=1的公司数,归纳至表2中。
大白兔“诞生”于1959年,美加净“诞生”于1962年,在那个年代,大白兔奶糖和美加净护肤品风靡一时,受到消费者的喜爱。大白兔成为建国十周年的献礼产品,产品经销全世界40多个国家和地区,成为国际市场上经久不衰的大众宠儿。美加净创造了很多中国化妆历史上的“第一”,第一支护发定型摩丝、第一款护手产品——美加净护手霜,上海家化还推出了美加净青苹果香波,这是国内首个“二合一”(洗发+护发)香波洗发水。
三、国有能源上市公司投入 -产出效率值的实证分析
结论:若θ=1且则该DMUj0为DEA有效,即DMUj0在投入x0得到的产出y0达到帕累托最优。若θ=1但或则该DMUj0为DEA弱有效,即可以再x0减少♂时保持y0不变;或是在x0不变下增加♂的y0。若最优值θ<1,则该DMUj0为非DEA有效,存在1-θ的技术效率损失,θ值越低,该DMUj0的相对有效值越低。非DEA有效可以通过 DMU 在相对生产前面上的投影来找出原因和改进,利用“投影原理”不但可以得出能源投入的调整方向,而且可以得出调整量,进而进行比较[7]。
合理的指标选择是投入-产出评价有效的前提和基础。在产出方面,已有文献多选择主营业收入、营业利润、净利润作为期望产出。本文认为营业利润、净利润不适合作为产出。理由如下:第一,营业利润、净利润都是营业收入剔除营业成本后的净值,DEA是计算投入产出的方法,而不是净产出。第二,营业利润、净利润可能为负值,DEA模型无法运算产出为负值的情况。第三,上市公司营业利润、净利润的人为操作性比较强。在投入方面,年末员工总数作为劳动投入,主营业成本作为中间投入是绝大部分文献的选择。此外,已有文献多偏向于选择固定资产与无形资产的和、固定资产、或总资产等资产作为资本投入。但这些资产每年的消耗量在会计上都计入了主营业成本。故同时选用主营业成本和这类资产作为投入,会造成一定的投入重叠,使效率结果有偏。本文根据已有文献的总结,结合国有能源公司的特殊性,选择主营业收入作为产出指标,主营业成本,年末职工数,管理费用作为投入指标。
本文选择2012—2017年这六年作为研究期。截至2019年,我国在深沪两市的上市的国有能源上市公司剔除报告期内上市和数据缺失的公司之后剩40家。已有文献部分还剔除了ST的上市公司,由于本文选择的产出指标是主营业收入,净利润为负对实证无影响,故不剔除ST公司。本文研究的对象为这40家上市公司。本文的主营业收入、主营业成本、管理费用、年末员工总数的数据来源于csmar数据库。为了剔除通货膨胀的影响,本文通过国家统计局的年度数据,以2012年为基年进行平减。
表 1国有企业技术效率值(基于 Malmguist-DEA面板数据)
数据来源:根据DEAP2.1测算结果进行描述性统计。
表 2国有企业技术效率值(基于按年横截面数据)
数据来源:根据DEAP2.1测算结果进行描述性统计。
文明社区的特征表现在居住区的人们具备良好的人际关系、社会纪律、社会公德,建设文明社区能够促进市民整体文明素质的提高。物业服务在社区中组织和参与形式多样、健康有益的社区文化活动,不仅有利于丰富居民的精神文化生活,而且有助于促进邻里和睦,增强业主的认同感和归属感,使社区成为一个有利于人与人之间沟通、人与自然之间和谐、人与文化融通的健康、开放的工作和生活环境,创造一个具备良好人际关系、社会公德的社会环境,使社区成为安乐祥和、安居乐业的场所。营造文明、安宁、祥和的家园氛围,使业主的思想道德水平和文化素质有明显提高,是现代物业管理的基本目标之一。
采用物理方法(黄板诱杀等)和化学方法(药土等)相结合无水防治,施用烟雾剂和粉尘剂,如果采用喷雾剂施药,要在晴天上午施用适当减少防治次数和喷液量,防止棚内湿度过高。
表 3国有企业技术效率值( 6年数据全放一个横截面处理)
数据来源:根据DEAP2.1测算结果进行描述性统计。
四、 实证分析的结果对比
对比表1和表2,可发现这两个表完全相同。基于此,核对这两种不同方法计算的每一个公司的各年效率值,发现也完全相同。由此可知DEAP2.1软件使用MALMQUIST-DEA做面板数据的实证分析实质是软件把每年的数据当成一个横截面,然后分别做的横截面数据的DEA。因为DEA是一种基于横截面数据的分析方法,所以对面板数据的处理,需分年按横截面数据来做。如果直接按面板数据输入DEAP2.1软件选MALMQUIST-DEA,DEAP2.1软件会自动把你的面板数据分年按横截面来做。
对比表2和表3,可发现这两个表是不同的。把实证结果每年的数据分别对比。从综合技术效率方面看,首先,按年用横截面数据测算的各年综合技术效率值(表2)都高于六年数据全放一个横截面测算出来的综合技术效率值(表3)。其次,表2的综合效率的最小值除2017年等于外,均大于表3测算出来综合效率的最小值。最后,表3各年综合效率的方差除了2017年等于外,均小于表3综合技术效率的方差。此外,综合技术效率等于1的历年公司数,表2均大于表3。说明从综合技术效率方面看,按年用横截面数据比六年数据全放一个横截面测算出的值大,且各年中各个公司的技术效率差异小。从纯技术效率角度看,对比表2和表3,表2纯技术效率值都较高。表2各年纯技术效率最小值都较大,方差除了2015年等于,2017年略小于外,其他年份均较大。从规模效率方面看,对比表2和表3,表2纯技术效率值都较高。表2各年规模效率值最小值除了2012年和2017年略小于表3外,其他年份都较大,方差除了2017年略小于表3外,其他年份均较大。由此可以看出分年用每年横截面数据做实证和所有数据全放一个横截面做实证的结果不同,且不具有趋同性。DEA模型是基于横截面分析的模型,除非有证据可以证明六年的效率边界都不变,不然不能把所有数据放在同一个横截面做实证。
五、结论
1.在投入产出指标选择方面。投入指标选择主营业成本、期末职工人数、管理费用。产出指标选择主营业收入。并以研究期的第一年为基年,剔除通货膨胀影响。
2.直接按面板数据处理和按年分成横截面处理面板数据的实证结果完成相同。按面板数据处理,实质上是DEAP系统自发地按年分成了横截面数据进行处理。而把所有数据放一个横截面处理和面板数据处理的实证结果不具有一致性。因为没法保证每年的效率边界都不变,所以不建议把所有数据放在一个截面来处理面板数据。建议按年分成截面处理。如果要进行纵向比较,建议进一步使用Malmquist指数分解。
高新技术供应链信息共享作为供应链能力提升的重要环节,对供应链间各成员企业的发展具有及其重要的作用。在以往的信息共享评价指标体系中,较多为定性的指标,因此拟用问卷调查法获取实验数据,运用DEA方法具体从规模效率、规模收益、综合效率、纯技术效率、投入冗余和产出不足等方面进行分析评价。DEA方法一方面可以对DMU的相对效率给出评价和测算,另一方面还可以表明DMU不是有效性的原因以及改进空间。该方法运用的是帕累托最优原理,通过投入、产出判断标准进行衡量,只有两种判断标准都被拒绝时,该决策单元才是完全有效的。
[参考文献]
[1]于丽英,施明康,李婧.基于DEA-Malmquist指数模型的长江经济带物流效率及因素分解[J].商业经济与管理,2018(4):16-25.
[2]朱震锋,曹玉昆.多阶段DEA-Malmquist指数模型下多种经营产业效率测算——基于2007—2015年的经验数据[J].经济问题,2017(3):56-61.
[3]刘文君, 向冰. 基于碳排放的中国钢铁上市公司技术效率研究[J]. 中国人口·资源与环境, 2016,26(S1): 10-13.
[4]CHARNES A, COOPER W W, RHODES E. Measuring the efficiency of decision making units [J]. European journal of operational research, 1978, 2(6): 429-449.
[5]BANKER R D, CHARNES A, COOPER W W. Some models for estimating technical and scale inefficiencies in data envelopment analysis [J]. Management science, 1984, 30(9): 1078-1092.
[6]向冰.我国能源上市公司技术效率及其影响因素研究[D]. 南华大学, 2016.
[7]范丹, 王维国.中国省际工业全要素能源效率——基于四阶段DEA和Bootstrapped DEA [J]. 系统工程, 2013, (8): 72-80.
Contrastive Study on Common Processing Methods of Panel Data in DEA :A Case Study of State -owned Energy Listed Companies
Xiang Bing
(School of Economics and Management, Guangdong Polytechnic College,Zhaoqing Guangdong 526000)
Abstract : DEA is a method for analyzing cross-sectional data. There are three main types of panel data processing: data processing directly by panel, data processing divided into several cross-sectional sections by year, and all data processing by one cross-sectional section. Based on DEAP2.1 software, this paper takes the state-owned energy listed companies from 2012 to 2017 as an example, and uses these three methods to carry out empirical analysis and compare the results. The results show that the empirical results of direct panel data processing and annual cross-section processing are the same. However, the empirical results of putting all the data into one cross-section processing and panel data processing are not consistent.
Keywords : DEA; Panel Data; Comparative Analysis
[中图分类号] F233/ F224. 0
[文献标识码] A
[文章编号] 2095-3283( 2019) 03-0095-04
[作者简介] 向冰(1990-),女,汉族,湖南郴州人,国贸系教师,硕士,研究方向:数量经济学。
[基金项目] 广东省青年创新人才类项目(项目编号:2016WQNCX166);校级教改项目(项目编号:JXGG2018027)。
(责任编辑:顾晓滨 董博雯)
标签:DEA(数据包络分析)论文; 面板数据论文; 对比研究论文; 广东理工学院经济管理学院论文;