政府科技计划绩效评价的维度、方法和模型_绩效评价论文

政府科技计划绩效评价维度、方法及模式，本文主要内容关键词为：维度论文,模式论文,绩效评价论文,计划论文,方法论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1 政府科技计划绩效评价的意义与作用

进入21世纪，各国政府都认识到科学、研究和技术开发对于国家经济和社会发展是极其重要的，工业化世界经济增长在很大程度上取决于高新技术产业的发展。人们普遍认为，以技术为基础的竞争力是财富增长的前提条件，而且科学技术也是人们应对环境和生态问题的必要条件。

为了促进企业创新和提高国家竞争力，各国政府纷纷通过制定各种科技计划、政策和法规来支持R&D和技术创新活动。政府科技计划不仅强调提高国家竞争力的科技储备和国家创新体系建设，而且通过贯彻政府对科技发展战略及目标的宏观引导意图，实施关系国家利益、发展目标和产业发展的前瞻性重大科技研究与开发项目，以充分体现国家科技发展战略。

政府科技计划和R&D投入是一种竞争性很强的稀缺资源，对这一资源的获取和占有是许多研究机构生存和发展的基础。企业和研究机构花很大精力争取这一资源是无可厚非的，问题的关键在于：获得政府支持以后的行为，能否使国家的稀缺资源和技术创新活动相结合，以达到科技计划的预期目标。

根据新公共管理理论，公共支出不仅需要受控，而且要权责相符。展示公共R&D投资的效率可以使科技计划和政策更合法化，并为政策制定者提供可供学习的经验。从这个意义上讲，建立科学合理的政府科技计划绩效评价制度，可以保证政府及相关机构以优化的方式共同协作来获得公众期望的结果，这既是政府公共管理和政务公开的要求，又能在一定程度上有利于政府科技经费安全使用，提高资源配置和使用效率。而且，这也有利于建立有效的激励机制，促进科技创新，减少学术腐败，进而从总体上提高政府科技计划效率和产出。

然而，R&D活动和社会福利之间的关系并不简单。专家们认为投入—产出的线性模型并不适合于分析这种关系。尤其，我们还需要区分科技计划长期和短期效应，直接和间接效应，显性和潜在效应。短期、直接和显性效应往往可以通过分析特定R&D项目的参与者知识、资产和利润增长来衡量，而诸如经济增长，创造就业和社会整合等长期效应和间接效应则很难归结于特定公共干预措施，这就给我们评价科技计划整体效应带来了很大困难。还有一个问题，就是科技项目及其社会经济产出的时间滞后。而且，创新过程结果在很大程度上是不可预期的，这限制了对其潜在影响的评价。因此，政府科技计划需要一个新的评价方法，以评价短期结果和长期影响，包括社会和经济的直接和间接效应，以及未曾预料的影响。尽管人们普遍认为要以投资的观点来分析科技计划绩效，但传统回报率分析并不适用于绩效计划评价，原因如下：

(1)科技计划有许多效应。计划项目参与者的短期收益包括销售额和市场份额增长、技能提高、以及新的合约。然而，计划整体效应却不止这些。一个科技项目还会影响那些并没有直接参与项目的机构，这些影响是很难衡量的。

(2)政府经常会过早要求得到评价结果。评价通常在项目全面的社会-经济效应可以测度之前开展，有时甚至在计划工作完成之前。

(3)计划效应不总是取决于单一项目或参与机构，这取决于很多计划项目内部和外部的投入。

(4)政府科技计划支持R&D项目的“附加性”问题。这与企业R&D投资决策不同，政府科技计划评价要分析企业在没有得到政府资助的情况下是否会开展R&D项目，其目的是促使企业增加其R&D投入。

对于科技计划的评价需要涉及范围更广的利益相关者，测度计划对于就业、卫生、生活质量和环境的影响。然而，大多数社会变化并不仅仅是由科技计划驱动的，例如移民政策、税收和教育政策。正是由于这个原因，就业增长和其他的社会变化不可能完全归根于科技计划。而且这些计划效应也很难用财务数字反映出来。新的评价方法不能再将重点放在财务收益上，而应关注科技计划实施所引起的法律、标准和实践变化。

2 政府科技计划绩效评价的模式

作为当今世界各国科技计划管理的重要内容之一，科技计划绩效评价受到了各国政府的高度重视，影响较大的有欧洲尤里卡计划评估、英国阿尔维计划评估、美国国会计划评估等。这些评估活动对重大科技计划和项目的科学管理与决策发挥了重要作用。基于科技计划绩效评价的重要性，部分国家也越来越重视相关制度与配套机制的建立。以美国为例，国会在1993年通过“Government Performance and Results Act”(GPRA)，成为美国当前科技计划及政府部门绩效评价的重要政策。根据GPRA的规定，多数的美国联邦政府所属机构都必须定期提出三种报告：长期策略规划(Strategic Plans)、年度绩效规划(Annual Performance Plans)以及年度绩效成果报告(Annual Performance

Reports)[1]。

欧盟科技研发计划的绩效评价，是伴随着欧盟各期框架研究计划而演进的。自从20世纪80年代初以来，评价成为欧盟框架计划的法定要求。欧盟建立一些科学和政治咨询机构，以确保计划的透明性，以及听取不同利益相关者的实际需要。这个系统主要由欧盟服务委员会管理，并接受部长理事会和欧洲议会的监督。在前3个框架计划中，欧盟分别对70个计划进行了评价，并开展了40多个支持性研究，500多个专家参与了评价。199 6年欧盟发布了“Sound and Efficient Management 2000”方案，要求系统性评价科技计划绩效，这种评价模式包括：持续监控和5年1次的评价。

欧盟第5框架计划提出了更雄心勃勃的评价计划：“在独立、称职的专家协助下，委员会应当每年对第5框架计划和特定计划的实施进行持续和系统的监控……并且应当评估计划的目标、重点和财务资源是否符合变化的环境。在合适的情况下，应用评价结果以调整或补充框架计划和/或特定的计划。……在提交第6框架计划草案之前，委员会应当组织由独立、称职专家对计划活动的开展及成就进行外部评价。”

就评价内容而言，欧盟着重于以下5个方面：计划筛选的程序(Selection Procedures) 、计划管理(Management of Programme)、计划的一般特色(General Characteristics of Projects)、计划的产出(Output of Projects)、与成果的扩散和利用(

Dissemination/Utilization of Results)[2]。

韩国政府为了提高政府研究开发经费的效率，自1998年起正式启动对国家研究开发计划的调查、分析、评价。根据韩国《科学技术革新特别法》，每年由科技部长官主持实施，并将结果向国家科学技术委员会报告，具体承担此项任务的是科技部下属的韩国科学技术评价院。一切使用政府研究开发经费和政府基金的研究开发计划，均属调查、分析、评价的对象。对研究开发计划的评价内容是取得的成果、计划目标设定的恰当性、推进战略的妥当性等[3]。

中国台湾“经济部”为了确保科技项目经费能有效运用，加速科技研发成果扩散于产业界，“经济部”对于科技项目的绩效评价分成短期效益与长期效益考核。为使绩效评价制度更具弹性与合理化，“经济部技术处”提出“加强两头、精简中间”的项目管理理念，目的是在计划形成前，就计划策略与执行进行深入了解，并与研究单位密切沟通，以符合产业发展的需要；在计划结束时，充分评价及了解计划执行成效，并积极促成其产业效益[4]。另外，日本在1998年3月于经济产业省下也成立了政策评价研究会，并在2001年11月公布了“国家研发评价实施方针”，建立了项目管理评价体制和预算监督机制。项目一旦确定，它的每一笔开支必须按计划执行，如需调整，须经政府主管部门的同意。

这些发展象征了世界主要国家和地区在绩效评价方面制度化(Institutionalization) 的趋势，即建立一套适合本国科技与经济发展的科技计划决策、实施、管理、评价的方法。目前，较为科学的方法是计划决策、实施、管理和评价之间相对分离，形成一种相互制约、相互协调的机制。虽然由于各国国情不同，科技计划评价模式有所差异，但从评价需求与动因角度分析，我们可以将政府科技计划绩效评价分为2种模式：

(1)总结式评价。这种绩效评价主要动力源于政府预算压力，想要从公共补助研发的过程中，了解到哪些经费发挥效果，该如何促使所补助对象的运作能显现其成效。这种评价取向是关心研发补助的成效，出发点是组织外部的。评价的目的在于证明政府行为的合理性(Accountability)或者是为了进行资源的适当合理分配，采取绩效指标评价可以被看作是迈向权责相符的新公共管理模式的重要手段。

以美国为例，美国著名的先进技术计划(Advance Technology Program,ATP)从1990年起开始实施，目标就在于扮演催化研究实验室与产业界间互动的角色，以达到刺激创新的目的。但是，ATP刚开始执行时的合理性受到相当大的质疑，所以从1994年起在哈佛大学著名经济学者Zvi Griliches的带领下，开始建构一套完整的绩效评价机制。美国

ATP的绩效评价，其目的相当明确，就是要证明整个ATP计划的合理性。美国ATP计划的整个管理周期可分为5个阶段：申请准备期、申请评估期、协议期、研发期和项目后时期。在项目后时期，ATP计划的评估分为五个方面：评估ATP计划本身活动；建立健全的档案；评估产业界的实施完成情况；跟踪项目的近期及中期成果；评估项目对经济的长期影响[5]。

通过前4年ATP项目承担者和申请者调查发现，ATP激发了企业的研究与开发，缩短了企业R&D周期，创建了企业间的合作联盟。如果没有联邦政府的资助，ATP项目的进展将受到影响。50%的承担者认为，如果没有ATP资助，他们可能不会继续从事项目的研究与开发。

(2)形成式评价。这种评价模式是由于政策制定者认识到提升创新体系效率的重要性，所以政府期待能从绩效评价的过程与结果中，获得到补助研发的制度如何改进提升建议，评价的出发点是组织内部的。这种模式以法国、德国、荷兰、瑞士和北欧国家为代表。这些国家或是出于法律体系对科技计划评价的要求，或是政策制定者对评价结果的接纳态度，绩效评价立足于从组织内部改善管理，而不是强调预算的重新分配。比如，欧盟研发计划绩效评价体制的演进方向，其目标则是朝向想要使各个计划有效地达成，并且能透过绩效评价的结果，反馈到欧盟的决策层次，以便提升下一回合的计划执行成就以及提供下一回合研究计划的规划方向指引，所以评价的方法、对于资料的需求、逻辑关系的建立上相对困难许多。

以挪威用户导向研究(UOR)计划评估为例，挪威政府1978年开始实施UOR计划，UOR计划的一个显著的特点是，直接支持公司开展研究，而不是通过R&D机构间接支持公司创新，这主要目的是使研究能更符合公司的需求。对UOR计划评价最早是在1982年，绩效评价分为事后评价和长期评价，其目的是比较计划结束后的短期影响(事后评价)和长期影响，以判断随着知识的逐渐积累和不确定性的减少，以及财务收益的实现，计划预期效应的演变，从而为下一个框架计划更好的开展奠定基础(见表1)。

表1 UOR计划评价

计划阶段计划期限评价时间

事后评价长期评价

第1阶段“创新计划”1978—1982 1982和1984 1992

第2阶段“产业创新”1984—19891992 1997

第3阶段“用户导向研究”1990—199519972000年以后

3 政府科技计划绩效评价的维度

当今世界，科技发展水平在突飞猛进、日新月异，许多国家纷纷通过深化科技发展计划体制改革，一方面加强政府对科学技术研究与应用的宏观引导和调控，另一方面调整科技投入的重点与结构，加强国家创新体系建设，不断增强创新能力。政府科技计划的内容也随之从单一的研究开发扩展为研究开发、基地建设、人才培养、信息基础设施建设等领域。根据其目标不同、性质不同、对象不同，对各类政府科技计划应采取不同的管理模式，并且在科技计划的决策、实施、管理、评估之间需要形成一套较为完善的监督制约机制，从而保障科技计划的顺利实施。这里，我们可以简单的将科技计划划分为 “使命导向”和“非使命导向”两类，不同类别的科技计划在评估中遇到的问题也是不同的(见表2)：

科技计划影响的多样性在很大程度上源自于具有不同利益和期望的各种行动者的参与：政策制定者、计划管理者、参与研究人员以及计划的顾客等。一个好的评价模式应当考虑这些不同的需要。总的说来，从政府科技战略目标出发，我们可以从4个维度来对政府科技计划的绩效进行评价，这4个维度分别是：知识增长、企业创新、创新系统支持和管理。由此，我们可以构建一个整体科技计划的评价框架(见表3)。

4 经济理论与科技计划绩效评价方法

科技计划绩效评价最大的问题在于，如何预测创新项目的影响。从进化论的观点来看，创新过程是不可预测的，人们所能做的只有鼓励多样性和创造性，选择只有在进化中进行。创新类似于“随机行走”过程，没有系统信息构建学习过程。从这个观点看，追踪计划发展进程的格式化评价没有理论基础，评价的主要目的是促进计划的完善。

尽管评价体系关注于经济效应，这并不是与进化论有矛盾。企业不可能准确地预测回报率，但回报率是企业和公共机构对项目了解过程的重要部分。由于经济影响是科技计划的主要目标，关注目标的唯一方法就是分析事前、事后和长期的数字。如果对事前和事后的经济预期不了解，就无从识别长期影响，投资决策是基于预期做出的，好的决策需要具备用系统方法应对不确定性的能力。由于政府科技计划目标越来越广泛，计划效应就更多样，甚至是矛盾的。在对计划进行有效评价之前，必须要明确以下几方面对计划产出的影响：

(1)有形产出与知识、技能：一个计划项目可以产出有形产品，比如机器，也可能产出无形成果，比如技能和知识。技能可以被认为是一种重要但容易被忽视的成果。

(2)产出与影响：在某种程度上，可以对科技计划的产出和影响/效应进行区分，后者源自于这些产出与经济或社会的互动。产出可以是纯学术的(如发表论文)，“中间产品 ”(诸如专利和原型)，“最终产品”(例如新的、改进的产品、过程或服务)。影响和效应则可能包括销售额增长、竞争力提高，以及使生活质量提高的政策或规则。

(3)项目与计划：对计划的评价是不同于项目评价的，虽然计划评价是在从单个项目影响信息的基础上做出的，但一个科技计划的影响不同于各个项目影响的汇总。单个项目如果以研究结果、技术解决方案或经济结果方面来衡量，可能是很成功的，而计划则可能会出现未曾预料的、甚至是负面的经济或社会效应。通常，一个计划的潜在影响会大于单个项目效应的汇总。

(4)参与者与非参与者：研究科技计划对参与者的影响，相比非参与者来说要容易得多，原因是参与者很容易识别，一般来说也愿意配合评价工作。

(5)连续性与灵活性：政府科技计划在理想情况下，应该目标明确，并且能够有效实施。然而影响参与者的经济和技术条件不是很容易定义，在项目生命周期中也会发生很多变化，这会要求计划在运行中具有一定的灵活性，这就使以计划原始目标为基础的评价更加复杂了。

(6)短期影响与长期影响：科技计划的影响是在不同时期出现的。例如，短期影响可能会由于市场条件的变化而突然中止。有些产出可能在几年内也不会被应用，但由于互补性技术的开发而突然变得很重要。简单的推断是危险的。

(7)直接应用与未预料的应用：理想的情况下，科技项目成果可以被直接应用于生产过程或商业化产品中，从而迅速增强竞争力。然而，即使优秀的研究结果和技术方案也可能由于竞争技术的开发而在市场上处于劣势。当然，即使这种情况发生了，研究结果也有助于“知识体系”的增强，甚至有时导致不在预料之中的成功。

(8)经济影响与社会影响：并不是很清楚如何区分经济和社会影响。一些经济学家认为，所有社会影响都可以用货币来衡量，例如“谁污染谁负责”的原则，但这其中都包含着诸如人的生命价值或生活质量下降的成本等判断，这种判断并不是被广泛接受的。也有些影响，诸如就业，虽然属于经济领域，但也有很大的社会影响。在一些领域，例如医药研究，在生活质量和财富创造之间存在正相关关系。而有些研究，例如针对烟尘危害的研究，则存在负相关关系。

由于很难定量评价科技项目的产出和效应，同行评议成为评价R&D质量的最常用的方法，后来又采用了案例研究和成本收益分析法。在政府科技计划评价中，传统的同行评议过程往往和计划评估与内部审议方法结合起来。内部审计集中于管理实践、预算控制和信息系统。计划评估审视科研机构和外部顾客、利益相关者和作为发起人和赞助者政府之间的外部联系，注重顾客反馈和S&T活动影响。同行评议则提供与科研水平、质量相关的专家意见。

此外，政策措施范围的扩大和延伸使得评价更多采用组合方法，并促进事后评价和持续监控的交汇。由于现代技术和创新过程中不同行动者——政策制定者、计划管理者、参与者和评价者需要不同种类的信息，就需要多角度的评价方法。目前的评价方法根据其功能可以分为3类：

(1)框架方法：框架方法用以测度、衡量结果，进行价值判断。大多数框架方法都采用比较法(以前和以后，参与者和非参与者，实际产出和期望结果)，有时也使用逻辑框架。那些衡量公共资助对成果产出作用的方法也属于此类。

(2)数据采集：包括访谈、调查、观察，从文件和其他来源整理数据和统计资料。

(3)数据分析方法：加工、处理数据以检验假设或得出推论，包括案例分析、经济计量法、指标体系、以及其他统计方法。

在实践中，人们越来越认识到没有单一的“最佳评价方法”，相反我们需要一个综合评价体系，以分析计划的合理性、经济效应、管理行为、顾客满意度以及其他问题。为此，我们可以从以下几方面来考虑评价方法的选取和集成设计：

(1)政策使命：政府部门主要对哪些关键政策和计划要开展战略和成本效益评价，决策过程将如何使用评价结果?

(2)计划评估目的：评估将被用于解决什么问题?政府计划成功标准是以计划资源、活动和产出为重点，还是以计划绩效为重点?

(3)计划评价范围：评价要求解决3个基本问题：计划适当性(计划是否和组织、政府目标一致，是对当前需求一种适当的反映)、计划成功(计划是否达到了目标，产出了预期的结果)、成本效益(计划设计是否最有效)。

(4)评价资源的获取：计划评价信息获取来源有哪些?评估成本构成?

(5)评价过程：评价机构自身内部需求和组织文化有什么特点?

5 中国科技计划评价实践与发展

“十五”期间，中国国家科技计划管理体系发生了重大变化，科技计划按照高技术研究、科技攻关、基础研究、开发条件建设和科技产业化环境建设等五方面进行了规划。目前，我国科技计划体系可以概括为“3 + 2”计划体系，其中“3”是指国家三大科技计划主体：国家科技攻关计划，863计划以及基础研究计划(973计划)；“2”是指研究开发条件建设计划以及科技产业化环境建设计划。

对于国家科技计划项目实施，我国采取的管理模式主要包括：(1)滚动立项机制；(2) 全面实施课题制管理方式；(3)积极推进科技项目招标和评估制度；(4)加强产学研结合，促进企业成为技术创新的主体；(5)适应财政预算执行过程及执行结果的监督机制，建立项目追踪问效绩效考评机制。

涉及科技计划和项目评价方面，目前，我国主要的法规文件包括：《科技评估管理暂行办法》(国科发计字[2000]588号)；《科技评估、科技项目招标投标工作资质认定暂行办法》(国科发计[2001]4号)；《国家科研计划课题评估评审暂行办法》(国科发财字 [2002]165号)；《国家科技计划项目评估评审行为准则与督察办法》(第7号)以及《科学技术评价办法》(国科发基字[2003]308号)。

由此可以看出，我国科技计划整体绩效管理和评价尚属于薄弱环节。相对而言，我国科技主管部门更注重具体科技项目的立项、过程监控和验收评估工作。科技计划项目验收评估，主要是对项目的完成质量做出科学的评价，依据立项时签订的科研合同，考核课题研究是否按计划完成预定的研究任务，是否达到预期的目标。因此，科技计划项目的验收评估主要考虑技术文件资料提供情况、任务目标与技术经济指标完成情况、经费使用合理性、完成时间情况4项指标。这种项目的验收评估更看重的是短期效应和局部影响，与我们前面所分析的计划整体绩效评价还有很大的距离。

在我国，政策制定者、研究资助者和科技管理者尚未面临强大有效的压力去显示研究的价值。科技管理者在分配资源上拥有的权力和资源使用效果上承担的责任不对等，还缺乏一个适当的行政管理的基础机制，把评估系统与公共管理过程结合起来。甚至在某些情况下，还存在科技计划管理者挪用计划资金的问题。为此，我们建议应尽快建立一个有效的科技计划绩效评价制度，通过对科技活动各主体的能力和绩效进行科学的评价，进而完善激励与奖惩制度，提高效率，实现政府有限科技资源的合理配置[6]。具体建议包括：

(1)建立绩效评价制度的出发点是为提高我国政府科技计划的效率和产出，而不是以责难科技活动的管理者和执行者为目的。

(2)在制度上将绩效评价与计划决策、实施和管理环节相对分离。从国外实践来看，对科技计划绩效评价的需求来自于纳税人对于计划绩效信息的要求，需求压力主要来自于议会、审计部门和财政预算管理部门。而我国政府部门传统上不管是在制定政策、法律的过程中，还是在日常行政管理活动中，尽管存在权力的纷争和利益的冲突，但习惯于在内部解决争议。科技计划绩效评价如果是以提高科技计划产出和效率，促进资源合理配置为目标，前提必须是要有一个更为真实的、存在不同的具体目标和利益之争的政府管理层。

(3)以特定领域的科技计划评价为重点。从1994年开始，原国家科委先后进行了“八五 ”科技攻关、“863”等计划的评估。这些评估活动为我国在特定领域开展计划评估提供了有益的借鉴。同一般的科技计划相比，特定领域的科技计划有其自身的特点和规律。第一，在目标方面，一般科技计划所追求的是经济和社会效益，而特定领域的科技计划所追求的主要是特定效益，相对而言比较容易衡量。第二，特定领域的科技计划信息获取渠道相对有限。

(4)加快政府科技计划绩效评价的制度化过程。首先，我国科技主管部门应将科技计划整体绩效评价工作纳入科技管理过程，并出台相关的文件。其次，国家审计署应从资金使用效率角度开展对科技计划实施的专项审计工作。最后，在适当时候，全国人大应考虑将科技计划评价纳入立法范围。

标签：绩效评价论文; 科技论文; 计划管理论文; 项目目标论文; 国家经济论文; 过程管理论文; 项目分析论文; 创新管理论文; 项目评估论文; 政策评估论文; 技术管理论文; 社会资源论文; 经济学论文;

政府科技计划绩效评价的维度、方法和模型_绩效评价论文

猜你喜欢