科技评价顽疾怎么治
对研究项目、人才及机构评价的建议
周 恒
(天津大学)
摘要: 对研究项目、人才和机构评价的核心问题是对成果的评价。本文针对面向实际的基础研究和技术发明的评价提出,一般需要两级专家评审。一是小同行,即同一个三级学科、甚至于同一研究方向的专家。另一级则是能在更宏观方面把握科学和技术发展方向的顶级专家。由小同行评价成果的正确性和难度,而由顶级专家判断其价值。该方法同样也试用于对期刊的评价。
关键词: 成果价值,小同行,顶级专家,评价
2018年中共中央办公厅、国务院办公厅印发了《关于深化项目评审、人才评价、机构评估改革的意见》,对科技领域的项目评审、人才评价、机构评估工作部署了有针对性的改革举措。现在的问题是,如何全面、准确地落实这项措施。
项目评审、人才评价、机构评估虽然是三个层次的问题,其实核心问题是一样的,就是对成果的评价。至少从表面看,大家都承认过去主要看论文发表的刊物的影响因子、文章数、被引用数等的办法不好,但究竟应该如何评价却还没有达成共识。所以,对这个问题仍然值得深入分析和讨论。
不同的问题其评价标准和方法当然会有所不同。本文只涉及与自然科学有关的基础和技术研究成果的评价。
一、对基础和技术研究成果如何判断
即使是基础研究,也还有两种不同的类型。以力学为例,它无疑是基础科学。其发展大体可分为两个阶段:第一个阶段从牛顿创建力学到19世纪末,这一阶段大体上是力学的自我完善,即从力学的基本原理出发,基本上只依靠逻辑推理的发展。当然也有一些针对实际问题的研究,包括工程技术。进入20世纪,力学进入大发展的时期。其特征是为了用力学解决实际问题,大大扩展了力学的研究范围,引进了很多新的,不能依靠逻辑推理而从基本原理导出的概念和物理参数,以及相应的新的理论和研究方法,形成了众多新的力学分支。例如,结合航空问题,出现了空气动力学这一分支,而结合航天的问题,又发展出高超声速空气动力学,稀薄气体动力学,等等。
到现在为止,经典物理的各个分支基本上都经历了这样两个阶段的发展。近代物理的发展也大体上如此。
因此,本文讨论的评价,就基础研究而言,指的主要是针对实际需求而做的基础研究。
我和张涵信、崔尔杰、童秉纲等院士针对如何评价科技成果的问题,发表过很多篇文章① 参见: 张涵信, 周恒, 童秉纲. 从流体力学发展看科研成果评价. 科学时报, 2011–08–03.http://www.cas.cn/xw/zjsd/201108/t20110803_3319148.shtml. 周恒. 科研成果评价如何更有利于科技发展. 科学与社会, 2012, 2(3):13–18等文章. 。其中多次列举了20世纪初德国数学家克莱因对近代流体力学之父普朗特(钱学森先生老师的老师)的一篇论文的评价作为典型例子。由于这个例子实在有典型意义,为免得未看过我们过去写的文章的读者去查找那些文章,这里再把这个典型事例复述一下。
杨先生吃完烟,又从口袋把烟盒掏了出来。我有些着急,他还要吃啊?杨先生把烟盒递到我们面前,指着上面的人像说:“这是马占山将军,你们听说过吗?”
1903年,在德国的海德堡召开的第三届国际数学大会上,年仅29岁,本身并非数学家的普朗特在会上宣读了一篇论文。论文的最主要内容是:描述粘性流体运动的一个偏微分方程,即Navier-Stokes方程,在应用于解决流体和物体的相互作用问题时(例如空气对机翼的作用),在很多情况下,在紧贴物体表面的一薄层内,可以略去方程中的一项。当时已经很有名的哥廷根大学的数学家克莱因一眼就看中了这篇文章,认为是整个大会最有价值的论文。他随即推荐普朗特去哥廷根大学,哥廷根大学马上为普朗特成立了研究所,该研究所很快成为国际上最著名的与力学(主要是流体力学)有关的研究中心,在推动航空技术发展上起了极为重要的作用。
这一对成果和人才的评价,具有非常典型的意义。身为纯数学家的克莱因,为什么对普朗特简化方程这种通常会被纯数学家看不上眼的做法情有独钟,而且还是在普朗特仅仅提出了简化建议,并没有提供任何具体的结果的情况下。
有些技术发明,不但要看其本身的科学性、可行性,有时还要从更宏观方面考虑。例如,利用太阳能制氢是一种提供清洁能源的可能途径。而利用太阳能直接发电的光伏技术也是一种途径。但两者都不能就事论事地孤立地考虑,而需要放在更大的范围考虑才行。利用太阳能制氢,就牵涉到氢的收集、储存和运输,以及最终如何利用氢的问题,每一步都有新的技术难题。而利用太阳能发电,则最大的问题是不能保证平稳发电,要大规模使用,有赖于和其他电源合理调配。目前看来,智能电网技术是可能的解决方案之一,但实际做起来同样难度不小。因此,这两种途径,究竟谁更有前途,不能仅限于电解水技术和光伏技术本身。但由于从技术发明到实际应用之间,还有事先难以完全预估的困难,因此评价哪种途径更有前途,即更有潜在价值,其难度是很大的,更需要在宏观上能把握技术发展前景的专家参与评估,而不能仅仅限于做学术研究的专家。
我们不可能知道克莱因做出判断的具体思考过程,但是也许可以做以下分析。
克莱因虽是纯数学家,但他对当时的流体力学的状况有一定的了解。这是因为当时的流体力学主要针对的是理想流体,即无粘性的流体。而事实上,在很多情况下,粘性在流场的大部分的确几乎不起作用。再做了流体运动无旋的假定后,其控制方程就是拉普拉斯方程,这是数学家们很熟悉和研究得很多的方程。克莱因本人还在哥廷根大学主持过有关流体力学的讨论班。
要判断成果的内容是否正确和其难度,一般需要找小同行,即属于同一个三级学科(例如一级学科力学下的二级学科流体力学下的三级学科空气动力学),甚至于还要是同一研究方向的(例如都是空气动力学下的稀薄气体力学研究方向)才行。而要对成果的价值做出评价就要求评审专家对更大范围的力学问题,甚至于对预期研究成果能起作用的领域,如航天技术、船舶技术等领域,都有一定的了解。仅有小同行是不足以对成果做出全面评价的,除非那个小同行同时满足上述条件。
克莱因作为数学家,应该可以判断出普朗特对方程的简化是合理和可行的。
另一方面,克莱因在1897年访美时,参观了在芝加哥举办的世界博览会,深感美国和德国相比,地大物博,人口也多,而且很有创造性,发明了很多新东西。他认为德国要和美国竞争,必须要依靠自身当时在科学上胜过美国的条件,将科学作为技术发展的支撑,也就是说将理工结合起来。
关于我军整体外语能力建设的几点思考 ………………………………………………… 王 萍 叶建军(4.53)
而当时正是航空技术蓄势待发的时候。正是在1903年,美国的莱特兄弟试飞了世界第一架有动力的飞机。而飞机不像一般在陆地或水上的交通工具,不能事先没有可靠的设计就试飞,那样很容易机毁人亡。而普朗特成果的意义正是在于它提供了能够事先算出流场,从而为设计提供依据的可能性。
所以,我们可以说,克莱因做出的判断包括两个方面:一是他判断普朗特的工作“有价值”,即将流体力学用于解决重要的实际问题成为可能。例如与航空有关的问题。二是普朗特提出的做法在科学上正确的而且可行。这“有价值”和“内容正确”应该就是针对某项技术需求而做的基础研究的评价标准。
二、要区别基础和技术研究成果的评价标准
当年克莱因一个人对这两个方面都做出了正确的评价。但现在科学和技术的范围及内容都已远远大于克莱因时代,要一个人同时对上述两个方面都做出正确的评价一般已不太可能。为此,一般需要经两级同行评审。
如果不做无粘的假设,除极少数几个简单情况外,流体力学的控制方程Navier-Stokes方程无法求解析解;而在没有先进的计算机时,也无法求数值解。而普朗特则从实验中发现,如果一个薄的物体在流体中运动,例如薄板在流体中被顺着薄板的方向拉动,则流体只在靠近薄板的地方有旋,而离薄板稍远处就几乎是无旋的。因此,他建议将流场分为两部分,大部分区域可用无粘方程,而在紧邻薄板的一薄层内,则用他建议的简化方程。这样在当时没有计算机的条件下,有可能求得全流场的近似解。
爸爸和爷爷抓着渔网从鱼塘的这一头走到另一头,就开始第一次的收网,看到水里的大水花,我欢呼叫喊着:“好多鱼啊!”叔叔拿着筐子跑了过去,我也跑了过去,爷爷赶紧拿起草鱼扔进筐子里,我在一旁数着,“一条、两条……一共十六条,还真是顺利呀!一次就网了这么多,我们收网回家把!”
但新技术刚发明时,还未经实践的考验,对其最终价值的判断并非易事。例如,对大飞机而言,减少空气产生的摩擦阻力是永恒的课题。因此,科技工作者就不断提出各种湍流减阻的理论和方案。几年前,英国皇家学会主办的Transaction of Philosophical Magazine有一期是专门针对飞机减阻的理论和技术的。其刊登的十几篇文章中,除一篇外,全是高校和科研机构的专家所写。从纸面上看,他们的方案都是有效的。最后那篇文章的作者是在波音公司工作的,也是有一定名气的湍流方面的专家。他的文章中给大家泼了一盆冷水。他指出,各种方案看起来不错,但从技术和经济上看可能都不可行。的确,迄今为止,没有一家航空公司在它们的大飞机上实际采用任何一种以控制湍流为手段的减租技术,今后也看不到有此可能性,尤其是看起来非常诱人的主动控制技术。其原因是,只要是主动控制,就要有非常复杂的传感器、作动器和计算机。而增添这些装置就大大增加了飞机出问题的可能,即降低了飞机的安全性,而飞机的安全性是第一位的。所以仅从论文或实验室数据看似乎很有创造性的成果,实际上并没有使用价值。
因此,技术发明不仅要看其科学性和新颖性,还要看其可行性。而对可行性的判断往往不是在大学或科研单位的专家的长项。所以,对技术发明的评价,不但要有小同行的参与,还应该有潜在的使用部门的专家参与。
第三方物流服务商。我国的第三方物流服务商固然擅长物流运作,但是建材物流毕竟是新兴的产业之一,建筑材料的品类多,性质各异,而且客户对于此类商品的运输要求较高,收到货物后发现产品外观有略微的破损或者油漆脱落等问题都会影响客户满意度和之后的购买行为,所以在配送的过程中必然需要具备专业的配送人员。而第三方物流服务商缺乏相关人才,配送人员对于家装建材类的商品了解度非常有限,当配送人员不能满足要求时,家居建材的配送工作很难达到高质量高效率[12-14]。
至于对技术上的创新而言,一般来说,其有关的科学已不存在大的问题,问题在于将某一新的“有价值”的事或物做出来。因此,技术的成就主要表现在发明,而不是发现。例如,在建筑领域,钢筋混凝土构件广泛被应用。具体什么时候,由谁发明的,我没有查到。但钢筋混凝土的发明,从科学上讲,只要有工科大学二年级的材料力学知识就够了。混凝土实际是人造石头,而石头一般仅能做成柱子、墩子等而不能做成梁。其原因是石材能抗压,但不能抗拉,而材料力学告诉我们,梁在载荷的作用下,其下部产生的是拉应力,因而仅用混凝土不能做梁。后来人们发明了在混凝土梁的下部加上钢筋,在梁承受載荷后,其下部产生的拉应力可由钢筋来承担,于是就有了钢筋混凝土梁。梁是众多建筑不可或缺的构件,其发明无疑是个非常有价值的。
到了上世纪50年代,美籍华人林同炎对钢筋混凝土梁又做出了重要的改进。梁中有了钢筋就可以由它承受拉应力,但钢筋的强度远高于混凝土(即使是抗压),而且在被拉断前会有明显的拉长。因此,在梁的载荷不断增大时,在钢筋远未被拉断前,梁下部的混凝土已经开裂了。也就是说,在梁中的钢筋还有很大的潜力。林同炎提出,如在用梁或制梁前,在钢筋上预先加拉应力而同时使其附近的混凝土产生压应力,则梁的容许载荷可显著增大。因为在没有载荷时,梁下部的混凝土有预加的压应力。在对梁加载荷时,只有载荷达到某一值时,梁下部的混凝土才开始有拉应力。该载荷值,就是钢筋预加拉应力的情况下,梁能多承受的载荷。这样就大大地提高了钢筋混凝土梁承受载荷的能力。这种构件就是预应力钢筋混凝土构件。这个发明,同样只需要材料力学的知识就够了。但是要发明这一技术,就一定要对传统的钢筋混凝土梁的使用有长期的观察,熟知其破坏的原因,这样才能有针对性地创新,就和普朗特的创新一样。由于钢筋混凝土梁的使用是如此广泛,这一发明的重要性不言而喻。林同炎后来成为美国第一位华裔工程院院士,再后来又成为为中国科学院外籍院士。
可见,对于技术上的创新,其评价标准就应该是其实用的价值。
事实上,找小同行不难,但要找能对成果的价值做出评价的同行则不太容易,因为他要有更宏观的判断能力,而这样的专家并不是每个三级学科都有的。姑且称这样的专家为顶级专家。
即使有了顶级专家,除非他恰好又是小同行,一般来说也还要和小同行相结合才能得出更可靠的结论。因为没有人可以精通每一个三级学科。在上世纪80年代,曾有人发明了一种与航空发动机燃烧有关的技术。在评奖会上,多数专家认为可授予二等奖,但在场的一位顶级专家认为可授予一等奖。鉴于该顶级专家的声望,最终授予了一等奖。但迄今似乎该技术并未被采用。该顶级专家就航空发动机的燃烧问题来说,并不是小同行,因此在判断该技术是否有创新,是否的确可以用于航空发动机上,可能不如小同行准确。
马戴从少年离家踏上科举仕途之路,在经历长达二十余年的时间里,长时间地羁留在关中地区。他心怀家国,积极用世,却一生困于科举仕进。久仕不进,诗人无奈多次远赴幕府,寻找出路,在此期间,诗人写作了多首诗来表达其不得志的落第之悲苦。如其《下第别郜扶》:
钱学森先生在提倡发展技术科学时就指出:“在开发一种新的工程技术时,首先要对其可能性、可行性和克服困难的主要途径做出判断 ”。因此,对于一种还没有实际被采用的技术发明,其评价指标中就应该有“其可能性、可行性和克服困难的主要途径”。这正是对技术发明评价的难点。
所以,对技术发明的评价,同样需要小同行和顶级专家相结合。不过这里的顶级专家,是指知识面广泛,能从技术实现的可能性、可行性、经济性等做出判断的专家。
有了对科技成果的可靠评价方法,对项目、人才、机构的评价问题也就迎刃而解,即只要对其相应的具有标志性的成果进行评价就行了。
动态字段主要应用于用户数据表列(例如工资项)动态变化的情况,并且这些字段数据类型一致,处理方法相同。采用预留字段来处理动态字段,需要构建查询字符串及更新字条串,可节省数据查询时间,提高查询效率,但会多占用一部分数据表存储空间。
顺便说一句,同样的办法应该也可以用于对刊物的评价,即对刊物自选的若干标志性论文进行评价,并考虑该种论文数在刊物总论文数的占比,但关键是看标志性论文的水平。
发扬风格也不是随意发挥,上文所提到的两位翻译家,鲁迅和周作人,他们都认为儿童文学翻译作品的目标读者是儿童,因此应该着重考虑儿童的阅读习惯和心理。原文中一些晦涩难懂的词汇应该改成简单生动的词汇,所以在翻译这些作品时,译者要做二次创作。(夏丐尊,1983)[9]
通过购置、自制、联合开发,学院先后建立了一系列专业综合实训实验室:嵌入式系统实训实验室、DSP实训实验室、电力拖动自动控制系统实训实验室、电机控制系统实训实验室、电动自行车实训实验室、电力系统综合自动化实训实验室、电力系统继电保护实训室、110kV变电站监控实训室。
总之,评价一般需要由两级专家做出。一级是小同行,另一级是顶级专家。
Suggestions on the Evaluation of the Research Projects,Talent and Institutions
ZHOU Heng
(Tianjin University)
Abstract: The key issue of the evaluation of the research projects, talent and institutions is the evaluation of research production. This paper proposes an evaluation method of the practical basic research and technical invention, which includes two levels of expert review. One is conducted by the small peer, who belongs to the same third-grade subjects, or the same research areas. The other is conducted by the top experts who can foresee the future of science and technology development in a more macroscopic way. The accuracy and difficulty are evaluated by the small peer and the value is evaluated by the top experts. This method can be also applied to the evaluation of the academic journals.
Keywords: the value of productions,small peer,top experts,evaluation
中图分类号: C93
文献标识码: A
DOI: 10.19524/j.cnki.10-1009/g3.2019.03.001
作者简介: 周恒,天津大学教授,中国科学院院士。研究方向为流体力学。
(责任编辑 肖利)