国际科学质量评价的比较与启示_科学论文

国际科学素质评估的比较与启示，本文主要内容关键词为：启示论文,素质论文,科学论文,国际论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：G315 文献识别码：A

随着知识经济的发展，提高公民科学素质，改善国民生活质量，增强社会创新能力，已成为现阶段中国国家建设的重要内容。2006年初，国务院颁布并开始实施《全民科学素质行动计划纲要(2006-2010-2020年)》(以下简称《纲要》)。在我国历史上，这是第一个提高全民科学素质的纲领性文件，它的实施对于提高国家竞争力、建设创新型国家、构建社会主义和谐社会都具有极其重要的意义，因而受到了社会各界的广泛关注。《纲要》中的第六部分提出了“建立公民科学素质状况和《科学素质纲要》实施的监测指标体系，并纳入国家社会发展指标体系”的目标，这使得对公民科学素质测评指标体系的研究更具有现实意义。

《纲要》中提出“2010年中国公民科学素质达到世界主要发达国家20世纪80年代末的水平，2020年达到世界主要发达国家21世纪初的水平”。鉴于美国“公众理解科学技术调查”已有三十多年的历史，历次调查数据完整，其评估体系业已成为国际成人科学素质评估的主流，所以本文选择了美国“公众理解科学技术调查”作为研究对象。

《纲要》中同时提出了四类人群战略，即以未成年人、农民、城镇劳动力、领导干部和公务员四类重点人群为基础，通过提升四类人群的科学素质带动全民科学素质的提高。未成年人的科学素质评估也第一次成为我国公民科学素质评估的重点。作为目前世界上规模最大的未成年人素质调查，国际经合组织(OECD)开展的“国际学生评估项目”(Programme for International Student Assessment，以下简称PISA)对于我国的公民科学素质研究，尤其是未成年人科学素质评估，有着非常重要的参考价值。

本文将以美国的“公众理解科学技术调查”和国际经合组织的PISA为代表，回顾国际成人和未成年人科学素质评估的理论和实践，结合上述工作就它们给我国公民科学素质评估带来的启示，提出中国开展此项工作的若干建议。

1 美国的“公众理解科学技术调查”

1)实践概述。

美国是最早进行公民科学素质评估的国家之一。早在1957年，国家科学撰稿人协会就发起了一次有关美国公民理解科学的全国性成人调查。在随后的十多年中，美国有关公民科学素质的大规模调查处于空白期。直至1972年，出于发布国家《科学指标》(1987年更名为《科学与工程指标》)的需要，美国国家科学理事会恢复了公众对科学态度的相关调查。1978年，美国国家科学理事会委托了Jon D.Miller和Kenneth Prewitt开发用于评估公民科学素质的新方法，并负责组织“公众理解科学技术调查”。在随后1979年的调查中，美国成年公民的科学素质评估体系——“Miller模型”的雏形基本形成，由于应用效果较好，这一模型成为日后美国公民科学素质调查的基本框架。通过二十多年来的持续优化和应用推广，“Miller模型”已成为国际成人科学素质评估领域的主流方案，并被欧盟、中国、日本、韩国等30多个国家采用或修改应用。

2)评估目标。

探寻当今美国开展公民科学素质评估的目的，政治制度建设的需要起了主导作用。正如J.Durant所言，“民主制度的运行是建立在公民素质的基础上，而在当今社会中，真正的民主就是建立在公民科学素质的基础上”[1]。Jon D.Miller也坚持“如果将科学政策的制定从民主制度中剥离，大部分利益相关者将立即丧失他们应有的权利”[2]。伴随着美国民主政治的发展，科技进步必然使得越来越多的科技议题进入了公民的视野，公民要想真正深入地参与其中，具备基本的科学素质成为必要前提。

总之，美国公民科学素质评估的目标是理解公民科学素质的起源及影响因素，制定相应的政策提高公民科学素质，帮助公民更好地理解科学研究和科技政策，提高公民参与科技政策讨论的能力，实现西方政治制度下的民主权利。

3)概念与维度。

早期人们一直将科学素质定义为博学的、有科学知识的。然而Miller并不认同这种定义，他在1983年的论文中强调了科学的传播层面，并将科学素质定义为“阅读、理解、表达科学观点的能力”[3]。此后Miller关于科学素质的定义基本保持不变，并根据这个定义制定了著名的“Miller模型”(见表1)。

表1 “Miller模型”中的科学素质指标体系

一级指标说明

掌握足够多的基本科学术语，理解如DNA、

关于科学概念的知识计算机软件等常用科技概念的定义

关于科学研究过程的知识理解科学研究的过程和本质

对科学技术的态度理解科技对个人和社会的影响

随着时间的推移，Miller本人也意识到模型存在一些不足。1 998年，在总结若干次欧美调查的基础上，Miller承认了“对科学技术的态度”因国家之间的经济、文化差异而具有不同的内容和标准，并建议在国际比较研究中优先使用前两个指标进行比较。

2 国际经合组织的“国际学生评估项目”(PISA)

1)实践概述。

为了有效反映各国基础教育体系的效果，国际经合组织以15岁学生为调查对象，于2000年启动了“国际学生评估项目”(PISA)。至今为止，PISA已经开展了三次大规模的跨国测试，参与国从2000年的43个国家增加到2006年的56个国家，其经济总量约占世界经济的90％。

2)评估目标。

谈到进行科学素质评估的出发点，PISA认为科学技术在日常生活中扮演着越来越重要的角色，很多情况下，人们必须理解科学技术才能顺利处理各种问题。伴随着政治制度民主化和经济全球化的浪潮，从个人到社区甚至是到全国与全球，各种与科技相关的议题需要人们参与讨论、共同形成决策。因此，良好的科学素质能帮助未成年人适应将来的生活，有利于他们参与科技政策的讨论。

对于国家而言，PISA强调了“人力资本”的重要性，并将其定义为对个人、社会、经济有益的知识、技能、能力等特性的总和，内容上涵盖了阅读素质、数学素质、科学素质。具体到科学素质，PISA的目标是描述学生的科学知识和科学技能水平，绘制各国未成年人的“科技人力资本”地图，解释相关的社会、经济、教育等影响因素，为各国政策研究提供依据。

3)概念与维度。

PISA中科学素质的理论来源可以追溯到Shamos等人在科学素质概念方面的研究，特别是Bybee关于科学素质的四层表述。Bybee将科学素质分为四层，最低层为“基本科学素质”，以上分别为“实用科学素质”、“概念和过程层科学素质”、“多元科学素质”[4]。其中“概念和过程层科学素质”被认为是对PISA体系中科学素质的最佳描述。

在综合了学者们的研究成果后，PISA将科学素质定义为“一种人们使用科学知识发现问题、得出结论的能力，具有科学素质将有助于人们制定与自然相关的决策，有助于人们理解这些决策对自然的影响”[5]。根据定义，评估体系被划分为知识、能力、态度三个维度(见表2)。

3 在比较框架中对我国科学素质评估的思考

回顾我国以往的公民科学素质调查活动，“Miller模型”以及源于此模型的国际通用问卷成为测试的主体。然而，前几次调查结果的波动和其他问题显示，“Miller模型”及其问卷在中国具有一定的不适用性。中国作为一个发展中大国，在经济、政治、文化等诸多领域都和发达国家存在较为显著的差异，不宜直接照搬发达国家的评估体系。从另一个角度看，大国的发展往往有自身的特点，公民科学素质的发展也容易产生异质性，统一的评估体系将会掩盖中国特色的科学素质发展路径。

因此，现阶段的主要研究目标是调整评估体系以适应《纲要》的要求，建设适合中国国情的公民科学素质评估体系，以更有效地服务于创新型国家建设。本文将从以下3个方面就建立适合我国国情的公民科学素质评估体系提出思路。

1)明确我国公民科学素质评估的定位。

Ellen K.Henriksen认为，对于科学素质的理解可以概括为实用观点、经济观点、民主观点、文化观点四个观点[7]。实用观点指在科学技术起重要作用的社会中，人们需要具有基本科学素养以适应的日常生活；经济观点主要从经济发展需要具有科学素养的劳动力这个角度对科学素质进行探讨；民主观点则要求在民主社会中公民有权参加科技政策的决策过程，因此人们需要具有一定的科学素质参加政策的讨论；在文化观点看来，科学是我们文化遗产中的组成部分并深刻地影响了我们的世界观，人们需要具备科学素质以便理解文化。可以看出，这4个观点基本上是由简单到复杂、由具体到抽象逐步递增的，世界上大部分的科学素质评估活动也主要是基于前三个视角开展的。

很明显，美国的公民科学素质评估定位于民主观点，是为公众参政议政服务的。这方面PISA就比较灵活，由于PISA 是个跨国评估项目，需要考虑各国不同的利益诉求，因此它的定位涵盖了实用观点、经济观点和民主观点，这种包容兼蓄的定位和我国现阶段的公民科学素质研究有着一定程度的吻合，因而具有更好的参考价值。

对我国公民而言，现阶段科学素质目标就是掌握足够的科学知识和技能，拥有一定的学习能力保证科学知识和技能的持续增长，最终改善生活质量，提高生活水平。从国家的角度看，科学素质是为了保证人力资本能够满足经济发展的需要，优化人力资本结构激发国家创新能力，提高国家竞争力；同时通过缩小社会各阶层间的知识鸿沟，减少社会差异，实现和谐社会。所以从上述角度看，中国的公民科学素质研究兼备了实用观点和经济观点的双重内涵。

当然，这并不代表中国的科学素质评估没有包含民主观点。《纲要》中有关科学素质的定义明确提出了公民科学素质也包括公民具有参与公共事务的能力。但是，公民在多大程度上能够参与科学决策的制定，不仅取决于公民自身的科学知识、技能水平，还受到政治制度、文化习惯等外部变量的影响。

2003年的中国科学技术协会组织的调查显示，符合国际通用标准达到科学素质水平的中国公众仅为1.98％，而美国在2000年就达到了17％[7]。这说明对比发达国家，我国公民的科学素质水平普遍较低。当然，这并不是说国民科学素质水平较低，就可以剥夺他们参与公共事务的权力。从两者的关系上看，科学素质和民主参与并不存在孰先孰后的问题，而是相辅相成、共同发展的关系。

因此，考虑到我国公民科学素质的现状和社会形态，测量公民参与公共事务的能力还不是现阶段工作的重点，民主还只是一个导向性的观点。当然，导向性并不只是一个务虚的概念，它意味着更多的注意力应该放在态度的测量上，尤其需要关注公民参与公共事务的态度变化，例如公民对科技政策的兴趣以及参与科技决策的倾向等。

2)建立切合《纲要》的评估体系。

《纲要》将公民科学素质定义为“公民具备基本科学素质一般指了解必要的科学技术知识，掌握基本的科学方法，树立科学思想，崇尚科学精神，并具有一定的应用它们处理实际问题、参与公共事务的能力”，即通常所说的“四科两能力”。“四科”基本没有脱离“Miller模型”的三维度框架，但是“两能力”却是第一次进入了我国公民科学素质评估的视野。

处理实际问题、参与公共事务的能力如何评估？和其他维度的关系又是如何？PISA给了我们很好的启示。PISA从解决问题的基本步骤入手，将能力分解为识别问题、获取新知识、解释科学现象、得出结论等过程，然后在一定的情境中对上述的能力过程逐一进行评估。这样做的好处在于评估结果具有通用性，因为处理实际问题的过程往往涵盖以上所有或部分步骤，改变的仅仅是不同的情境。

PISA中知识、态度被看作是能力的影响因素，在一定的科学情境中个体需要完成一些任务，如识别科学议题、科学地解释现象、使用科学证据等，这些任务完成的好坏直接等价于能力的高低(见图1)。所以，PISA中的能力维度并不是和知识、态度等并行的维度，而是在一定情境中，知识、态度综合作用的结果。

3)保证评估的连续性，完善评估的适用性。

图1 知识、态度、情境、能力的关系图

资料来源：见参考文献[6]。

公民科学素质评估不仅仅是一个短期的研究工作，更重要的是建立一套长效的评估机制。如果试题不具有稳定性，那么当测量结果出现波动的时候，将无法分辨究竟是科学素质变化的结果还是试题变动造成的影响。例如1957年美国采用“放射性落尘”作为试题，随着时代的发展“放射性落尘”已不是大众关注的重点，如果更换试题，那么新题的测量结果将难以和历史数据进行比较。

美国的研究给了我们很好的启示。Miller从一开始就试图去寻找一系列的基础概念作为试题，他认为虽然科学热点问题不断变化，但是在相当长的一段时间内，只要人们掌握了一些基本概念，理解科学观点就成为可能。例如，如果公民掌握了细胞和基因的概念，那么理解“癌症的起因是由于人体细胞的基因突变造成的”这个观点就不会有太大障碍。因此，保证评估的连续性需要建立以各学科基本概念为基础的试题库，而一个优秀的试题库则是由一系列具有适用性的评估试题组成的。

回顾以往中国公民科学素质调查，指标体系是基于“Miller模型”的，有关科学知识、科学方法的测量更是直接引用了美国科学素质评估的原题。这样做的好处在于评估结果可以直接用于国际比较研究，但是具体到中国国情却存在一些问题。例如试题“激光因汇聚声波而产生”对于大部分中国公民来说与日常生活无关，也不属于他们关心的范畴。再如关于“占星术是否是迷信”的试题，就存在着文化差异的问题。因此，完善评估的适用性势在必行。

在这方面，美国和PISA的做法都给我们提供了参考。例如美国对媒体进行了内容分析，保证大部分试题的知识背景都在主要媒体上被频繁曝光过，Miller更是将科学素质的标准设定为能够阅读《纽约时报》的科学板块[8]。PISA在选择评估内容的时候，则强调了两个原则，一是这些试题内容是贴近生活的，理想的状态是覆盖整个日常生活；二是不仅仅包括对个人产生直接影响的问题，还包括对地区乃至全球都会产生影响的问题，例如建设发电站、全球变暖等。除了在内容上保证和受测群体的一致性外，在测量技术上两个调查都使用了先进的项目反应理论对问卷题目进行检验，从定性和定量两个角度保证了评估内容的适用性。

当然，分析我国公民熟悉的知识，研究得出适合中国国情的试题并不意味着对原有试题的完全替代，而是两者的结合。保证评估内容的适用性就是在确保国际比较的基础上，更加准确地反映中国公民科学素质水平的变化，从而产生既能和国际研究接轨，又能反映中国科学素质特色的评估系统。

4 结语

我国公民科学素质评估研究起步相对较晚，因而公民科学素质的评估实践大多是对国外评估体系的直接套用，由于国情上存在较大差异，生搬硬套产生了很多问题。当然这并不意味需要全部推倒重来，毕竟美国体系经过了三十多年的发展和完善有着其独特的优势。因此，本文选择了对现有中国科学素质评估体系的母体——美国“公众理解科学技术调查”的重新剖析，同时考虑到目前在科学素质评估领域独树一帜的PISA的影响力，本文对这两个体系的实践意义和理论框架进行了详细地回顾和对比。

比较只是工具，启示则是目的。在对《纲要》理论内容和政策目标深度分析的基础上，针对现有中国公民科学素质评估存在的不适用性，本文着重就美国体系和PISA带来的启示，提出了三项具有针对性的建议，相信对于建立符合中国国情的中国公民科学素质测评体系具有借鉴意义。

标签：科学论文; 公民权利论文; 能力素质论文; 知识体系论文; 纲要论文;

国际科学质量评价的比较与启示_科学论文

猜你喜欢