汉语水平考试的科学本质_科学论文

汉语水平考试的科学本质_科学论文

汉语水平考试(HSK)的科学本质,本文主要内容关键词为:汉语论文,水平考试论文,本质论文,科学论文,HSK论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

○ 引言

汉语水平考试(HSK)是北京语言大学(原北京语言学院)自主研发的标准化的汉语作为第二语言能力考试,诞生于1984年。该考试由HSK(基础)、HSK(初、中等)和HSK(高等)三种分考试构成由低到高的考试系列。它是以汉语作为第二语言的外国人、华侨和少数民族汉语学习者为对象,以语言学(及应用语言学)、心理测量学、计算机科学等学科为基础,以科学评价汉语学习者一般语言水平为目标的测量工具。其本质是科学的,其方向是应用的。

HSK的科学本质本来无需多论,因为凡是真正了解这个考试、了解语言测验理论的人士都不会对其科学本质提出疑问(注:2005年北京语言大学汉语水平考试中心为改进现行HSK考试系列,专门举办了“语言测验分数体系研讨会”,来自全国主要相关高校和机构的知名学者对HSK的科学性和HSK中心的科学态度给予了很高的评价。)。但是正如对外汉语教学学科确立之前被视为“小儿科”,被认为“会说中国话就能教汉语”一样,汉语测试(包括HSK)至今仍被一些人轻视,以非科学的态度加以苛责,因此我们认为还是有讨论的必要。此外,人们在谈到HSK时,往往只是单纯地把它作为一种测量工具来看待,常常忽视这个工具所负载的学科意义,因此,也有论一论的必要。

一 HSK诞生的学科背景

HSK与对外汉语教学学科相伴而生,没有汉语测试理论和实践,对外汉语教学学科就是不完整的。

新中国对外汉语教学事业发展到上世纪80年代初,虽有三十多年的历史,在学科建设上也有了一定的基础,但“对外汉语教学”作为一门学科还远没有达到被承认的地步,大量的基础研究还没有真正开展起来。作为对外汉语教学的有机组成部分,汉语测试那时只有有限的成绩测试的实践,而缺乏有意识的理论思考和科学研究(注:事实上就汉语作为第二语言的成绩测试来说,到今天仍然没有真正很好地进行科学的研究,有关文章寥寥无几。吕必松1989年给《汉语水平考试研究》一书所做的“序”中就指出:“成绩测试虽然在普遍进行,但是这方面的专门研究很少。许多单位传统的考试方法比较盛行,凭经验办事的现象比较严重,离科学化还有一段不小的距离。”近20年后的今天,这种状况可以说并没有大的改变。),水平(或称“能力”)测试更是无从谈起。英语的TOEFL从上世纪60年代初开始研制(Spolsky,1995),首次进入中国是1981年。TOEFL进入中国,首先对外语教学界产生重要影响,其对语言运用技能(听的理解和读的理解)的强调对外语界一直注重语言知识的教学模式冲击很大,就外语教学的基本任务和基本方向而言,这种影响无疑是积极的。对外汉语教学本质上也是一种外语教学(或称第二语言教学),外语界所接受的影响不可能不影响到对外汉语教学界。当时北京语言学院(今北京语言大学)的一批对外汉语教师(应称为有识之士)敏锐地注意到外语教学和测试领域的变化,反观对外汉语教学领域尚无一种标准化的能力测试的现状,提出研制汉语作为第二语言的能力测试的设想,并于1984年12月正式成立了由刘珣等五人组成的“汉语水平考试设计小组”(注:根据刘英林等(1988),“HSK这一课题的研究和小型的试验是从1981年开始的,1985年进入实质的设计和试测。”我们经常说HSK是从1984年开始研制的,是以正式立项并成立五人设计小组为标志的。设计小组成员:刘珣、黄政澄、方立、孙金林、郭树军。)。1985年完成第一套试卷的试测,并在第一届国际汉语教学讨论会上发表了《汉语水平考试的设计和试测》(见刘珣等,1986)一文,引起轰动。这标志着对外汉语教学的学科建设迈出了非常关键的一步。接着在1986年和1987年又进行了两次大规模的试测。三次大规模试测的结果全面地反映在刘英林等《汉语水平考试(HSK)的性质和特点》(1989)一文中。试测结果表明,HSK是一种信度和效度都很高的考试。这为正式推出该考试打下了坚实的理论和实验基础。1988年北京语言学院首次正式举办HSK考试,并颁发证书。

三个等级的HSK考试系列是伴随着对外汉语教学的发展逐步研制完成的。今天称作 HSK(初、中等)的这个分考试就是最初设计的“汉语水平考试(HSK)”。到上世纪70年代末,我国的对外汉语教学的主要教育类型还是非学历的汉语预备教育(注:当时叫“现代汉语”专业,后叫“汉语言(对外)”专业的来华留学生汉语专业学历教育1975年在北京语言学院试办,1978年首次正式招生,但规模很小。),各高校承担的汉语教学任务主要是通过一到两年的教学,使来华留学生的汉语水平能够达到进入相关高校学习理工农医、文科专业的程度。在HSK诞生前,各高校的对外汉语教学工作没有一个统一的、客观的标准来确定学生是否达到了结业和入系学习专业的要求,这种现实的迫切需要是 HSK研制工作的原动力。进一步讲,“标准意识”的确立是HSK产生的最重要因素,而这一点对于整个对外汉语教学学科地位的确立同样非常重要。由于历史的原因,严格意义的对外汉语教学学科建设始于上世纪70年代末80年代初,1979年试刊《语言教学与研究》应视为一个标志,陆续发表了一些文章,尽管多数文章理论性和科学性还不是很强,毕竟开始了自觉的探索。恰在同时,汉语水平考试的研制动议提出,科学的测试标准的建立摆上了日程,这无疑在严格的科学意义上推动了对外汉语教学学科的建设,因为要研制标准化的语言水平考试,就必须要有基本的条件和保障(注:参见吕必松《汉语水平考试研究·序》(1989)。)。在考试研制工作的推动下,《汉语水平等级标准和等级大纲》(1988)及其后的《汉语水平词汇与汉字等级大纲》(1992)和《汉语水平等级标准与语法等级大纲》(1996)相继问世。尽管自这些大纲问世以来就没有停止过对大纲的批评(注:笔者就曾在《汉语水平词汇与汉字等级大纲》出版的第二年写出了《〈HSK词汇等级大纲〉问题浅见》一文,发表于《第四届国际汉语教学讨论会论文选》(1995)。),但不可否认,标准和大纲对于整个对外汉语教学事业和学科具有非常重要的意义和作用,无论是总体设计、教材编写还是课堂教学、测试,都有了科学的依据。因此一定意义上可以说,没有汉语水平考试,就没有对外汉语教学的标准化和规范化。随着对外汉语教学事业的发展,教育类型发生了重要的变化,由最初的汉语预备教育为主转变为汉语进修教育、汉语专业教育和汉语预备教育等多种教育类型并存,特别是汉语专业教育有了快速的发展。这对汉语水平考试提出了现实的要求,也使面向高水平汉语能力者的测试有了研制的规模保障。经过几年的努力,HSK(高等)于1993年正式推出,原有的“汉语水平考试(HSK)”命名为HSK(初、中等)。面向汉语初学者的考试随着事业的发展也有了一定的需求,北语汉考中心于1997年又推出了HSK(基础)。至此,由低到高三个分考试组成的HSK考试系列研制完成,基本满足了各层次汉语学习者的考试需求。在汉语加快走向世界的新形势下,北语汉考中心又在原有的基础上,研制开发了面向最低端汉语学习者的新产品——HSK(入门级),于2006年正式推出,获得好评。

二 HSK的学科基础

HSK作为一种标准化的语言能力考试,和世界上诸多语言测试(如TOEFL等)一样,都是多学科交叉应用的产物,有其特定的学科基础。HSK自研制之初就以当时国际语言及语言测验领域的最新理论作为研发基础,因此起点很高。

首先,语言学(及狭义的应用语言学,即语言教学)理论构成了语言测试中关于“测什么”的学科理论基础。

语言测试通常指的是外语测试,而外语测试一般情况下(自学者除外)又和外语教学紧密相关。教什么和测什么的问题都和教者、测者持何种语言观有直接的关系。你是把语言看作一整套知识还是把语言看作一种能力,或是其他,也就必然会确定不同的教学和测试的路子。TOEFL进入中国前,外语界的基本教学路子就是以各种语言知识(语音的、词汇的、语法的等)教学为主,对各种语言技能相对忽视。不管这种路子是有意选择还是无意为之,终究是一种认识的结果。对外汉语教学界多年的教学实践主体上也是以语言知识教学为主线,近二十年来虽然强调结构、功能和文化结合的原则,但无根本性的改变。无论是把语言看作一套知识,或是一种技能,或是一种能力(注:参见李筱菊(2001:3)。),在教和测上,都要有所依据。教又和学密切相关,因此学习者是怎么学习外语的,这也是语言测试研究中必须要考虑的,而第二语言学习和习得理论可以为语言测试提供重要的支持。

具体到汉语测试,汉语语言学的诸方面成为HSK编制中的重要基础。汉语的类型学等方面的特点必须在设计中得到很好的体现,汉语书面语以汉字为书写符号的特性也要在设计中有所反映。

从HSK研制之初至今,研究人员都一直坚持科学的指导原则,不仅有明确的理论认识,而且在实践上遵循基本的科学标准。刘珣等(1986:536)在介绍HSK的设计时专用一节讨论语言形式、语言功能、交际能力等重要理论问题,认为“语言形式与语言社会功能在教学中有机地结合起来,正确地处理好语言能力与交际能力的关系,以达到较全面地培养运用语言能力的最终目的,这是我们对外语教学所持的立场,也是设计汉语水平测试的依据”。这说明该设计小组对这些理论问题有比较深入的思考(注:关于一个语言测试究竟该如何处理知识、技能和能力的关系问题,还很难定于一论。强调语言的交际功能当然没错,但“交际能力”到底能不能“教”(好),能不能“测”(准),至少到目前还没有见到确定的答案。理论认识是一回事,实践操作是另一回事,所以王宗炎(2001)在给李筱菊《语言测试科学与艺术》的“序”中说“你考语言知识吗?信度高,可是效度不高。你考语言运用的能力吗?效度高,可是信度不高。”),在此基础上确定基本的设计原则。作为HSK的基本依据,《汉语水平等级和标准》的制定是和考试的研制同步进行的。汉字、词汇的定量和分级都有比较科学的依据。汉字字量的研究在汉语语言学领域有很好的基础,这为汉字等级标准的制定提供了很好的条件;汉语词汇的定量研究也有不错的基础,北京语言学院语言教学研究所常宝儒教授等完成的项目成果《现代汉语频率词典》在制定词汇大纲的过程中发挥了重要作用。汉语水平考试的研制者们充分利用汉语语言学和应用语言学(对外汉语教学)的研究成果,带着明确的“标准意识”,立足于汉语水平考试的研发,但不限于汉语水平考试研发本身,在汉语水平等级标准的制定上用力甚多,两方面的工作紧密结合,同步推进。这一过程有两个效果,一是使标准的制定有了大量的测量实践的支撑,二是使考试的研发建立在基础扎实、有科学依据的语言内容纲上。正由于此,无论是汉语水平考试本身还是《汉语水平等级和标准》,问世以来,虽然时有批评,总体上还是得到了普遍的认可,在学科意义上和应用意义上都起了非常重要的作用。

其次,心理测量学为语言测试提供了关于“怎么测”的理论和方法上的学科基础。

语言既是一种社会现象,也是一种心理现象。语言测试的目的是要运用一定的测量手段对应试者的语言能力(或称水平)作出评价,并对应试者能够运用语言做什么做出描述。测量语言能力不同于测量有高度、长度等属性的事物,因为按照乔姆斯基的观点,语言能力是人的一种心理状态(注:参见张凯(1998)。)。人类对语言能力的理论认识,至少到目前为止,还是非常初步的。尽管如此,语言教学和语言测验的实践一直存在,也一直在发展。前者假定可以通过教学活动使学习者获得语言能力,后者假定通过一定的方法可以测到应试者的语言能力。两方面的实践都建立在对语言能力客观现实性的假设基础上,事实上一定程度上也得到了经验的证明。换言之,在语言教学和语言测验的实践中,人们是感觉到或认识到语言能力是客观存在的。一个对外语一无所知的人,经过一段时间的学习,能够说出(或写出)该外语的一些话语,因此说此人具有了一定的该外语的语言能力;再经过一段时间的学习,此人能够说出 (或写出)的该外语的话语多了、复杂了、丰富了,因此可以说此人外语的语言能力增强了。同样,一个学过一段时间外语的人,参加了某种语言测验,达到了某个级别,因此可以对他的语言能力有一个描述,再经过一段时间的外语学习,语言测验又可以对他的语言能力作出发展了或是没有发展的判断。这一切都建立在人类对语言能力的常识性确认的基础上。究竟语言能力是什么?怎样构成的?该如何系统地说明?这就需要心理学家、语言学家等对这些问题做出科学的回答,因此这是“科学”的任务,需要跨越“常识”(注:参见欧内斯特·内格尔(1979:1)。)。这个任务具体就要由“语言测试”这门交叉性的学科来完成,该学科就是要对一组言语行为进行测量,这组行为是表征目标能力的全部行为的一个抽样,测试的结果是为了可以对目标能力做出推论(注:参见李筱菊(2001:33)。)。

心理测量学为语言能力的测量提供了理论和方法。主要的和基本的理论就是信度、效度理论,这两个概念也是语言测试中的最根本的概念。信度是对测量一致性程度的估计,其研究结果是确定某个测验在使用中是否具有稳定性和可信赖性(注:参见金瑜(2001:209)。)。效度是一个测验对其所要测量的特性测量到什么程度的估计。信度可以从一个测验实施后的数据分析中获取,而效度则需要通过测验后的效度验证得出高或低的判断。

信度、效度理论为语言测试这一交叉性学科科学系统地说明语言能力提供了可能性。通过一系列的实验、调查和统计分析,可以得到定量的、定性的各种结果,据此对被试的语言能力做出推论(具体刻画为某一个级别),并能够对若干被试的语言能力作出基于数据的分层推论。这一整套测量理论和方法相对于要测的内容来说,就是一套手段性的科学,有了它,就可以把“常识”作科学的说明。好比对重量的测量,常识会告诉我们某件物品重,某件物品轻,重和轻的表述就一般的语言表达要求说足够了,不需要精确;但如果问到底多重,就需要准确的甚至是精确的测量,因此就需要有科学的测量工具。从最基本的道理上说,语言能力的测量也是一样。常识会告诉我们张三的外语不错,能说会写,李四的外语较差,说不流利,写不顺畅,会得出张三语言能力强,李四语言能力弱的判断。但究竟两人差距多大,则无法说清了,这就需要有一种科学的测量工具给不同人的语言能力做出具体描述。相比于物体重量的测量,语言能力要困难得多,因为它是一种心理特质,看不见摸不着,需要特殊的测量手段。信度、效度理论恰恰可以用来实现这个目标,解决“怎么测”的问题。

作为语言测试的一个品种,HSK从设计之初就完全按照测量理论和方法,在测验长度、试卷结构、题目类型、施测过程、评分阅卷等方面努力追求高信度、高效度,结果令人满意,达到了一个科学化语言测试的基本要求。

除了上述两个最重要的学科基础,在手段和工具层面上,计算机科学也为语言测试提供了重要的支撑。大量的实验需要进行大量的统计分析,手工统计和计算虽然也能完成基本任务(注:在HSK研制之初,条件艰苦,就曾手工计算过数据。),但必然要耗去相当的人力和时间,效率低,发生误差的可能性大。随着计算机科学技术的发展,语言测试的手段得到加强,很多工作都可以交给计算机去完成。相应地也出现了很多实用型统计分析软件,推动了语言测试的进一步科学化。计算机科学还为新型考试提供了可能性,比如计算机自适应语言测试(Adapted Test)、基于网络的语言测试等。这方面的发展很有前景。

如果把测试的实施也考虑进来的话,科学化的管理也是一个重要的方面。语言测试中的信效度依赖于很多因素,从命题到实施,再到评分,整个过程能否在一种合理的有序的状态下运行,直接影响了一种考试的质量。这当中需要管理学、运筹学的支持。

三 HSK的科学实践

二十多年来,HSK的研究人员一直高举科学的旗帜,在测试研究中践行科学的原则和精神。正因如此,这个测试品牌赢得了广泛的认可,其权威性和影响力毋庸置疑。可以说,科学性是这个测试品牌的核心品质。

HSK的科学性是由以下几方面的科学行为和科学实践来保证的:

3.1 高起点的设计

前文说过,上世纪80年代初,汉语水平考试事业的开拓者们带着明确的“标准意识”开始了HSK的研制工作。当时我们国家刚刚结束了十年“文革”,无论是资料、研究条件还是外部环境,都不利于汉语水平考试的研制(注:在2006年12月举行的“HSK改进工作新闻发布会”上,汉语水平考试研制工作领导者、前北京语言学院院长吕必松教授在充分地肯定了HSK改进方案之后,动情地对改进工作项目组说,当年是顶着巨大的压力进行研制工作的,“白卷先生”引起的对考试的否定当时还有很大的影响。)。但是这些开拓者们以其强烈的使命感和责任感,克服了种种困难,边学习边实践,在一个较高的起点上奠定了汉语水平考试的科学基础。考试的设计思想既反映了当时国际语言学、语言教学及语言测试领域里的最新成果,又紧密结合汉语实际,体现汉语特点。

HSK是一种标准化的、有一定规模的语言能力测试,各个级别都有多次的考试,因此就会有多个平行的试卷。为了保证题目的难度、区分度合格,保证每次考试之间是可比的,设计之初就确定了题目预测和试卷等值的基本路线。在常模样组的确定、预测样本的选择、等值方案的制定等方面,都有精心的思考和设计。近些年来,随着HSK考试规模的扩大,对预测和等值的要求有了新的变化。HSK研发人员根据新的形势的要求,调整预测和等值策略,将原来的一个预测点扩大到十个预测点,成功地找到了对应关系;等值也根据不同的情况确定最佳的方案。

3.2 反复的调查实验

HSK自诞生以来,大大小小的实验和调查已难以细数。1985年拿出第一套HSK试卷后,在当时的北京语言学院一、二年级留学生中试验,回收有效卷362份,分析结果详见刘珣等(1986:541)。1986年又在全院进行了第二次大规模试测,同时将测试范围扩大到北京师范大学、北京大学、山西师范大学等(注:参见刘英林(执笔)(1988)。),后扩大到15所高校。1987年进行了第三次试测。三次考试都达到了很高的信度,分别为0.949、0.964和0.97。三次试测还分别进行了试卷间、分测验(阅读理解、听力理解)和全卷的相关分析,并做了内容效度、同期效度等方面的效度研究。在开展试验性考试的同时,研究人员还非常重视跟踪调查工作,分别于1986年9月和1987年9月调查了参加1985年和1986年的汉语水平考试的学生,了解他们进入理工专业和文史哲专业学习的情况,这方面的研究对于确立合理的能力标准非常重要。1986年试测的试卷还曾用于北京大学对外汉语教学中心1987年9月学生入学分班考试,统计分析结果证明,HSK试卷用于入学测试较为准确、可行。经过反复的实验和调查,当时的研制小组才提出在全国乃至世界推行HSK的建议。从有关资料看,三年的试测和研究工作很充分,数据和材料翔实可靠,奠定了HSK的科学基础。

HSK自1989年正式推行以来,在原有的基础上,北语汉考中心仍然不断地开展各种形式的实验研究、调查研究。

3.3 扎实的基础理论研究

HSK本身是一种语言测试产品,是一种语言能力的测量工具。而这个工具的生产离不开各相关领域的基础理论研究。比如,这个工具要测量的是人(二语者)的语言能力,首先就要对语言能力本身有所认识。语言能力是什么?语言能力的结构是怎样的?语言能力怎样表现?等等,都需要很好地加以研究。尽管从一定意义上说,语言能力问题是一个相当难的问题,汉语水平考试的研发人员还是知难而进,进行了一些有益的探讨。陈宏(1996、1997a)、王佶旻(2002)、张凯(2005)的研究代表了这方面的成果。此外,北京语言大学汉语水平考试中心培养的硕士研究生马新芳对第二语言的阅读能力和写作能力的关系进行了实证研究。(参见马新芳,2005)这些研究对于深入认识语言能力问题都有启发价值。关于语言测试的原理性问题,张凯(2004)讨论了测验的测度和精度问题,指出测度是为了把不可测的变为可测的而虚构出来的,和物理测量相比,语言测验是不太准确的。关于测验理论中的标准参照理论,张凯(2002)有很深入的研究。在效度理论研究方面,陈宏(1997b、1997c)、张凯(2004)这三篇文章集中讨论了结构(构想)效度问题,因为这是心理测量中最重要的概念,对这个问题进行深入的探讨无疑会对汉语水平考试的科学化产生重要影响。另外,在等值技术方面,谢小庆(2000)对15种等值方法作了比较研究,这对HSK确定合理的等值方案很有帮助。在概化理论、DIF检测方法等方面有黄春霞(2004)、于媛颖(2005)的初步研究。

上述这些基础理论研究构成了HSK科学的、可持续发展的坚实基础。

3.4 深入的测试实践研究

除了上述基础理论研究外,多年来,围绕着HSK本身开展了大量了实践研究。第一篇重要文章就是刘珣等的《汉语水平考试的设计与试测》(1986)。主要研究成果集中反映在刘英林主编的《汉语水平考试研究》(1989)、北京语言学院汉语水平考试中心编的《汉语水平考试研究论文选》(1995)、刘镰力主编的《汉语水平测试研究》(1997)、谢小庆主编的《中国汉语水平考试(HSK)研究报告精选》(2005)、孙德金主编的《语言测试专业硕士论文精选》(2005)、北京语言大学汉语水平考试中心的《世界汉语教学》汉语水平考试研究专号(2006)和张凯主编的《汉语水平考试(HSK)研究》(2006)等论文集中。研究的问题涉及考试的方方面面,有HSK的设计与开发、HSK的分数解释、HSK的信度和效度、HSK的公平性、HSK的题目设计和题库建设、HSK的预测和等值、HSK的主观卷评分,也有HSK的考务管理、市场调查分析等。多数研究报告都依据调查和试验,靠大量的实证材料去分析研究对象,为HSK的改进和发展提供了实实在在的研究支持。

需要特别指出的是,近几年来,HSK效度研究取得了重要的进展。2005年至2006年,在北京语言大学汉语学院的大力支持下,北语汉考中心的研究人员成功进行了数百人参加的HSK(初、中等)效度研究,取得了可靠的研究数据,有关研究报告已经或即将发表(注:已发表的文章有:王小玲(2006)、聂丹(2006a、2006b)、单玫(2006)。)。这些报告显示,HSK效度很高。此外,北语汉考试中心发挥产、学、研紧密结合的优势,语言测试专业的研究生参与考试实践,从中发现问题,在导师指导下开展研究,成果再用于考试质量和效率的提高。

3.5 严格规范的操作要求

语言测试要保证其科学性,单靠上述各方面还不够,各个环节上操作层面的问题是否解决得好,影响也很大。以命题为例,HSK一直坚持题目语料真实性原则(注:我们注意到,新版“托福”也开始运用这一原则。)。这一点有些人(包括一些学者)不完全理解,认为作为母语者写出的句子、话语当然可以做题目的语料。事实上,为了特定目的,由命题人自编的句子、话语与自然语料有很明显的差异,这种非自然的材料不能满足测试目的的要求。为了确保语料的真实,我们对每一个题目的语料都要求有出处,并且规定,除了明显文字错误外,命题人无权改动语料,确需改动的由命题部门负责人处理。我们建立了三级审题制度,对语料的规范性、公平性、敏感性,对题目答案的唯一性等进行严格的审查。再比如主观试卷(口语、写作)的评分,操作要求也相当严格、规范。首先是精心选择代表性强的标杆卷,参照评分标准,对评分员进行严格的培训。评分过程由数名专家组成的质监组负责监督。随着计算机技术的普及,我们已经建立起一套系统化、集成化较高的阅卷评分管理系统,口语和写作的评分均实现在电脑上的盲评,对阅卷过程的监控也十分便捷。在施测环节,为了减少环境因素、人为因素对测试效度的影响,我们一直对考务组织管理工作高度重视,从考点设立、考场环境的保障到督考和主兼考人员的培训、考试程序的严格规范,都有详细的规章制度,并且逐项落实。每次考试前,无论规模有多大,都要进行严格的主兼考培训,强化程序的落实。这些措施因为操作性强,取得了很好的效果。

用上述很短的篇幅来描述HSK二十多年的实践显然是十分概括的,但从这个粗线条的描述中可以看到,汉语水平考试的研究人员一直秉持着科学精神,在各个方面进行着不断的探索,从而使得HSK不断发展,赢得社会承认。

四 结语

在明确了HSK的科学本质的同时,我们也要认识到,语言测试和其他心理测试一样,不能奢望十分精确地测到想要测到的东西,因为如前所述,语言能力是一种看不见摸不着的东西,是一种心理特质,要靠应试者对题目这种刺激物所作出的反应来推论其能力,推论的准确性有多高,取决于多种因素,并且很多因素往往难以控制。这样说可能会令人沮丧,其实不必。客观地说,语言测试因为有了内容科学、手段科学(注:参见李筱菊(2001:25)。)的支撑,已经能够在相当程度上较为准确地帮助我们推论出语言能力,这也就是为什么像“托福”、HSK一类的语言测试品牌得到社会认可的道理所在。相对于解决什么是语言能力这个科学问题来说,任何一种语言测试本身其实也是一种手段和工具,因此语言测试实际具有两重性,一是基于语言能力假设、满足社会语言测评需要的实用工具,二是用来研究人类语言能力及其构成的研究工具。

作为一般性的知识,包括HSK在内的语言测试是一门交叉性的学科,所进行的是应用性的科学活动,这应该是毋庸置疑的。然而遗憾的是,在科学昌明的今天,笔者还要在这里不厌其烦地说明HSK是个科学的东西,不是随随便便弄出来的东西,实在是因为现实中确实存在着不把它当科学的现象。讨论这个问题,是想建议还没有认识到其科学性的人,在讨论有关问题前应先弄清相关的概念、基本理论。比如时常有人说你们这个考试太难了,其实他还没有搞明白他说的“难”和我们说的“难”不是一个概念。本文所论,并不是说HSK就是一种绝对完美的、绝对科学的测试产品。事实上,目前乃至将来也不会有绝对完美、绝对科学的测试产品。HSK还有不少需要改进甚至改革的地方,我们已经基本完成了HSK(改进版)的研制工作(注:改进方案详见北京语言大学汉语水平考试中心“HSK改进工作项目组”(2007)。),即将向社会推出。从科学的意义上说,我们只能按照科学的要求和基本规范进行不断的科学探索活动,努力地逼近目标。任何不切实际的或者是无知的苛责对于科学探索活动都是有百害而无一利的。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

汉语水平考试的科学本质_科学论文
下载Doc文档

猜你喜欢