普通话水平测试的教育统计与教育测量研究

普通话水平测试的教育统计与教育测量研究

李国强[1]2001年在《普通话水平测试的教育统计与教育测量研究》文中研究指明《中华人民共和国宪法》规定:“国家推广全国通用的普通话。”1994年国家叁部委颁布了《关于开展普通话水平测试工作的决定》和《普通话水平测试大纲》(下简称《大纲》)。普通话水平测试(下简称PSC)是推广普通话工作的重要组成部分,是使推广普通话工作逐步走向科学化、规范化、制度化的重要举措。PSC目前正在全国逐步开展,云南由于起步较早,PSC已经进行了10多年,取得了一些成绩,但由于在测试的理论、内容、数量和方法上,还缺乏科学、统一、明确的标准,缺少教育统计与教育测量相关数据的有力支持,所以,在PSC工作中,究竟“考什么”、“考多少”、“怎么考”等等至今仍是人们不断改进和探讨的重要问题。PSC作为一种语言测试,本身具有测试对象的广泛性和测试实施的特殊性,只有通过教育统计和教育测量的理论和方法,才能得出确切而非经验的各项量化指标,才能进行精确的测试,才能进行科学的、更大领域的判断和预测,提高PSC的科学性、准确性。PSC测试的是被试的语言能力,它是被试的语言知识、智力、才能及其大脑活动等等复杂的心理外现,不象其他物理测试如对重量、长度或温度等可以通过精密仪器来直接测出,我们应该以传统的经典测量理论为基础,进一步吸收适应于PSC的新的测量理论,才能得出被试对PSC的行为和反映,进而对被试的普通话能力水平作出科学、客观的测定,基于PSC的特点,本文引用了心理测量中较新的概化理论。 在本研究中,通过对云南省5个有代表性的方言地区、5个对PSC进行教育统计与教育测量的实验研究有代表性的少数民族的1300份随机样卷中的2,646,000个数据进行教育统计、教育测量和概化理论的统计分析和理论论证,我们得出了PSC“考什么”的答案是:PSC主要的测试内容为被试的普通话整体水平、言语的标准度、流畅度、规范度以及被试的语言表达能力、说话(方式、方法)6个方面;“考多少”要根据不同的测试所要求的不同信度来决定,所以我们对不同地区、民族、项目和测评员的交互效应作出了统计分析:当测评员为7人,项目是4个时,对不同地区、民族的被试测试结果与其普通话真实能力之间的相关度达到了0.9;当测评员为2人,项目是4个时,相关度也达到了0.8691。所以,现行的PSC四个项目的测量精度是较高的。一般情况的考试,“考多少”的答案可以是考单字、词语、朗读、说话4个项目;至于“怎么考”的问题,我们同样可以得出,在一般的考试中,使用2名测评员,4个项目时,已经能较为准确地测量出被试客观的普通话水平了。我们还给出了不同测评员和项目搭配组合的信度,根据测量需要达到的精度,可以采用相应的测评员与项目的不同组合。

刘华[2]2002年在《普通话水平测试信度分析与改进模式选取》文中研究指明本文采用教育测量与教育统计的科学理论和方法,通过对普通话水平测试试卷信度系数和测评员之间的皮尔逊积矩相关系数的分析,来探求测试试卷内部的一致性(试卷信度)和测评员测试成绩的一致性(测评员信度)情况。先以试卷信度分析为主,分析试卷题项及各测评模式的信度,再根据测评员信度与测试项目的测试标准的可操作性之间的关系来比较测试项目的可比性,进而从另一个角度来分析试卷的信度。最后,结合两个信度分析数据,以量化的手段,对PSC进行研究,力求对PSC中究竟“考什么”、“考多少”、“怎么考”等最直接、根本的问题作出比较客观、科学的回答,并以此基础,探求具有客观性、科学性、广泛代表性和经济适用性的PSC改进模式。

王晖[3]2016年在《普通话水平测试依据研究》文中研究说明普通话水平测试是载入《国家通用语言文字法》的大规模国家通用语言口试,在我国语言文化建设中具有重要作用,在语言测试领域也以其鲜明的特点,独树一帜。本文旨在通过对普通话水平测试依据的研究,丰富普通话水平测试学科体系,为完善普通话水平测试提供学理支持,为推广和规范使用国家通用语言文字工作提供学术建议。本文以普通话水平测试依据为研究对象,共分六章。第一章为绪论,阐述选题缘由、研究对象、现状、框架以及思路、方法、意义。第二章是理论部分,界定测试依据的内涵、外延,构建测试依据层级系统,论述测试依据的叁级范畴及特征。第叁章是史论,梳理测试依据发展历程,为本文研究树立纵向参照系。第四章、第五章是专论,分别研究测试管理依据、学术依据及其二级范畴、叁级范畴。第六章为结语。本文对普通话水平测试活动要素进行解构和建构,并将测试依据置于“测试中介”的核心要素中加以研究,提出测试依据的叁级范畴体系,首次将测试管理依据纳入研究范畴,确立了管理依据与学术依据并立的新格局。本研究提出一系列测试依据术语,如管理依据、学术依据、宏观管理依据、微观管理依据、基础学术依据、具体学术依据、法律法规依据、政策文件依据、业务管理依据、命题依据、评分依据等,初步构建测试依据术语子系统,增强了测试依据研究的理论张力。本文提出测试依据发展历程“两阶段五时期”划分法,为测试发展史研究提供新思路。本研究对测试依据的内容、特点和作用等进行专门探讨,对《国家通用语言文字法》《普通话水平测试管理规定》《普通话水平测试等级标准(试行)》《普通话水平测试大纲》以及命题依据、评分依据等进行重点研究,分析其特点、现状及存在的问题,并提出完善建议。本文以普通话水平测试要素构成理论为参照,运用文献研究法、比较研究法、定性定量综合研究法,对测试依据进行描述、归纳、阐释、分析和建构,探究测试依据的内在规律和发展动因,使测试依据成为独立的、系统化和理论化的研究界域,为普通话水平测试学科理论和工作实践提供参考。

王渝光, 姚一斌, 张雷, 杨志明[4]2002年在《现行普通话水平测试的质量评析与改进——兼答《方言区普通话测评中的负面因素》一文》文中认为文章根据语言测试的理论与方法 ,结合云南、香港的普通话水平测试的实践和实验数据 ,分析、评价了现行普通话水平测试的质量 ,探讨了普通话水平测试的改进问题。

刘利平[5]2013年在《凉山彝族自治州普通话水平培训测试现状调查与研究》文中进行了进一步梳理本文主要通过对凉山彝族自治州民族杂居区的语言使用状况和普通话水平现状以及凉山州的普通话水平培训和测试现状的调查,分析杂居区的普通话水平现状以及普通话培训测试取得的成绩和出现的问题,并针对这些问题,联系杂居区普通话水平的实际现状,提出建设性的意见和建议,为普通话培训和测试的改进以及措施的制定提供参考。本文一共分为七个部分来论述。第一部分,主要是介绍本次调查的目的和意义以及调查对象和调查方法等调查前期的相关准备事宜。第二部分,主要介绍凉山地区的地理、民族、语言情况。第叁部分,结合所调查的材料,分别分析作为普通话、方言和民族语在杂居区的具体使用情况和其语言态度。第四部分,以凉山州第一期少数民族骨干教师普通话培训作为普通话培训测试现状研究的一个个案研究,通过对此次骨干教师普通话培训和测试来分析普通话培训和测试取得的成绩和存在的问题。第五部分,介绍凉山州普通话培训测试的机构并分析普通话培训测试的主要受测人群,了解普通话培训测试取得的成绩和存在的问题,并根据调查和访谈信息,提出合理可行的建议。第六部分,结合前面内容,用语言学的分析方法来分析民族地区民族语和方言对普通话学习的影响。第七部分,在前文分析的基础上,预测杂居区普通话培训测试改进的影响和其中应考虑到的问题。

仲哲明[6]1997年在《普通话水平测试若干问题的讨论》文中研究表明普通话水平测试是推普工作开始向纵深发展,逐步走上制度化、规范化、科学化新阶段的标志。测试的目的在于:评定应试人普通话水平所达到的等级;促进普通话的普及,并在普及的基础上逐步提高全社会的普通话水平,提高现代汉语的规范化程度;促进推普工作逐步走向制度化、科学化、规范化。测试是一种标准参照性达标考试,是对应试人运用普通话进行交际的能力水平的测试,是应试人掌握和运用普通话达标程度的检测和评价。测试内容主要包括普通话语音、语汇、语法、言语表达和交际等四个部分,全部采用口试方式。当前必须一方面抓好测试理论研究,加强测试本身的科学性;一方面精心组织实施,抓紧抓好题库建设、加强测试员队伍建设、重视并做好测前培训工作。最后本文提出,开展测试不应要求“人人过关”,可以根据岗位工作对语言规范化程度的不同要求和该岗位人员在推普和语言规范化工作中所处的地位和作用,分为必测、可测可不测、不必测这样叁类人员。

周中兴[7]2007年在《普通话语音测试中的目标无关性错误研究》文中指出在普通话水平第一、第二题测试中,很多测试员感到,被试出现的一些语音错误背离了测试目标,试卷设计时想要测到的音节无法测得,而且第一题的这种问题明显多于第二题。本文针对这一现象,通过对普通话水平测试理论与实践中一些问题的重新梳理,提出了“普通话语音测试中目标无关性错误”的概念(以下简称“目标无关性错误”)。并以此为切入点,首次将语言测试相关理论和方法运用其中,从第一、二题的效度检验入手,对这两题做定性与定量相结合的研究,澄清并解决了目前第一、二题测试中存在的这些问题。研究结论如下:1、通过第一、二题分别与叁、四题、总分及等级之间的效标关联效度的检验,得出了第一题与第二题相比效度偏低的结论。2、经过对第一、二题反应效度的调查,较全面地归纳出了两题中各自存在的目标无关性错误的类型,通过统计,证实了第一题反应效度偏低,而第二题反应效度非常理想。3、在分析第一题目标无关性错误产生原因的基础上,设计出了新的测试模式:第一题语音测试模式=(词语语境:语言的自然储存和使用单位—词语)读其中的单音节字词。4、通过第一题新模式实验卷与国家通用卷的实测对比检验,证明新模式是成功的。经各自反应效度的调查统计和分别与第二题之间的效标关联效度的检验,证明新模式能够明显改善和提高第一题的效度。5、通过对第一题新模式实验卷的复本信度检验,证明信度很高。6、第一题新模式实验卷对被试的影响方面,通过相关分析检验得出:相对于国家通用卷,新模式对更准确地测得被试的语音水平,尤其是年轻被试、女性被试、低学历被试的真实语音水平更有帮助。这种结果刚好也符合当前大多数测试对象的实际情况。7、第一题新模式实验卷对测试工作的影响方面:通过测试用时比较,证明新模式不仅不会影响测试工作的效率,而且,由于有了语境的提示,无论对被试还是主试来说,准确把握PSC1的测试目标,提高测试准确性都有帮助,有很强的使用性。8、在新模式试卷的命卷方面,提出和发现了7条应该注意和遵守的原则(详见研究成果小结)。9、针对普通话语音测试提出了4条原则性的建议(详见研究成果小结)。

王渝光, 杨瑞鲲, 李竹屏, 陈典红[8]2009年在《普通话水平测试的改进实验研究》文中进行了进一步梳理现行普通话水平测试在测试内容、测试量和测试方法等方面均待改进。本文以教育测量学的概化理论和经典测量理论为指导,在上述几个方面进行了广泛深入的实验研究。根据实验数据,提出了改进普通话水平测试的几种模式。

云天骄[9]2013年在《普通话水平测试(PSC)和香港普通话水平考试(PSK)题型比较研究》文中认为普通话水平测试(PSC)作为我国规模最大的母语测试,进入香港后受到了香港应试人的欢迎。同时,香港本土也开发设计了多种普通话测试。题型设计和测试目的及测试对象的特点密切相关,由于语言生活和社会文化背景的不同,普通话水平测试和香港自行开发的普通话测试在设计理念和题型设计上存在差异。我国目前对于内地和香港普通话测试的对比研究比较薄弱,本文试从题型角度,比较普通话水平测试和香港理工大学开发设计的普通话水平考试(PSK)。文章主要就读单音节字词、读多(双)音节词语、听力、判断、朗读、说话六个方面进行比较,着眼于交际能力语言观,分析两种测试各自的优点,探讨其不足,以利于两种普通话测试互相借鉴,促进语言测试质量的提高。

朱丽红[10]2018年在《2012—2017年普通话水平测试研究概述》文中认为从2012年到2017年,普通话水平测试研究延续和保持了较高的学术活力,内容丰富、热点突出,研究队伍和发表成果的阵地都呈现多样化。机辅测试和信息化、测试界域、教学培训是研究的叁个热点问题,各有一批代表性成果,关于学科基本理论的研究取得了突破性进展。但是,普通话水平测试研究仍存在内容分布不够均衡、研究方法不够丰富、研究视野不够开阔等需要改进的地方。展望未来的普通话水平测试研究,仍将保持当前的研究热点,宏观课题研究会有所增加。为进一步提升研究水平,建议加大学术人才培养力度,加强科研团队建设,探索建立更加有效的科研组织机制,注重多学科交叉性研究,开阔学术视野,丰富研究方法和手段,拓展学术交流平台和学术成果发表阵地。

参考文献:

[1]. 普通话水平测试的教育统计与教育测量研究[D]. 李国强. 云南师范大学. 2001

[2]. 普通话水平测试信度分析与改进模式选取[D]. 刘华. 云南师范大学. 2002

[3]. 普通话水平测试依据研究[D]. 王晖. 中国社会科学院研究生院. 2016

[4]. 现行普通话水平测试的质量评析与改进——兼答《方言区普通话测评中的负面因素》一文[J]. 王渝光, 姚一斌, 张雷, 杨志明. 语言文字应用. 2002

[5]. 凉山彝族自治州普通话水平培训测试现状调查与研究[D]. 刘利平. 四川师范大学. 2013

[6]. 普通话水平测试若干问题的讨论[J]. 仲哲明. 语言文字应用. 1997

[7]. 普通话语音测试中的目标无关性错误研究[D]. 周中兴. 华东师范大学. 2007

[8]. 普通话水平测试的改进实验研究[C]. 王渝光, 杨瑞鲲, 李竹屏, 陈典红. 第四届全国普通话培训测试学术研讨会论文集. 2009

[9]. 普通话水平测试(PSC)和香港普通话水平考试(PSK)题型比较研究[D]. 云天骄. 中国社会科学院研究生院. 2013

[10]. 2012—2017年普通话水平测试研究概述[J]. 朱丽红. 浙江师范大学学报(社会科学版). 2018

标签:;  ;  ;  

普通话水平测试的教育统计与教育测量研究
下载Doc文档

猜你喜欢