人事测评技术及其理论发展,本文主要内容关键词为:人事论文,理论论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
人事测评技术出现于20世纪初,经过了近一个世纪的发展,在理论和实践上都得到了不断的完善。本文的目的在于介绍人事测评领域的现状、几种常用人事测量工具的理论依据及其使用效度,并对近年来人事测评理论的发展趋势进行简要的探讨。
一、人事测评工具及其效度分析
任何一项人事决策都是依据一定的信息而做出的推论。在人事测评领域,尤为重要的是人事决策背后所体现的理论基础和其间的因果关系,而不在于人事测评过程。依据这一理念,下面对几种常用的人事测评技术加以讨论。
1.认知能力测验(cognitive ability test)认知能力测验主要用来测量应聘者是否具备掌握工作技能的潜质。它起源于20世纪初的比纳智力测验(Binet-Simon test,1905),距今已有近百年的历史,是相对比较成熟的测评工具。尤其是20世纪70年代以来,元分析技术和大样本选拔测验的实施,使得认知能力测验的效度得到了充分的肯定。一般而言,这一方法的预测效度系数可达.56(Schmdit & Hunter,1998)。认知能力测验一般包括数量、言语和知觉速度测量(Peterson,1990)。其中,数量能力测量是测试解决有关数目问题的熟练能力,言语能力测量是测试对语言的加工、理解能力,而知觉速度测量是测试在大量材料中快速、准确知觉细微差别的能力。
认知能力测验在人才测评领域之所以能占有相当重要的位置,首先在于它相对成熟的理论基础,心理学家关于智力概念的探讨已有近100年的历史,积累了一大批有影响的研究报告。理论上的争鸣和探讨为认知能力测验的编制和使用指明了方向,奠定了基础。其次,认知能力测验应用范围比较广,无论对于初次应聘者或有工作经验者,效度都较高,而且成本较低。最后,认知能力测验对与工作有关的培训或学习预测效度较高,可以使企业在选拔和招聘时发现应聘者的可雇用性(employbility),着眼于应聘者的学习能力。在雇用没有工作经验的应聘者时,对将来工作绩效的最有效的测评方式就是认知能力测验(Schmdit & Hunter,1998)。
Schmidt和Hunter(1992)发现,认知能力对于管理工作绩效的预测效度达.58,对于高难度技术工作的预测效度达.56,中等难度技术工作的预测效度为.51,低难度技术工作的预测效度为.40,非技术工作的预测效度为.23。同时,研究还发现认知能力对与工作培训绩效的预测效度可高达.56(Hunter & Hunter,1984)。
2.个性测验(personality test)个性测验的目的主要在于考察应聘者是否具备与工作绩效有关的个性特征。20世纪90年代以前,许多学者认为,研究报告显示的低效度和实际操作中的作假(faking),使个性测验很难作为一项预测指标(Veilly& Warech,1993)。但近几年来,随着个性理论的发展,特别是“大五”个性模型(Big Five personality model)的出现,越来越多的研究报告开始纠正这一偏见。
“大五”个性模型把人的个性结构分为五个维度:宜人性(agreeableness),定义为举止得体、易合作和值得信赖;责任意识(consciousness),定义为负责、可以依赖、成就导向;情绪稳定性(emotional stability),定义为轻松、平静;外向(extraversion),定义为善于交往、善谈、自信;开放性(openness),定义为有想象力、敏感、聪明(Digman,1990)。
Organ和Ryan(1995)发现责任意识与员工的组织公民行为(organizational citizenship behavior)有较高的相关性,即责任意识得分较高的应聘者会自愿而不是在外界压力或要求下做出对组织效能有贡献的行为,而这些行为并不必然与组织的奖励相联系(Organ,1988)。个性测验不仅能够预测某些行为,还能为工作绩效做出评价(One,Viswesvaran & Schmdit,1993)。研究发现,责任意识是与个体工作绩效相关性最高、最稳定的个性维度,而且其结果可以泛化到各种工作环境(Barrick & Mount,1991; Mount & Barrick,1995)。McDaniel(1994)发现就服务业而言,宜人性和情绪稳定性对工作绩效的预测效度可达.50。
通过“大五”模型,我们发现对于不同类型的工作,个性的不同维度对于绩效所产生的预测效度不尽相同,这也许可以解释为什么个性测验在研究中的效度时高时低,以及个性测验不能得到一致认同的原因。在个性测验初步得到认可的今天,我们还是应该强调,个性测量只提供了应聘者的个性特点,并不能评价他们的专业技能、经历和学习能力。
3.工作样本测验(work sample test)这种测验方式是通过应聘者的实际操作,现场评定其是否符合工作要求,如测评现场要求应聘者修理有故障的机器。工作样本测验只能适用于具有工作经验的应聘者。一般而言,其对工作绩效的预测效度可达.54。Schmidt和Hunter(1998)的研究发现,在由认知能力和工作样本测验组成的、对工作绩效的回归方程中,前者的权重为.36,而后者的权重为.41,两者一起使用对工作绩效的预测效度可达.63。
工作样本测验的一般操作程序是:(1)首先通过职务分析(Job analysis)过程来识别岗位任务;(2)从中选出有代表性的工作样本作为测验内容;(3)制定评分程序,确定如何评价应试者的表现;(4)由有关人员实施测验。
4.面试技术(interview)面试的目的在于通过积极的人际互动过程,评价应聘者与组织的合宜程度(applicant-organization fit),而不是预测工作绩效(Adam,1994)。面试技术可以分为结构化面试和非结构化面试两种(Huffcutt & Roth,1996),非结构化面试没有固定模式和问题,也没有固定的评分程序,其人事决策的依据是总体的印象和判断;而结构化面试则与之相反,其问题是在经过认真研究之后提出的,所以其成本较高,但其预测效度也较高。一般而言,结构化面试的效度可达.51,而非结构化面试的预测效度只有.38(Schmidt & Hunter,1998)。
Huffatt和Arthur(1994)在研究中根据结构化程度把面试进行分类,结果发现预测效度随着结构化程度的提高而增大,当到达一定程度时,其效度可与认知能力测验相当。而当把认知能力测验和结构化面试一起使用时,对工作绩效的预测效度可以提升为.63(Schmidt & Hunter,1998)。
上述四种类型的测量技术是目前应用较广、效度比较可靠的测评方式。我们可以看出,工作样本测验和面试技术实际上属于一种人事测评方法,我们并不能清晰地明确它们在测量什么,但其效果比较直接,尤其是工作样本测验,其效度争论并不大;而反观认知能力测验和个性测量均是在测量某一种心理品质,并由此去推论应聘者将来的工作绩效,中间存在着推理和需验证的成分,理论的探讨和争鸣也比较多,所以也一直成为理论界试图提高和完善的领域。
二、人事测评技术的近期理论发展
完善人事测评的理论基础,提高人事测评效度,以减少人事测评过程中的误差,一直是理论界追求的目标。近些年来,人事心理学的焦点集中于工作绩效的成因上,以期能够更加科学地理解决定工作绩效的心理过程和心理变量(Schmidt & Hunter,1998)。我们可以通过两个方面去归纳近年来人事测评领域的研究趋势。
(一)人事测评预测指标的选择
1.在传统认知能力概念的基础上提出了实践智力(practical intelligence)的思想Neisser(1976)首次建议在智力的概念中,应区分出学术智力(academic intelligence)和实践智力。前者表现在学业的测验分数上,而后者则表现在实际问题的解决过程中,与日常生活紧密相关。他希望通过这一概念来解决认知能力测验中产生的“高分低能”现象。实践智力概念的提出引起了众多学者的注意。耶鲁大学的Sternberg等人(1995)提出:实践智力的核心成分就是内隐知识(tacit knowledge),“它是一种行动导向(action-oriented)的知识,个体在无需他人直接帮助的情况下获得,并借以实现自己珍惜的目标”。现在体现实践智力思想的测量已经出现在商业管理领域,这种测验把多种与工作有关的描述呈现给应试者,要求他们对一系列的处理方案进行评价,按优劣顺序排列,使得其测量内容独立于传统的认知能力测验,成为传统测验的补充。研究证实这种测验与实际的工作绩效呈高相关性(Sternberg & Wager,1993)。
2.以“认知能力测验为主,其他测验为辅”的测评模式开始形成 由于认知能力测验的独特地位,理论界在不断完善认知能力测验的同时,对其他测评方式对认知能力测验的增量效度(incremental validity)也进行了相关研究。
Ree和Checkout(1995)对美军飞行员的选拔方式进行了研究。美军选拔飞行员依据的预测指标是认知能力、工作知识和以前的飞行成绩。研究结果通过路径分析(path analysis)发现,认知能力与工作绩效并没有直接的因果关系,而是通过工作知识产生间接影响。这一结果启示我们,对于那些认知能力测验得分相对较低的个体而言,如果具备某些与绩效相关的个性品质,亦可以提高自己的绩效水平。也就是说,个性测验可以辅助认知能力测验提高选拔的预测效度。Schmidt和Hunter(1998)建议,认知能力、工作经历和个性测验中的责任意识是与工作绩效密切相关的变量,工作经历和责任意识测量对认知能力测验的增量效度相当可观。其中,认知能力测验和正直测验(主要测量责任意识)相结合产生的预测效度为.65;而前文也提及认知能力测验与结构化面试(可以测量责任意识、宜人性和情绪稳定性)结合使用产生的预测效度可达.63,这些都是相当令人兴奋的测评组合。
(二)工作绩效效标的选择
效标问题(criterion problem),即如何更加科学地测量工作绩效,同样是影响测评效度评价的一个因素,也一直是人事心理学中的一个热点问题。这一问题的争论主要集中于两个领域——绩效评估的方式和绩效评估的内容。
1.评价方式开始逐渐超越上司评分(supervisor rating)的单一评价方式 传统的绩效评估指标大多以上司评分作为效标变量,然而Green(1991)发现,对于研究中涉及到的15个传统职位,上司评分与个体实际工作样本绩效(hand-on work sample performance)的相关系数仅为.09—.45(中数为.25)。这说明上级评分这种绩效评估方式可能受到诸多情景变量(如人际关系等)的影响,但上级对下级的绩效判断却成为人事决策的效标,其中显然存在诸多偏差。
近期出现了360°绩效测量方式,又称多评估者评估(multirater-assessment)和多角度反馈系统(multisource feedback),开始突破上司评分的绩效测量模式。其基本思路是为个体提供自己如何被组织各个层面的人所认识和评价的信息,评估源来自同级、上级、下级和自评,使反馈结果组成一个绩效剖面图。可见,传统的绩效测量方法使管理者成为绩效考评的主宰,考评结果取决于上级管理者或管理部门,易受到各种误差的影响,对测评工具的效度评价大打折扣;而360度绩效测量则力图从多个角度去反映员工的工作,使结果更加全面和可靠。
2.20世纪90年代以来,绩效评估的内容逐步由单维发展为多维 近年来,研究者开始致力于寻求预测指标与分绩效指标的相关性,而不是与整体绩效(overall performance)的相关性。Campbell(1990)在美军选拔和分类项目(简称项目A)中,把绩效分为职务特定作业绩效,职务非特定作业绩效,协作与口头交流,努力,遵纪律,为团队、同事提供便利,监督领导和管理。McCloy等人(1994)把绩效分为陈述性知识、程序性知识和动机、技能成份,用这三个因素来描述工作绩效的结构。其相关研究发现,认知能力与陈述性知识这一绩效指标明显相关,而动机成份则易被个性测验预测。在绩效分类中最有影响的是任务绩效(task performance)和周边绩效(contextual performance)概念(Borman & Motowidlo,1993;Motowidlo Scatter,1996),两者的区别在于侧重点不同,任务绩效侧重于与生产和服务直接相关的活动,以及维护技术核心的行为,注重定量的工作任务;而周边绩效则在于支持组织、社会和心理环境,强调个体的人际技能和以改善工作关系为目的的人际互动。他们的相关研究发现,个性预测指标与周边绩效的相关性较高,他们因此建议,如果周边绩效能够单独加以测量,那么测评的效度将会得到提高(Motowidlo& Scatter,1994)。
Drucker(1991)也提出了考虑一项特定的工作应归属哪一类绩效的必要性,他认为这样我们才能确切知道工作任务,才能决定在工作中需要分析什么、改进什么和改变什么。毫无疑问,我们如果能够科学地认识预测指标与各个分绩效指标之间的相关性,那么对于我们客观地评价测评工具、科学地实施人才选拔以及提高工作效率都将大有裨益。
3.在原有个体层次绩效评估的基础上,开始注重对群体绩效的评估 越来越多的企业选择工作团队(work team)管理模式作为自己的组织模式。如何通过人事测评以构成有效的工作团队,是现实对人事测评提出的客观要求。这一趋势带动了近年来对团队有效性(team effectiveness)的测量,但总体而言,这一方面的评价还相当少(Baker & Salas,1994)。
Ostroff(1993)提出,从个体和群体层次上考察预测指标与效标的关系所得的结果并不一致。而我们过去的人事测评主要局限于个体层次,但显然个体意义上的预测指标与效标的关系无法对工作团队提供直接的参考。Hackman(1987)较早地介入了团队绩效的评估,他认为对其评估必须掌握两点——现在的团队绩效和将来的团队绩效。前者指团队目前表现出来的客观生产率;后者指团队继续作为一个整体进行合作的可能性。Hackman认为一些预测变量与后者相关,而研究者大多注重与客观生产率相关的预测变量而忽略了后者。Neuman和Wright(1999)在三个维度上考察了团队绩效,即个体的工作绩效、工作完成情况(在一定时间内团队完成任务的情况)和工作准确性(一定时间内团队完成任务的质量)。不少研究结果发现,对基于合作与相互支持的工作团队(Hackman,1990),就预测指标而言,对团队组成有较强预测作用的个性测验比传统的工作经验和认知能力测验还要重要,其中宜人性和责任意识的作用尤为突出(Barrick,1998;Neuman & Wright,1999)。Hair(1996)发现同等程度的宜人性会表现出相同方式的冲突管理模式,从而有助于协调彼此的差异,提供合作(Jackson,Stone & Alvarez,1992)。
不断完善预测指标的选择,改善对绩效效标的测量,是人事测评领域发展的指导思想。其中,测评技术对团队构成的指导意义,以及团队绩效的合理考察问题将会成为这一领域理论发展的新焦点。
标签:工作绩效论文; 绩效指标论文; 结构效度论文; 内容效度论文; 绩效反馈论文; 绩效目标论文; 结构化面试论文; 区分效度论文; 测量理论论文;