跟踪研究方法在我国心理研究中的应用综述_大数据论文

追踪研究方法在国内心理研究中的应用述评，本文主要内容关键词为：述评论文,在国内论文,心理论文,方法论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

文章编号：10014918(2014)02-0216-224 中图分类号：B841 文献标识码：A

1 前言

追踪研究可分析个体心理与行为发展变化的一般趋势和个体间差异，探索变化规律和变量间的因果关系(刘红云，张雷，2003)，在发展、社会、教育和临床等心理研究领域有广泛应用。Singer和Willet(2003)对OVID数据库中1982-2002年间发表的心理学领域的追踪研究文章进行文献分析，发现追踪研究方法在心理研究的应用呈稳定增长趋势；进一步对1993与2003年发表于10个APA心理期刊文章的文献分析发现，追踪研究比重由1993年的33%增长到2003年的47%。但是，研究还发现追踪研究方法应用中存在测量次数少、缺失严重和数据处理不当等问题(Singer & Willet，2003；

，Phelps，& Lerner，2009)。那么，追踪研究方法在国内心理研究中的应用情况如何？本研究的目的是通过文献计量和内容分析描述追踪研究方法在国内心理研究的应用现状，分析研究设计特征和数据处理的特点，发现追踪研究方法应用中存在的问题，探索问题的原因，结合国内外相关理论研究成果，提出方法应用的建议。

2 研究方法

2.1 资料来源及筛选

以中国期刊网全文数据库为数据源，分别以“追踪研究”、“纵向研究”、“发展趋势”、“重复测量”、“纵贯研究”为关键词和题名搜索学术论文，获得期刊文献266篇、学位论文41篇，作为初始样本。根据以下标准筛选文献：(1)入选应用追踪研究的文献，文献综述和理论研究文献不计；(2)个案追踪研究不计；(3)只计入同一样本先后测量至少2次的文献；(4)已在心理学期刊公开发表的学位论文不计；(5)非心理学期刊发表的学术论文不计。根据上述标准删除不符合的文献，最后入选文献88篇(时间跨度为1982年-2013年1月1日)，基本情况见表l。

2.2 资料归类编码

2.2.1 工作程序

由心理统计与测量方向的博士、硕士研究生组成研究团队，分四步完成文献归类编码。第一步，讨论比较指标，确定编码表。第二步，导航研究，每位成员对88例研究中随机抽取的9例(占10%)进行独立编码，然后分析编码结果的一致性，修正编码表。第三步，分两组分别对所有文献进行编码。第四步，对两组编码结果进行交叉复核，编码一致性达90%以上，讨论修正不一致的编码。

2.2.2 归类编码

对88例研究从应用现状、设计特征和数据处理三方面进行编码。应用现状包括发表时间、研究对象和研究内容。依据林崇德(2009)把研究对象分为婴儿(0～3岁)、幼儿(3～6岁)、儿童(6～12岁)、青少年(12～18岁)、成年早期(18～35岁)、成年中期(35～60岁)和成年晚期(61岁以上)，把研究内容分为认知、社会性、个性、言语、学习心理、职业心理和心理卫生7大类。设计特征包括设计类型、抽样特征、测量次数、测量间隔、研究持续时间。设计类型依据刘红云和张雷(2005)划分为固定样本追踪设计(panel study)(也叫专门小组研究)、群组序列设计(cohort-sequential design)和干预研究(intervention study)。数据处理包括缺失数据处理和追踪数据分析。追踪数据分析方法参照张敏强(2010)关于统计方法的划分体系，同时参照刘红云和张雷(2005)关于追踪数据分析方法新进展的论著进行归类编码(见表6)。

3 结果与分析

3.1 应用现状分析

发表时间方面，追踪研究方法应用在1982-2004年增长缓慢(22例)，2005年开始相对稳定增长(66例)(见图1)。2005年来追踪研究方法应用的稳定增长与数据分析软件的发展、阶层线性模型(hierarchical linear model，HLM)和结构方程(structural equation model，SEM)等方法引入分析追踪数据有直接关系(见3.3.2部分)。

图1 发表时间分布图

研究对象方面，83例以未成年及成年早期群体为研究对象(见表2)，其中69例的研究对象为幼儿园孩童(14例)或在校学生(55例)。可见，研究者更倾向于关注个体心理与行为发展的显著变化阶段，即未成年和成年早期，为便于研究的组织和实施，国内追踪研究主要以幼儿、儿童、青少年及成年早期群体为研究对象。

研究内容方面(见表2)，婴儿期研究了认知、社会性和个性；幼儿期主要研究社会性(问题行为、同伴关系各4例)、个性和言语；儿童期主要研究社会性(问题行为5例)、认知(智能研究6例)和学习心理；青少年主要研究社会性(社会情感3例，问题行为2例)和心理卫生(抑郁状态3例，危机心理2例)；成年早期主要研究社会性(社会情感、社会适应各2例)、心理卫生和职业心理。社会性是幼儿、儿童、青少年和成年早期研究共同关注的论题，但侧重点不同。如张文新等(2003)对幼儿3～4岁攻击行为的研究；孙铃、陈会昌、彭晓明和陈欣银(2005)对幼儿4～7岁社交退缩行为的研究；赵冬梅、周宗奎、Hsueh和Cohen(2008)研究小学生攻击行为对互选友谊的影响；胡宁等(2009)探讨家庭功能对初中生问题行为的影响；李波、钱铭怡和马长燕(2005)研究大学生的羞耻感对社交焦虑的影响。

3.2 设计特征分析

3.2.1 设计类型

设计类型上，固定样本追踪设计对同一组被试持续测量，是最典型的追踪研究设计类型。但长时间的固定样本追踪研究面临被试缺失、重测效应及研究样本过时等问题，影响结果的有效性(Duncan & Duncan，2012)，实际应用也可能因时间和被试条件限制难以实施。干预研究与固定样本追踪设计相似，不同之处在于干预研究把样本分成控制组和实验组，同时关注发展趋势和组间发展水平及速度的差异(刘红云，张雷，2005)。群组序列设计同时对多个相邻群组进行短期追踪研究，把多个群组数据连结起来得到近似长时追踪数据(Duncan，Duncan，& Hops，1996)。当需进行长时追踪研究时，群组序列设计相比固定样本追踪设计更具灵活性(Duncan & Duncan，2012；Willett，Singer，& Martin，1998)。但群组序列设计通过多个群组的短期追踪获得长时追踪数据，其过程能否抓住发展中的关键事件或有效覆盖整个时间跨度的信息受到质疑(Duncan et al.，1996)。

88例研究中，固定样本追踪研究71例，如张文新等(2003)和孙铃等(2005)的研究。干预研究13例，如周斌、刘俊升和刘柏涛(2010)的书法练习对儿童智力影响的干预研究。群组序列研究4例，如张金荣(2011)的幼儿、儿童人格发展研究，其中儿童研究同时选择9个相邻年龄组通过4次测量(间隔6个月)获得跨度6年(6～12岁)的追踪数据。

3.2.2抽样特征分析

追踪研究要对被试进行多次测量，难以做到随机抽样，国内追踪研究多采用整群抽样(见表3)，整群抽样有利于追踪研究组织和样本保持。

样本量影响追踪研究统计功效，增加样本量可提高统计功效(Maxwell，Kelley，& Rausch，2008；Moerbeek，2008，2011；Raudenbush & Liu，2001)和参数估计精度(Kelley & Rausch，2011)。研究发现，当测量次数小于5、研究持续时间短于3年，样本量达500以上方可获得较好的统计功效(Hertzog，Lindenberger，Ghisletta，& Von Oertzen，2006；Muthén & Curran，1997)。对干预研究而言，实验与控制组样本量是否相等影响统计功效，实验组样本量等于或略大于控制组时，统计功效最好(Muthén & Curran，1997)。

国内追踪研究总样本量在10～2251之间(中数为176)，其中27.1%研究的样本量小于100(见表3)。如王芳和许燕(2007)对高校教师职业枯竭的日记式追踪研究的有效样本只有22。相当部分研究样本量小可能是研究中可获得的样本受限，或追踪过程被试缺失导致。

3.2.3 测量特征分析

测量特征包括测量次数、测量间隔和研究持续时间。增加测量次数和研究持续时间可提高统计功效(Moerbeek，2008；Raudenbush & Liu，2001；Tekle，Tan，& Berger，2011)。

追踪研究测量次数要求与理论模型有关，模型越复杂，需测量的次数越多，最小测量次数不小于p+1(p为模型中未知固定参数个数)(Tekle et al.，2011；Willett et al.，1998)。如简单线性增长模型有斜率和截距两个未知固定参数(p=2)，要获得至少3次测量的数据；二次曲线增长模型要收集至少4次测量的数据，更复杂的模型需更多的测量次数。可见，追踪研究的测量次数应不少于3(Willett et al.，1998；盖笑松，张向葵，2005)。国内追踪研究多测量2～3次(见表4)，其中干预研究由于面临实验污染和研究组织问题，相当部分(8/13)只测量2次，如周斌等(2010)的研究。

测量间隔方面，68例研究测量间隔相等，最小间隔1天，最大间隔156个月，间隔3个月内的21例，3～6个月的12例，6～12个月的21例，12～24个月的7例，24个月以上的7例。16例研究间隔不等。追踪研究主要依据理论假设确定间隔，在急速变化期实施密集测量(如婴儿期智力发展迅速，茅于燕和周志芳(1986)的婴儿智力研究的间隔1个月)，缓慢变化期可减少测量次数(为了解干预的长远影响，隋光远(2005)对中学生成就动机归因训练效果研究的间隔13年)(Jackson，2010)。

研究持续时间上，国内追踪研究持续时间最短14天，最长156个月，59.6%研究的持续时间不超过1年(见表4)。持续时间因研究内容、目标和测量次数而不同，密集追踪研究持续时间一般较短(王芳，许燕，2007)，早期干预对后期影响研究的持续时间较长(隋光远，2005)。对大部分非密集追踪研究而言，持续时间过短则难以观测心理和行为的确切变化过程(Raudenbush & Liu，2001)。

3.3 数据处理方法

3.3.1 数据缺失及处理

数据缺失是追踪研究面临的严峻问题，缺失比例过大会导致有偏的结果。一般认为，5%～10%的缺失可接受，当缺失达60%以上时，数据则失去利用价值(Barzi & Woodward，2004)。88例研究中，61例有不同程度的缺失(见表5)。

缺失数据处理方法的适用性建立在缺失机制假设基础上，处理方法的选择影响处理结果的精度和研究的效度。根据缺失数据与其它变量的关系把缺失机制分为完全随机缺失、随机缺失和非随机缺失。若缺失数据发生概率与已观察到的及未观察到的数据特征都无关，为完全随机缺失，用删除法(包括列删法和对删法)处理就可获得较好的结果，但完全随机缺失要求严格，常难以满足条件假设(Enders，2011a)。

若缺失数据发生概率与观察到的变量有关、与未观察到的数据特征无关，称随机缺失。随机缺失数据处理方法包括删除法、单值借补法及缺失处理和模型结合的方法。常用的单值借补法有均值插补和LOCF(last observation carried forward)法；缺失处理和模型结合的方法主要有多重借补(multiple imputation，MI)和极大似然估计(maximum likelihood，ML)(茅群霞，2005；沐守宽，周伟，2011)。删除法和单值借补法是较常用的方法，但这两种方法不能充分利用整个数据信息，低估方差和标准误。MI法用两个以上反映数据概率分布的值来填补缺失，综合分析多次填补数据可获得无偏的结果；ML法在样本数据基础上通过期望极大似然算法或全息极大似然估计求得最接近真值的参数估计值，可获得有效的结果。MI和ML法可保持整个数据信息的特征，有较广的适应范围，也适用于完全随机缺失数据(Enders，2011a；

et al.，2009)。研究发现，当缺失比例小于10%，删除法和LOCF法可较好地处理缺失；缺失在10%～20%时LOCF法最优；超过20%，MI效果较好，MI的适用范围是20%～40%；超过60%，任何方法不能得到较好的效果(茅群霞，2005)。

若缺失数据发生的概率与未观测到的数据特征有关，为非随机缺失(Enders，2011b)。非随机缺失不可忽略，任何非随机缺失数据的处理方法在建模时都应考虑缺失数据的信息，详细可参考文献(Enders，2011a；Enders，2011b)。

根据缺失机制的定义，可通过分析缺失数据与其他变量的关系来识别完全随机缺失和随机缺失机制。常通过比较缺失样本和无缺失样本在其他变量的差异是否显著来确定缺失机制，若差异不显著，认为缺失样本是从总体随机抽取的样本，与其他变量无关，为完全随机缺失；反之，说明缺失数据发生与其他观测变量有关，是随机缺失(

et al.，2009)。非随机缺失与缺失数据本身特征有关，目前无法通过统计检验识别(

et al.，2009)。

61例研究中，6例检验了缺失样本与无缺失样本在其他变量差异的显著性来确定缺失机制；缺失数据处理主要采用删除法(见表5)。

3.3.2 数据分析方法

追踪数据分析方法主要有重复测量方差分析、HLM、潜变量增长曲线模型(latent growth curve model，LGM)及潜变量混合增长模型(latent growth mixed model，LGMM)(刘红云，2007；刘红云，张雷，2005)。方差分析可处理测量间隔相等、测量次数较少的追踪数据，分析时间恒定变量(time-invariance variable)(如家庭背景等类别变量)对因变量的影响。当测量次数较多、间隔不等、研究中有数据缺失或要关注发展的个体差异时，方差分析难以实现(刘红云，张雷，2005)。HLM可处理测量间隔不等、嵌套于多个群体的追踪数据。HLM分析过程可考察时间恒定变量或时间变化变量(time-vary variable)对因变量的影响，同时分析发展趋势和个体变化差异，灵活处理数据缺失问题(Miyazaki & Raudenbush，2000；Muthén & Curran，1997)。但HLM对误差协方差矩阵要求严格，在实际应用中有难度：只能探讨变量间的直接关系(刘红云，张雷，2005)，难以探讨复杂的变化过程。LGM结合多变量方差分析和SEM的特点，用时间函数确定因子载荷，用潜变量描述发展趋势和个体变化差异，模型上更具灵活性(刘红云，张雷，2005；Muthén & Curran，1997)。但当测量间隔不等或要考察时间变化变量对因变量的影响时，LGM的适应性差(Miyazaki & Raudenbush，2000)。LGMM结合潜在类别分析和LGM的特点，在建模中纳入潜在类别变量分别描述不同类别的变化趋势，解决研究总体内发展的不同质问题(刘红云，2007)。目前，关于方差分析、HLM、LGM及LGMM的研究主要关注这些方法在连续数据的应用，因变量为离散数据的研究相对匮乏。

88例研究中，追踪数据分析方法应用的总频次103(见表6)，其中73例运用一种统计方法，15例同时运用2种方法。同时运用HLM与LGM、HLM与多层结构方程的研究各1例；同时运用SEM与t检验的2例；同时运用方差分析与t检验、方差分析与SEM的各3例；同时运用方差分析与潜在类别分析、方差分析与回归分析、方差分析与交叉滞后相关分析的各1例；同时运用回归分析与SEM、回归分析与t检验的各1例。

结合发表时间分析发现，2005年之前国内追踪研究主要运用t检验和方差分析分析追踪数据，未见SEM、HLM、LGM等方法的应用。2005年后，HLM有最广泛的应用，LGM、LGMM和潜在类别分析有个别应用。如赵冬梅等(2008)运用HLM分析多元追踪数据；姚琦、马华维和李强(2007)运用定义和不定义LGM分析追踪数据；张金荣(2011)同时运用HLM和LGM分析追踪数据。此外，SEM主要用于追踪研究的路径分析(8/11)，如张晓、陈会昌、张桂芳、周博芳和吴巍(2008)运用SEM进行路径分析。

4 讨论与建议

文章从应用现状、设计特征和数据处理三方面对追踪研究方法在国内心理研究的应用进行述评。结果表明，追踪研究方法在心理学研究广泛应用同时也存在一些不足。

4.1 关于追踪研究方法应用现状

就应用现状而言，国内追踪研究方法应用在1982-2004年增长缓慢，而国外应用在1982-2002年稳定增长(Singer & Willet，2003)。相比国外，追踪研究方法在国内应用发展在时间上相对滞后。研究内容以认知、社会性、个性和心理卫生为主，研究对象以幼儿、儿童、青少年和成年早期被试为主(见表2)。进一步的追踪研究可加强成年中、晚期群体的心理与行为变化的研究。成年晚期认知的追踪研究对于理解生命后期的认知发生机制和预防认知老化具有重要的理论和现实意义。

4.2 关于设计特征

设计类型上，国内大部分追踪研究运用固定样本追踪设计。群组序列设计少，随着HLM和LGM引入分析追踪数据，初步解决群组序列研究数据分析的问题，应用逐渐增多。若要研究个体长时变化过程，可优先选择固定样本追踪设计。若研究持续时间非常长(如10年以上)，样本过时和缺失等问题影响结果效度，可采用群组序列设计通过较短时间获得较长时跨度的追踪数据；群组序列设计也适用于大样本短期追踪研究。进一步研究可结合两种设计优点，运用固定样本追踪设计实施小样本长时追踪研究，同时运用群组序列设计实施大样本短期追踪研究。

抽样和测量特征方面，国内相当部分追踪研究存在样本量小、测量次数少及持续时间短的问题。样本量上，相当部分追踪研究总样本量未达到理论研究建议要求。追踪研究样本量不足使其代表性受到质疑，进而影响统计功效。测量次数上，43.5%的研究测量2次，31.8%测量3次。与此相似，Singer和Willet(2003)的文献分析发现，1993年，36%的研究测量2次，26%测量3次，2003年，26%的研究测量2次，29%测量3次；要探讨心理与行为变化过程，2次测量不足以探讨变化的复杂形态和特点(Gottman & Rushe，1993)，至少应测量3次，并随模型复杂度增加而增加测量次数(Tekle et al.，2011)。研究持续时间上，过半研究持续时间不超过1年。Raudenbush和Liu(2001)研究发现，当持续时间短于3年，显著增加样本量和测量次数，也较难达到较好的统计功效。

综合而言，研究的样本量、测量次数和持续时间是影响统计功效和参数估计精度的主要变量，增加样本量、测量次数和持续时间都可提高统计功效，其中样本量的影响效果最明显，确保样本量的前提下，增加持续时间比增加测量次数的影响大(Moerbeek，2008；Raudenbush & Liu，2001)。因此，追踪研究的样本量、测量次数和持续时间应依据理论模型和研究条件确定，当样本量受限，可适当增加测量次数和持续时间降低对样本量的要求，但样本量和测量次数应满足理论模型和统计模型的最低要求。

4.3 关于数据处理方法

数据缺失及处理方面，国内相当部分研究缺失严重，主要采用删除法处理缺失数据(见表5)。

等(2009)对2000-2006年间发表于儿童发展(Child development)、发展心理学(Developmental psychology)和青春期研究(Journal of research on adolescence)的100例追踪研究的文献分析发现，81例有不同程度的缺失，其中47例采用删除法、7例采用ML法、2例采用MI法、1例采用单值借补法处理缺失数据。可见，删除法是国内、外追踪研究最常用的缺失处理方法，国内追踪研究中尚未见ML和MI法的应用。追踪研究缺失处理问题存在的原因，一是对缺失机制界定存在困难，许多研究未对缺失机制明确界定；二是ML和MI等方法处理缺失数据时，其原理和实施过程复杂不易掌握，研究者倾向选择易操作的删除法。

对数据缺失问题可从多方面进行准备和干预。首先从研究设计出发，抽取容易保持的样本进行追踪；预估缺失比例，根据理论模型确定设计特征。其次，研究过程中做好通讯备案和跟踪联系进行被试保持。第三，分析数据缺失的原因，判断缺失机制，根据缺失机制、缺失比例选择处理方法，减小误差。最后，规范报告数据缺失。Burton和Altman(2004)提出缺失数据报告的三个步骤：一是分变量报告缺失数据的量；二是说明数据缺失的可能原因；三是报告缺失处理方法及结果。

追踪数据分析方法上，2005年前追踪研究主要运用t检验和方差分析，2005年之后主要运用HLM、方差分析、t检验、SEM和回归分析(见表6)。Singer和Willet(2003)的研究发现，1993年，研究样本的40%运用方差分析，38%运用回归分析；2003年，方差分析占29%，回归分析占32%。Singer和Willet(2003)还发现部分研究运用增长模型(1993年占7%，2003年占15%)，国内2005年前未见增长模型的应用。

进一步分析发现，国内追踪数据分析方法存在两大不足。首先，相当部分研究分析方法相对陈旧。具体表现为t检验和回归分析(包含路径分析)在追踪数据分析中有很高的应用频数(见表6)。t检验只对两次测量数据进行差异性分析，不能探索发展趋势及变量间因果关系；回归分析可建构线性趋势，但不能精确描述变化过程及个体差异，对变化只进行线性分析会导致错误的结果(Gottman & Rushe，1993)。t检验与回归分析在追踪研究中广泛应用的首要原因是，HLM、SEM等方法于2000年后才引入国内，2005年前未见用于追踪研究；其次是国内相当部分追踪研究样本量小、测量次数少，数据特征更易满足传统方法的应用条件。

其次，国内追踪数据分析方法假设心理变化是连续的、遵循特定形态的过程(如线性、二次曲线等)，实际研究发现变化过程不一定呈直线或某种曲线，自变量对因变量的影响可能更为复杂。针对发展连续性假设问题，研究者在LGM的基础上提出多阶段增长曲线模型(piecewise growth curve model)，描述心理与行为在不同时段的不同变化趋势(Yang，Pentz，& Hser，2004；刘源，张骞，刘红云，2013)。Tan，Shiyko，Li，Li和Dierker(2012)则针对单一发展形态假设问题，强调自变量对因变量的动态影响过程，提出时间变化效应模型(time-vary effect model)。多阶段增长曲线模型和时间变化效应模型可更贴切表达复杂心理变化过程及变量之间的关系，加强两种模型的研究和应用，有利于探索心理变化的复杂过程和作用机制。

5 结论

追踪研究方法在国内心理研究应用中存在以下问题：

(1)缺乏对成年中、晚期心理发展的研究；

(2)相当部分研究存在测量次数少、样本量小、持续时间短等问题；

(3)被试缺失严重，相当部分研究未对缺失数据进行合理处理；

(4)部分研究追踪数据分析方法相对陈旧。

针对问题，提出以下建议：

(1)加强对成年中、晚期心理发展的追踪研究；

(2)根据理论模型、研究条件和研究有效性要求，选择设计类型，确定研究的样本量、测量次数和持续时长；

(3)控制数据缺失，规范描述数据缺失的原因、机制，选择适用的处理方法；

(4)根据理论模型和数据特征选择分析方法，加强LGMM、多阶段增长曲线模型和时间变化效应模型的研究及在追踪研究的应用。

标签：大数据论文; 方差分析论文; 样本方差论文; 总体方差论文; 张雷论文; 统计学论文;

跟踪研究方法在我国心理研究中的应用综述_大数据论文

猜你喜欢