儿童语言样本的分析技术,本文主要内容关键词为:样本论文,语言论文,儿童论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B842;B844
1 前言
在社会交往中,个体需要凭借自己的语言能力去理解他人的语言并且以他人能够理解的语言方式去表达自己的需要、思想和情感(Powell,2005),因而语言能力评定应包括接受性语言能力和表达性语言能力两个方面,当前儿童表达性语言能力评定的方式主要有3种:父母报告、标准化测验和语言样本分析(language sample analysis/LSA)。
父母报告(Parents Report)是指通过儿童看护人(通常为父母)的报告来提供儿童语言能力和沟通能力的信息,特别是不同环境下有代表性的信息。采用父母报告形式的测验主要有MacArthur-Bates Communicative Development Inventories(CDI)和Minnesota Child Development Inventory Expressive and Receptive Language Scale(MCDI),其中CDI测验已经有了中文修订版(梁卫兰等,2001)。基于父母报告法的表达性语言能力评价主要局限在于:第一,父母报告法依赖于父母对孩子较长时间跨度言语表达内容的回忆,具有一定主观性,并容易产生回忆错误;第二,父母报告法仅适用于0~3岁年龄较小的儿童。因为3岁以后,儿童的语言能力发生了质的飞跃,父母已经无法准确全面的把握自己的孩子到底掌握了哪些语言技能。
标准化的语言测验也被用于对儿童表达性语言能力进行评定,标准化测验(Standardized Test)一般是常模参照测验,为儿童和其同龄人进行比较提供了一个相对快捷的方法。基于标准化测验的量表有采用图片命名形式的代表性测验EVT-2(Expressive Vocabulary Test,Second Edition)和EOWPVT(Expressive One-Word Picture Vocabulary Test-Revised)、采用“对词下定义”(define-the-word-I-say)方法的典型测验CREVT-2(Comprehensive Receptive and Expressive Vocabulary Test-Second Edition)中的表达性词汇分测验。标准化测验的实施方便快捷,但也存在一定的局限:第一,在陌生的测验情境中,情感和社会性因素(例如紧张或焦虑)会影响儿童语言表达的数量和质量;第二,在测量表达性语言能力时,标准化测验的形式比较有限(图片命名、句子复述、下定义或完成句子等),难以反映儿童表达性语言能力的全貌。
语言样本分析技术是对儿童表达性语言能力更生态化、更全面、更精细的评定技术。自然语言样本的分析是对儿童实时的语言行为的测量,这种测量揭示了儿童个体的语言知识,内部加工因素和外部加工条件的动态交互作用对口语行为的影响(Condouris,Meyer,& TagerFlusberg,2003)。目前,国外已经出现了大量语言样本分析技术的相关研究。无论是语言样本的诱发技术、语言样本分析的评定指标,还是语言样本分析技术的临床应用都已经有了非常全面细致的研究。并且已经建立起了全球最大的儿童语言语料库CHILDES(儿童语言数据交流系统),这一系统不仅为研究者提供了多种儿童语言的语料数据,而且设计了一套统一的录写系统,此外该系统在建立了标准的录写格式之后可以通过其开发的计算机的数据分析程序对语言样本的各种指标进行快速、自动的分析计算。国内对于儿童表达性语言能力的研究还很少,尤其是对语言样本分析技术的应用还几近空白。鉴于表达性语言能力在儿童心理发展和学校生活中的重要作用,以及我国在儿童表达性语言能力评定领域的空缺,有必要对当前国外应用比较广泛的儿童表达性语言评定技术——语言样本分析的发展进行总结介绍,并基于文化和语言的差异,对其在未来汉语研究中的应用提出一些建议。
2 语言样本分析技术简介
语言样本分析是通过某种方式(诱导谈话、自由游戏、故事产生等)诱发语言样本,用录音设备记录并转换成文字,并采用选定的测量指标对语言样本进行分析。从获得的样本可以分析出儿童在词汇掌握、句法技能和语用技能等方面的发展水平。自然语言样本的搜集需要较大的时间成本,但是这些语言样本为儿童在日常非正式情境中的语言使用提供了很好的评价指标,尤其对评定各种语用和对话技能非常有用,它能提供标准化测验所不能提供的有价值的信息。语言样本分析技术(LSA)最主要的优点是具有较高的生态性,它是对儿童自然语言行为的测量。所以它在语言评定中被应用的越来越多,尤其在学前儿童语言评定中应用的范围在不断扩大,最新的调查显示,93%的言语病理学家在应用LSA(Loeb,Kinder,& Bookbinder,2000)。
3 语言样本诱发方式
3.1 常用的诱发方式
诱导产生(Elicited Production):实验者引导儿童说出某种类型的句子(如具有某种语法结构的句子),但实验者不能给儿童示范,通常儿童与一个道具交谈。如:
主试:The rat looks hungry.I bet he wants to eat something.Ask ratty what he wants.(ratty为道具小老鼠)
儿童:What do you wanna eat?
Rat:Some cheese would be good.(主试扮演rat来回答)
自由游戏(Freeplay):调查者在儿童自由游戏、吃饭或进行其他活动时记录(音频的、视频的)其产生的言语。
对话(Conversation):对话是由与当前情境无关的关于儿童某些经历的对话组成的,诱发对话的方法包括;①研究者问儿童各种话题,如家庭、学校活动和电视节目;②研究者给儿童口头指令,如“告诉我你在外面玩的一些事情”:③向研究者解释如何玩一项游戏;④儿童描述一系列图片中一幅,然后研究者猜他描述的是哪一幅。
故事产生(Story Generation)或叙事(Narration):故事产生是要求讲一个原创的故事,重述电影或民间故事,或者报告人或动物的经历。有两种主要的故事产生方法:①对特定话题讲一个故事,②接受一个刺激后讲一个故事,刺激可以是系列图片、要求讲一个熟悉的故事或研究者讲的一个故事。
3.2 各种诱发方式的优缺点比较
诱导产生方式事先设定好句子的句长和句法结构,考察的是儿童是否能够产生一定句长和句法结构的句子。但是设计特定的句法结构和句长的目标句子材料比较困难,而且需要儿童与主试大量的互动,儿童需要按照一定的标准产生句子,可能会增加儿童的情景压力,导致儿童不能够完全表现出其语言能力。相对来说由于自由游戏、对话和故事产生方式不需要设计结构化的句子,更多的是基于儿童的自然表达,是比较容易采用的语言诱发技术。但是,自由游戏、对话和故事产生所诱发出的语言样本的大小、所含句子的长度及句法复杂性都是变化的,一些研究开始对这些诱发方式进行比较。
Wren(1985)对于3种方式诱发出的语言样本进行分析后发现,就语言样本的复杂性而言,对话大于故事产生、故事产生大于自由游戏。但是,由于Wren研究中采用的是存在着语法问题的特殊儿童样本,这些儿童在对话条件下能有更多模仿及受诱导的机会,所以在对话条件下表现出更大程度的语言样本复杂性。而Southwood和Russell对5岁正常幼儿的研究表明,3种诱发方式都为临床提供了足够多的话语,自由游戏比故事产生诱发出的话语数更多,对话诱发出的数量介于二者之间,但是不同儿童在自由游戏和故事产生中产生的句子数量具有较大的变异,一些儿童产生了足够多的句子,而有些儿童则产生了较少的句子,但是从儿童整体看来,自由游戏诱发出的话语数量是最多的:故事产生要比谈话和自由游戏诱发出的平均句长更长;故事产生和对话比自由游戏诱发出的语法结构更复杂(Southwood & Russell,2004)。总的来看,在言语的诱发量上故事产生要低于自由游戏和对话;在言语诱发的复杂性上自由游戏不如故事产生和对话。由于各个研究所使用的研究材料(对话和故事的主题)、被试状态、主试等因素的不同,所以不同的实验得出的结论会存在很大的差异。但不管其得出的结果如何,不同的诱发方式本身都存在着利弊。自由游戏方式具有最高的生态性,但比较费时,收集过程也不易控制;对话的收集过程容易控制,但容易受到主试特征的影响;故事产生是一种比较好的语言样本诱发方式,从实验材料的准备到实验的操作都比较方便易行,容易控制和操作,对于还处在直觉形象思维阶段的幼儿来说,有实物或图片支持的故事产生方法诱发出的语言样本质量会更高(句子更长更复杂),但是由于受幼儿记忆能力的限制,不能提供过多的图片,过多的图片可能破坏了儿童对图片的记忆效果从而影响对图片信息的表达,那么提供较少的图片带来的问题就是可能诱发出来的句子数量过少,达不到语言样本分析所需要的句子数量标准。如果能将几种方式结合起来,既在儿童的自由活动中取样,同时在活动中给以一定的话题,这样在一定程度上可以弥补不同诱发方式的缺点,结合它们的优点,获得更加理想的语言样本。
4 语言样本分析的评定指标
通过上述方法诱导出的儿童语言样本多是叙事的语篇,可以采用叙事分析(narrative analysis)的方法对语言样本进行分析。叙事分析是一个有效的、高敏感性的语言分析工具(Thompson,Craig,& Washington,2004)。叙事分析作为语言样本分析的一种方法,已经成为监测或鉴别个体语言缺陷的语言评定所必需的一部分(Munoz,Gillam,Pena,& Gulley-Faehnle,2003)。目前最好的评价办法强调在两个水平上,即宏观结构(macrostmcture)和微观结构(microstmcture),研究个体叙事行为。
4.1 宏观结构分析
宏观结构分析(high-point analysis)是从更高级组织上分析儿童的叙事能力,它通常注重儿童的故事组成和情节结构复杂性(Justice,et al.,2006)。Labov(1972)发展了一种分析方法——表达详尽性(expressive elaboration)分析,他认为一个完整形式的叙事有6个部分:开头配置(opening appendage),情况介绍(orientation),复杂的行动(complicating action),评价(evaluation),问题解决(resolution),结尾配置(closing appendage)。在这6项中,复杂的行动和问题解决被认为是叙事的骨架,随着时间的发展事件达到高潮,高潮之后就是情境的问题解决。
①配置:它告诉听者故事开始了或结束了,包括5个子类。
Ⅰ.介绍(introducer):故事的开端,示意听者故事即将开始(如:一天早晨,有一次);
Ⅱ.摘要(abstract):叙事之前对故事的概括(如:这是关于三个好朋友互相帮助的故事)或故事标题(如:糟糕的一天);
Ⅲ.主题(theme):叙事内对故事的概括(如:这就是这一天很糟糕的原因);
Ⅳ.结尾(coda):故事对叙述者或主人公产生的作用或启示(如:他们从今天的事学习到不能睡懒觉,否则就会迟到);
Ⅴ.结束语(ender):一个叙事结束的正式的标志(如:结束了/没有了)。
②情况介绍(orientation):为叙事设置情境,评价的是简单的人物、地点和时间之外的信息,包括3个子类。
Ⅰ.名字:给人物起名(如:小丽、明明、小猪笨笨、小猴淘淘等);
Ⅱ.人物关系:根据关系或职业定义角色的词(如:妈妈、兄弟、老师、校长、医生等);
Ⅲ.个性特点:人物的个性特点(如:行动迟缓、笨的)。
③评价(evaluation):描述的是叙述者传达自己观点的方法,包括5个子类。
Ⅰ.有意义的修饰语:主要是形容词和副词,但不包括诸如“一些”、“其他”、“另一个”“大”等无评价意义的修饰语。有意义的修饰语包括“糟糕的”、“幸运的”等。
Ⅱ.修辞性表达:多修饰词组合(三个或更多的形容词),文学或习惯用法,例如“舍近求远”、“白日做梦”。
Ⅲ.重复:强调一个名词、形容词或动词(如:一个男孩在公共汽车后面跑啊跑啊;他非常非常的难过)。
Ⅳ.内部状态:反映意图和思想(如:决定、认为),动机和反应(如:沮丧、伤心、生气),身体状态(如:疲惫、筋疲力尽)的词。
Ⅴ.对话:人物对话,只有直接对话才编码为对话。
4.2 微观结构分析
微观结构分析考虑的是叙事的内部语言结构,如连接、名词词组和从句等。能够分析的指标很多,包括词汇层面、句子层面、语法层面等。
4.2.1 平均句长(Mean Length of Utterance/MLU)
Brown(1973)提出了一个量化语言发展能力的方法——平均句长(MLU),Brown认为MLU是评定语法发展的一个简单优秀的指标,因为新的语法知识的产生伴随着MLU的增长(Brown,1973)。Brown根据MLU的值划分了语法发展的5个阶段。自1973年以来,MLU作为常用的语言样本分析指标广泛的应用于临床和研究中,2000年的调查显示语言样本分析中MLU的应用率为91%(Loeb,et al.,2000)。
MLU的应用有一定的年龄适用范围,近期研究逐渐趋向于MLU的适用年龄上限为3岁,若超过3岁MLU的测量结果将出现天花板效应。关于应用MLU指标时语言样本的最佳大小问题,Brown(1973)的原始样本大小为100个句子;Loeb(2000)报告说43%的语言病理学家采用的句子数少于50个。但是语言样本的大小直接影响着分析结果的信度,样本越小信度越低,所以样本大小应确定在100个左右,最低不能少于50个。MLU的计算结果受句子的分割方法影响,存在两种句子分割方式,P-unit(根据声调变化、停顿作为划分依据,划分的句子表达的是一个完整的观点)和C-unit(不考虑句子的韵律变化,根据句子的语法结构进行分割)(Loban,1976),此外语言样本收集环境(在诊所或是在家)、参与者(是父母或是研究人员)、活动类型、实验材料等也会影响MLU的分析结果(Wagner,Nettelbladt,Sahlen,& Nilholm,2000)。
Johnston对MLU进行了改进,提出了MLU2。他在计算MLU之前将单个词的句子、模仿的句子、重复反应的句子剔除,通过排除情景敏感性的句子提供了更具代表性的儿童语言能力样本,减少对儿童语言表现的低估或高估。这种方法可以增加3%~49%的MLU值(Jones,2007)。
4.2.2 词汇复杂性(Lexical Complexity)
①不同词的数量(number of different word,NDW)
对词汇复杂性最直接的测量方法就是计算样本中不同词的数量(NDW),它是对所有不同词根的频数统计(De Thome & Channell,2007)(如jump和jumped记作相同的词,child和children就是不同的词)。NDW会受到样本大小的影响,也会和平均句长(MLU)协变。只有当两个儿童的语言样本含有相同数量的词时,NDW的大小才代表了这个儿童掌握的词汇的复杂程度。当样本是在一定时间限制条件下收集的时候,TNW的大小就会和是否健谈有关,相应地,NDW可能把健谈与否和词汇技能相混淆。
②词汇变化比例(Type-Token Ratio,TTR)
TTR试图弥补NDW的一些内在缺陷,它用NDW(不同词的数量)除以TNW(词语总数),获得一个比例。在一个词汇总数为100的样本中,TTR=0.01表示1个词被重复了100遍,TTR=1表示样本中的100个词都是不同的。一个普通语言样本的TTR在0.01~1.00之间,在一定范围内可以有内容词(content word)和功能词(function word)的必要的重复(Silvermana & Ratnerb,2002)。一般采用0.50作为基线,0.50左右的TTR值可以反映适当的变化,显著低于0.50认为是缺乏变化性。理论上,NDW被TNW除以后减小了样本大小的影响,但却产生了一个新的困难。一些功能词在样本中是被频繁的重复使用的。因此,语言样本越大,测出的TTR的值就越小。基于样本大小,以往研究提供了一些调节这一变化的方法,如将功能词和内容词分开测量、使用标准数量的词语总数。
但这些方法并不能让人满意。分开测量功能词和内容词会产生两个问题:对一个样本来说,TTR会有两个不同的值;而且对于什么是功能词和内容词还存在争论。使用一个标准化的词语总数是克服样本大小问题的最好的办法,但研究者很难在样本大小上达成一致,因此TTR值在不同研究中的意义也会不同。为了解决这些问题,Richards,Malvern和McKee提出一个新的测量词汇多样性的方法,叫做D参数技术(使用VOCD专用软件计算D)(McKee,Malvern,& Richards,2000)。
③D参数技术
D参数技术是基于TTR在逐渐增大的语言样本中的变化曲线来计算的。它使用一个数学模型来确定一个实测曲线和理论曲线的最佳拟合点,并由此获得一个参数D,D分数就成为该语言样本的词汇变异性的一个指标。D值越大,表明词汇变化性越大(Owen & Leonard,2002)。
4.2.3 产生性语法指标(The Index of Productive Syntax/IPSyn)
IPSyn(Scarborough,1990)是儿童语言发展的一种评定方法,它为语法的复杂程度提供了一个分数。3岁以下的儿童应用MLU与IPSyn能达到同样好的效果,3岁以上时MLU出现天花板效应,而IPSyn可以继续报告儿童语法结构的发展,所以在临床领域和实验研究中对儿童语法进行研究时,IPSyn受到了普遍的欢迎。
IPSyn包括56种具体的语言结构(如主语、修饰语、助动词、否定词、前置宾语、动词后缀、动词不定式等等),划分为4类:名词短语11个、动词短语16个、疑问和否定10个、句子结构19个,计算儿童100个句子中每一个类目的分数(方法为:如果某一语言结构一次也没有出现,记0分;如果只出现一次,记1分;如果出现两次以上,记2分),最后把四个类目的分数加在一起为IPSyn总分(处于0~112分之间)。
4.2.4 发展的句子评分(Developmental Sentence Scoring)
DSS(Lee & Canter,1971)作为一个标准化的方法可以对儿童自然言语中语法的应用进行量化的评估,虽然DSS已有20多年的历史,但一直都被认为是可以获得儿童语法发展信息的有效的可信的工具。DSS程序包括两个部分,Developmental Sentence Types (DST)和Developmental Sentence Scoring(DSS)。DST用于对样本的句子进行分类,选出那些不完整的句子,如:不完全的主谓结构、单个词或是两个词的联合、以及多个词形成的不完整结构。DSS用于分析包括主语和动词的完整句子样本。DSS根据发展的顺序划分了8种语法结构,包括名词修饰语或不定代词、人称代词、主动词、次动词、否定、连词、疑问句前置、疑问句。复杂的语法项目比简单的语法项目赋分更高,语言样本中所有句子在这8类上的总分除以样本句子总数即为DSS的分数,DSS分数越高代表着更复杂的言语形式。研究发现DSS的分数随着年龄的增长而增长(Redd,2006)。DSS不仅适用于正常发展的2岁、0~6岁、11岁儿童,而且可以用于评估其他特殊群体的语法发展,如残疾儿童、不同语言背景儿童,较大年龄儿童(9岁的儿童)等(Seal,2001; Hasting,2008)。
虽然应用上述指标进行语言样本分析可以获得儿童语言发展的很多信息,但是语言样本分析的临床应用也存在着一定的困难和问题。第一,需要花费大量的时间,包括将儿童语言的录音或录像转录为文字需要大量的时间以及对各个指标进行人工计算更是耗费时间;第二,需要研究者具备一定的专业技能或是接受专门的训练,以保证文字录写和指标分析是语言样本的真实客观反映;第三,存在多个评分者之间一致性信度的问题;第四,对儿童的语言录音和录像转录为文字的过程中,可能会丢失儿童的谈话过程中的一些非言语信息,比如语调、表情、话语的停顿、连贯等,这些信息可能对考察儿童的具体环境下的语言表达能力是有价值的,但在人工转录中被忽视掉了。
为了解决这些问题,当前国外已经开发出了很多的自动语言样本分析软件,并且建立了基于不同语言、文化、种族群体的语言样本数据库。CHILDES(儿童语言数据交流系统)(MacWhinney,1996; Evans & Miller,1999)是世界上最大的儿童语言语料库,是由MacWhinney和Snow在1984年开始筹建的,CHILDES主要包括3个整合的成分:第一部分是儿童语言数据库(The database),该数据库包括英语、广东话、汉语普通话等20多种语言在内的60多个语言研究项目所获得的语料。数据库中不仅包括正常儿童的语言数据,而且还有来自于语言障碍者、第二语言学习者、早期双语者以及成人失语症者的语言数据。研究者可以直接利用CHILDES系统提供的语料进行自己的研究,而不必再耗费时间收集语言样本。而且研究者也可以把自己研究搜集的新的语言样本收入到数据库中,从而丰富数据库的语言数据。第二部分是CHAT录写系统,该系统通过设置一套标准的录写符号和语言文件的标准化编码格式,记录被试的基本信息和会话内容,标记谈话的各种特征,如话语文本类型、发音信息、句法信息、言语重复、中断、错误等。CHILDES语料库中的全部语言样本为CHAT格式。第三部分是计算机语言数据分析的具体程序CLAN(Child Language Analysis)。CLAN支持以下4个大的方面的语言分析:语音分析、词汇分析、句法分析、篇章分析。该程序可以分析一些语言样本的微观指标,如:平均句长MLU、发展的句子评分指标DSS、单词的使用频率FREQ、词汇变化比率TTR等。CHILDES的出现不仅解决了语言样本分析的一些现实困境,而且促进了语言研究的信息交流,以往研究者都是独立的收集和使用语料信息,而通过CHILDES的语言数据库可以实现资源的共享,并且可以进行不同研究之间数据的比较。目前已有1300多个发表的研究使用了该系统,而且涉及的领域十分广泛,包括语言障碍、失语症、第二语言学习、叙事结构、语言理论、成人社会语言、读写发展等。
除CHILDES(儿童语言数据交流系统)之外,国外还有一些其他专门的语言样本分析软件如,SALT、CP、SSD等,基于计算机自动的对MLU、DSS、IPSYN等指标进行计算。这些自动分析软件具有相当好的精确性和时间效率(Long,2001; Long & Channell,2001)。其中,CP(computerized profiling)是比较常用的自动分析软件,它可以计算MLU、DSS、IPYSN等指标(Long,Fey,& Channell,2006)。目前对于不同群体的语言样本自动分析的精确性进行了一系列的研究(Long & Channell,2001; Channell,2003; Redd,2006; Hasting,2008),已有研究发现对英语样本和西班牙语样本的自动分析精确分数达到96.4%~96.8%,这表明自动分析软件对于儿童语言发展的临床分析是一个有价值的工具(Redd,2006)。
5 汉语儿童语言样本分析领域的探索
国内对汉语儿童语言样本分析的研究大体上可以分为三个方面:
第一方面是从语言学视角对儿童词汇、语法习得状况的研究。研究内容包括对儿童语料信息中的词汇的发展(如词汇量的发展、词汇语义功能的发展)、句法结构的发展(如双宾结构、主谓结构)、句式的发展(如把字句、给字句、被字句等)等进行分析,考察儿童在表达性语言中这些结构和功能在不同的年龄阶段的获得情况,以及随年龄增长的发展趋势(周国光,1997;周国光,王葆华,2001)。李宇明(2004)详细的总结了国内关于儿童语言发展的研究情况,包括词汇领域的词汇量的发展、使用的各类词的词量和词频情况、以及具体的各种类型词汇的发展(如名词、动词、形容词、量词、代词等);语法层面上儿童的单句结构和复句结构在各年龄阶段的形式和总的发展趋势。这一研究视角更倾向于是关注各种语法形式和结构在不同时期的获得与否和发展进度,而非心理测量学视角所关注的特定年龄阶段儿童在表达性言语能力方面的表现水平。
第二方面是从心理测量学视角开展的关于汉语儿童平均句长的发展情况研究(武进之,1981;梁卫兰等,2004;刘春玲,马红英,潘春红,2001),这些研究对汉语儿童口语句子的切分方法和计分方式进行了有益的探索。但是,仅仅依靠MLU量的变化并不能完全刻画出儿童语言发展的复杂程度(尤其是年龄大的儿童),未来研究需要进一步扩展开发出涉及不同语言层面评估指标。
第三方面是近年来从语用学视角开展的关于儿童语用习得的研究。在周兢主持的汉语儿童语用发展研究项目中,欧阳新梅(2003)和朱从梅(2003)通过诱发方式获得语料,并且依据国际通用的CHAT录写格式转录儿童语言文件,使用CLAN软件计算MLU,并借助于言语行为的编码系统(INCA-A)考察了儿童语用的发展。这些研究对于汉语儿童语料转录格式和分析软件应用等问题进行了有益探索。
6 语言样本分析在国内应用的展望
目前,国外已经对语言样本分析技术做了大量的研究,制定了一系列的评估指标而且已经开发出了相应的计算机软件进行计算,但国内在此方面的研究还甚少。鉴于表达性语言能力对学龄前儿童的特殊意义,有必要在国外现有研究的基础上,结合汉语的特点,开发出适于中国儿童的语言样本分析指标,从而获得更真实生态化的儿童表达性语言能力发展的信息。
语言样本分析在本土化的过程中会受到很多限制。因为在参考借鉴西方语言样本分析的测量指标的时候,除了文化差异,文字体系的不同是语言样本分析过程中存在的最大的困难。参考现有的研究,汉语儿童语言样本分析也可以从宏观和微观两个方面进行。宏观结构分析是从较高的组织结构上对语言样本的整体把握,不涉及具体的语言结构,可借鉴的程度比较大。但是无论是对故事组成和情节结构复杂性的分析,还是对其他叙事元素的分析,主观性都比较大,操作起来比较困难。评分的时候需要制定比较严格的评定标准,才能保证获得较高的评分者一致性信度。在借鉴国外叙事分析的宏观结构指标同时,可以从自身的语言文化出发,发展出适合汉语儿童的叙事表达的宏观结构指标。
微观结构分析是对具体语言结构的分析,此时就会涉及到语言差异问题,所以在选择的时候需要做一些改进。MLU、NDW、TTR的计算比较简单,跨语言的应用性较强,而且以往国内对于儿童的MLU的情况也进行了一些研究,证明了词汇分析层面借鉴国外技术的可行性。然而在语法层面,对国外已有技术指标的借鉴存在一定困难,例如IPSyn、DSS分数的计算是基于英语的语法规则的,汉语的句法规则不同于印欧语系的英语语言。从词的形态变化来说,英语的形态变化很多,而汉语很少;汉语在词的使用上有很大的灵活性,有许多动词和形容词可以直接作为主语和宾语而不需要词的形态相应变化;在汉语中可以用名词修饰名词。IPSyn、DSS中列出的语法结构很多在汉语中是不存在的,如动词后缀、动词不定式等,因而微观指标的本土化存在着很大的困难。此外由于指标很多,计算也非常的繁琐,国外开发了专门软件对其进行计算,国内没有此类研究更没有相关的技术。所以,对IPSyn、DSS等的借鉴要根据汉语的语法规则重新系统的划分语法结构,具体在汉语中需要考察哪些语法结构还需要研究者们大量的深入研究,更需要来自心理学、语言学和计算机科学等多学科的协作。
收稿日期;2009-05-01