基于语料库的ONLY研究

基于语料库的ONLY研究

郑李卉[1]2016年在《基于语料库的中国英语学习者口语搭配行为研究》文中进行了进一步梳理搭配作为语言能力的重要组成部分,其在语言习得过程中发挥着举足轻重的作用,学习者的搭配行为和搭配能力因此越来越受到国内外语言研究者的重视。Pawley&Syder(1983)指出,学习者若想获得接近本族语的选词能力和接近本族语的流利性就必须掌握大量的搭配结构。然而,对学习者搭配行为的研究却发现其在语言使用中普遍存在搭配知识缺乏的问题。而语料库(本族语语料库和学习者语料库)的出现使得对学习者搭配行为的大规模实证研究成为可能,基于语料库的搭配研究为人们重新审视语言使用中的搭配模式及其重要性提供了新的视角。本研究基于"中国学生英语口笔语语料库"(SWECCL,Spoken and Writen English Corpus of Chinese Learners),借助语料库检索工具 WordSmith Tools5.0,采用对比中介语分析和计算机辅助错误分析的主要方法,研究中国英语学习者口语中的词汇搭配行为。其中对比中介语分析用于比较中国英语学习者和以英语为母语者的搭配使用(即搭配错误的判定和同/近义词的语义韵研究)以及不同水平英语学习者的搭配使用情况,计算机辅助错误分析则用于对搭配错误的描写和诊断分析。本研究从SWECCL的口语子库(SECCL)中抽取总计821,644词的口语语料,建成SECCL_TEM4和SECCL_TEM8两个语料库:SECCL_TEM4包含中国大学英语专业二年级学生口语语料,SECCL_TEM8包含英语专业四年级学生口语语料。于其中提取出六种搭配类型:动词-名词(Cl),形容词-名词(C2),名词-动词(C3),名词-名词(包括名词+of+名词)(C4),副词-形容词(C5),动词-副词(C6),共计34,051项并对其中的搭配错误进行标注,以此为依据,从以下几方面对中国英语学习者口语中的词汇搭配使用进行深入探究:六种类型搭配及搭配错误在学习者口语语料库中的总体分布及频率,搭配错误的历时发展,不同水平英语学习者搭配行为的异同,不同类型搭配错误的特点及原因,学习者在口语和书面语中搭配使用的异同,以及学习者搭配行为中体现的语义韵特征等。在上述研究的基础上,总结归纳出中国英语学习者搭配使用和学习中存在的问题和难点,从而为改善大学英语教学,尤其是搭配教学提出实质性建议。首先,对六种类型搭配及其错误的定量分析显示,在总计34,051项搭配中,判定为错误的搭配有4,476项,这其中动词-名词、形容词-名词和名词-名词这叁种错误类型在所有搭配错误中所占比重最大,尤其在SECCL_TEM8中,这叁类错误合计占搭配错误总量的90%以上,而所占比重最小的搭配错误是副词-形容词,其在SECCL_TEM4中占所有搭配错误的1.10%,在SECCL_TEM8中则仅占0.58%。与此同时,每种类型搭配的错误率也不尽相同,其中,名词-名词和动词-名词搭配的错误率最高,错误率最低的是动词-副词。由此可见,中国英语学习者对不同类型词汇搭配的掌握情况和使用能力不尽相同,出现频率最高的错误类型是动词-名词,形容词-名词和名词-名词错误,这其中对学习而言难度最大的是名词-名词和动词-名词搭配,而学习者对动词-副词搭配的掌握情况最好。更具体地说,根据语料库中每一类搭配的平均错误率对所有六种词汇搭配进行排序,难度从高到低依次是:名词-名词,动词-名词,形容词-名词,名词-动词,副词-形容词,和动词-副词。此外,对SECCL_TEM4中11年(1996-2006)的语料的历时分析结果表明六种搭配错误的数量11年来既有增加也有减少,但总体来说呈逐渐上升的趋势,而卡方测试结果(LL=172.166,p<0.001)显示搭配错误的数量在这期间显着性增加。由此可初步推断,我国英语专业二年级学生的搭配使用能力在过去一段时间并没有取得明显提高,搭配知识不足的问题依然存在,这也说明搭配教学仍是大学英语教学需要关注的重点之一。第二,为考察不同水平英语学习者的搭配使用情况,即学习者的搭配能力是否伴随其整体语言水平的提高而提高,本研究对SECCL_TEM4和SECCL_TEM8中搭配错误的标准化频数进行比较。结果发现,SECCL_TEM8中每一类搭配错误的数量均显着性多于SECCL_TEM4,这就意味着英语水平相对较高的学习者,其正确使用搭配的能力似乎并没有优于英语水平相对较低的学习者,反而在实际的语言使用中出现了更多的搭配错误。造成上述学习者英语水平与搭配使用能力之间负相关的原因可以归结为以下两点:其一,TEM4和TEM8 口语考试中试题的性质不同,前者为描述性试题,后者为论述类试题,难度较前者大,对学习者口语表达和逻辑思维能力的要求也更高;其二,英语水平相对较高的学习者(英语专业大四学生)在口语搭配中与英语水平相对较低的学习者(英语专业大二学生)相比更多地使用了频率相对更低、难度更大的词。用词汇分析软件RANGE分析比较不同水平学习者的词汇使用情况发现,英语水平相对较高的学习者使用词汇的多样化程度明显高于水平较低的学习者,故前者在口语表达中使用了更多样化的词汇,也创造了更多样化的搭配形式,这其中不乏低频的难词。同时,对SECCL_TEM4和SECCL_TEM8中搭配的数量进行比较的结果显示,SECCL_TEM8中的搭配数量显着性多于SECCL_TEM4。可见,高水平学习者在口语中使用的搭配数量也更多。然而,更多搭配错误的出现却说明,尽管在口语表达中使用了更多相对较难的词汇,创造了数量更大,更多样化的搭配形式,但对这些学习者来说,了解一个词的意思并不意味着可以准确找到与之相搭配的词,搭配知识的不足使得搭配错误不可避免。这说明,学习者搭配知识的增长速度要落后于其词汇量的增加速度,也就是说,学习者的搭配能力并没有伴随其整体语言水平的提高而提高,这也是造成相对高水平学习者在口语表达中出现更多搭配错误的直接原因。第叁,为深入探究中国英语学习者在口语搭配使用中存在的问题和难点,本研究在对语料库数据进行定量分析的基础上,进一步对不同类型搭配错误进行描写和诊断分析,以期揭示搭配错误的具体特征及造成错误的原因。描写分析采用James(1998)提出的对学习者错误的组合分类法,根据不同类型搭配错误的具体特征将每一类错误进一步细分为不同类型,并对每一类型进行定量和定性分析。结果显示,搭配错误的出现主要是由于学习者在使用某一词项的搭配时忽视或者没有充分掌握该词项的语义特征、搭配限制以及语义韵,而具体的错误不仅出现在构成搭配的某一词项上,也存在于搭配整体中。在动词-名词,形容词-名词,名词-动词,名词-名词,副词-形容词,和动词-副词搭配中,给学习者造成难度最大的成分分别是动词,形容词,动词,作修饰语的名词,形容词和副词。对六种类型搭配错误的诊断分析发现,搭配错误主要由语际迁移和语内迁移造成,据此可以将其分为语际错误和语内错误两种。前者主要由母语迁移(直译)造成,后者则可进一步归因于同/近义词误用,目标词选择错误/无视搭配限制,过度概括,自造词,以及对目标词用法的片面掌握。尽管造成错误的原因多种多样,但上述原因并不是独立发生作用的,而是相互联系、相互影响,换句话说,某一具体搭配错误的产生可能是几个不同原因共同作用的结果。此外,对六种类型搭配错误而言,其产生的原因各有异同,其中母语迁移和同/近义词误用是最普遍的原因(适用于全部六种搭配错误)。现将每种搭配错误的具体特征及原因概括如下:描写分析将动词-名词搭配错误(CE1)分为动词误用、名词误用(包括名词数的误用)、动词所带介词误用、限定词误用、词不达意、冗余、难以界定类错误共7类,其中动词使用不当是CE1的主要特征,与动词有关的错误(包括动词误用和动词所带介词误用)在所有CE1中所占比重达到了 56.14%。诊断分析发现,造成CE1的原因主要有母语迁移、同/近义词误用、目标词选择错误/无视搭配限制以及过度概括;形容词-名词搭配错误(CE2)分为形容词误用、表语形容词用作定语、名词误用(包括名词数的误用)、词不达意、冗余和难以界定类错误共6类,其中由形容词使用不当(包括形容词误用和表语形容词用作定语)造成的错误所占比重最大(55.57%),是CE2的主要特征。造成CE2的原因则包括母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括和自造词;名词-动词搭配错误(CE3)分为名词误用、动词误用(包括动词语态误用)、主谓不一致、冗余和难以界定类错误共5类,其中由动词误用(包括动词语态误用)造成的错误占所有CE3的49.32%,是CE3的主要特征。诊断分析将CE3进一步归因于母语迁移、同/近义词误用、目标词选择错误/无视搭配限制及对目标词用法的片面掌握;名词-名词搭配错误(CE4)包含做修饰语的名词误用(包括名词数的误用)、做中心词的名词误用(包括名词数的误用)、名词+名词结构替代名词+of+名词、名词+of+名词结构误用、冗余、赘述、词不达意和难以界定类错误共8类,这其中做修饰语的名词误用造成的错误所占比重最大(34.69%),是CE4的主要特征。而CE4的出现主要由以下原因造成:母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括;副词-形容词搭配错误(CE5)分为副词误用、形容词误用(包括形容词比较级误用)、形容词和副词语序错误、冗余、词不达意和难以界定类错误等6类,其中形容词误用(包括形容词比较级误用)是CE5的主要特征。造成CE5的原因有母语迁移、同/近义词误用和过度概括等;动词-副词搭配错误(CE6)包含动词误用、副词误用、动词和副词语序错误、冗余和难以界定类错误共5类,而由副词误用引起的错误占所有CE6的57.62%,是其主要特征。造成CE6的原因有母语迁移、同/近义词误用、目标词选择错误/无视搭配限制、过度概括和自造词。第四,为比较学习者在口语和书面语中词汇搭配使用的异同,确定口语搭配区别于书面语的特征,本研究从SWECCL的口语(SECCL)和书面语(WECCL)子库中各抽取一个样本建成样本语料库SECCL_Sample和WECCL_Sample用于实证对比研究,同时将本研究关于口语搭配错误的特点与原因的发现与前人对书面语搭配错误研究的结论进行对比。结果发现,学习者在口语和书面语中均出现了一定数量、不同类型的搭配错误,而搭配使用的差异主要体现在搭配错误的数量上:口语中每一类搭配及其错误的数量均显着性少于书面语。同时口语中搭配的总体错误率(11.04%)也明显低于书面语(18.09%),这说明学习者在口语中对搭配的使用情况要优于书面语,对学习者而言,在写作中做出恰当搭配选择的难度似乎更高。造成这一差异的根本原因可以归结为口语和书面语自身性质的不同,即口语的不可规划性(unplanned/unplannable)和书面语的可规划性(planned/plannable)。在口语表达过程中,对说话者来说通常很难在保持口语输出流畅性的同时兼顾词汇使用的多样化,换句话说,为了能尽可能地将自己的想法连贯地表达出来,说话者常常不得不放弃使用更多样化或者说难度更高的词汇及其搭配。本族语者是如此,英语学习者更是如此。口语的自发性(spontaneity)大大限制了学习者在口语中能够使用的词汇及搭配的数量和多样性,他们在口语表达中更加依赖于那些习得较早、难度较低、使用起来更简单的词汇及其搭配。另一方面,在书面语写作过程中,学习者有较多时间用于安排写作的内容及其具体的表达方式,故而能使用更多样、更难的词汇用于创造更加多样化的搭配形式。然而,更多搭配错误的出现反而凸显了其搭配知识的不足。上述推测在对书面语和口语语料的定量分析中得到了证实:首先,比较SECCL_Sample和WECCL_Sample中的类符/形符比(Type/tokenratio)发现,前者(6.03)明显低于后者(7.75),说明学习者在书面语中词汇使用的多样化程度高于口语,因此也创造了更多样化的搭配形式;其次,用词汇分析软件RANGE分析比较学习者在口语和书面语中的词汇使用特征,结果显示,其在口语中更倾向于使用难度较低、习得较早的高频词(口语中一级和二级词汇的比例高达94%,其中更有近90%是一级词汇),而在书面语中相对更多地使用了较低频、难度也更高的词(书面语中一级词汇只占约85%)。尽管SECCL_Sample和WECCL_Sample中六种类型搭配及搭配错误在数量上存在显着性差异,但搭配及其错误的总体分布、错误搭配的特征及其成因均表现出了高度的相似性:在口语和书面语中,使用频率最高的搭配是形容词-名词和动词-名词,最低的是副词-形容词;而对学习者而言难度最大的都是名词-名词和动词-名词搭配,学习者掌握最好的则是动词-副词搭配;同时,书面语中的六种搭配错误均表现出了上述口语搭配错误的特征,也可归因于同样的原因。第五,对学习者搭配行为的研究不能只停留于词汇层面,为进一步揭示其搭配使用的语义特征,本研究从同/近义词的语义韵入手,对比分析学习者和本族语者在口语搭配中所体现出的语义韵特征的异同。通过对cause(包括CAUSE,AROUSE,LEAD to,RESULT in/from,BRING about)和 happen(包括 HAPPEN,OCCUR,TAKEplace)这两组同/近义词进行对比研究发现,总的来说,学习者对这两组词的搭配使用呈现出与母语者相似的消极语义韵特征,这些词均被普遍用于表达消极语义。然而,仔细对比每一个词/短语的语义韵特征后发现,学习者过度地将OCCUR,TAKE place,和BRIN Gabout用于消极语境,而将AROUSE和HAPPEN用于中性和积极语境,因而出现了因"语义韵冲突"(prosodic clash)而造成的异常搭配,甚至搭配错误。尽管已经掌握了有关同/近义词语义韵的基本信息,但这些信息显然不足以帮助学习者区分每一组同/近义词中每一个词项或短语的具体语义韵倾向并将它们准确地使用于搭配之中。而造成上述"语义韵冲突"的主要原因与母语负迁移及大学英语词汇教学的方式有关。教师在教学过程中除了告知某一词项/短语的词义外并没有提供足够与语义韵及搭配规约相关的信息,故而使学习者错误地认为这些词义相同或相似的词也具有同样的搭配行为。例如将CAUSE,AROUSE,LEAD to,RESULT in/from,和BRING about 全部等同于汉语中的"导致"或"引起",而将OCCUR,TAKEplacR,和BRINGabout等同于"发生",忽略了这些词各自不同的语义选择倾向和语义韵,从而因违反语义韵和语义选择倾向而产生异常搭配。语义韵冲突也存在于本族语者的口语表达,与学习者不同的是,他们通常是有意识地利用语义韵冲突来创造特殊交际效果,以表达某种"言外之意",如反讽、幽默等。而分析学习者语料中的异常搭配则发现学习者并没有意识到自己的搭配行为已经违反了搭配规约,也不是在试图表达某种"言外之意"。这一现象可以进一步归因于学习者搭配能力的不足,对有关词汇搭配规约和语义韵知识掌握不充分。这样的异常搭配可以被视作是语用失误的一种,其比语法错误更容易在交际行为中造成误解甚至交际中断。因此,要提高学习者的词汇搭配能力以及语用能力,有必要在外语教学中引入语义韵概念,借助语料库证据,帮助引导学习者分析概括所学词项在搭配行为中的语义倾向,以便做出恰当的搭配选择。最后,在对本研究的发现作总结的同时,也就该研究在大学英语教学实践中的意义做了探讨,即如何根据中国英语学习者的具体特点来进行搭配教学,并提出了改进大学英语搭配教学的具体方法和策略。首先,改进搭配教学的前提必须是提高英语教师和学习者对搭配在语言习得过程中的重要性及其难度的认识,从而提高他们在课堂教学和课后自学过程中对搭配的重视程度和搭配教学的自觉性。仅仅提高搭配意识显然是不够的,要减少语言使用中搭配错误的数量就必须将搭配知识融入词汇教学过程,使搭配成为词汇教学一个不可或缺的组成部分,更具体地说,一个词可以和那些词相搭配是需要教的,而词汇教学也不能只停留在词的意思层面。具体的搭配教学可按以下五个步骤进行:1)选择一个目标词,并确定其词级;2)在搭配词典中找出该目标词的所有搭配形式及搭配词,并确定这些搭配词的词级;3)根据学习者的英语水平和语言使用的不同目的所需的词汇量,结合搭配词的词级,确定词汇教学需保留哪些搭配词;4)将需要教学的搭配词根据不同的搭配类型呈现于"搭配网"(collocational web)之中;5)设计相应的练习来强化学习者对以上搭配的掌握。最后,为保证搭配教学的系统性,提高搭配教学的效率,英语教师在具体教学过程中可采取以下措施:第一,对汉语和英语中的词汇搭配作比较,指出其异同。由于母语迁移是造成搭配错误的主要原因,无论在教材的编写还是实际的词汇教学过程中都需强调汉语与英语的差别,让学生了解到哪些搭配在汉语和英语中存在一一对应的关系,可以直译,哪些搭配是不可以直译的,而教学的重点应该放在后者。同时,汉英之间的如下差异也给学习者做出正确搭配选择造成了困难,因而也需要在搭配教学中特别指出:汉语中没有名词单复数这一概念,没有限定词或冠词这一语法分类,汉语中存在大量意念/无标记被动句,汉语中的形容词和副词没有比较级和最高级形式;第二,重视同/近义词的搭配教学,可借助搭配网格(collocational grid)。学习者时常忽视同/近义词的搭配限制及语义韵,在搭配使用中将其混淆,因此在教学时可将同义词及其常用搭配呈现于网格中,如有必要,也可在网格中提供有关这些词的语义特征、搭配限制、语义韵等信息,帮助学生更直观地了解同/近义词在具体搭配使用中的异同;第叁,搭配教学既需向学生提供搭配使用的正例,也需提供反例,即教学内容也需包括学习者的搭配错误。搭配错误能够很好地反映学习者对搭配知识的掌握情况和遇到的困难,因此英语教师在教学过程中应注意观察学习者口语表达中出现的搭配错误,适时加以提醒和指正,并对错误进行记录。同时可以借助语料库工具,建立小型的学习者语料库,对其中的搭配错误进行标注、归类和诊断,再将语料库运用到搭配教学中。如此,在搭配教学中除了告诉学生一个词可以与哪些词搭配外,还可明确指出其常见的搭配错误,帮助学生在语言使用中避免犯类似错误;第四,搭配教学不能脱离具体语境,而将语境融入教学的最佳途径就是借助本族语语料库。学习者需要习得的不仅是词的意思,更重要的是词的用法,教学过程中可以借助本族语语料库,让学生尽可能多地接触真实的词汇使用环境,了解其在具体语境中的搭配限制。这就要求教学大纲的制定者、教材的编写者,以及英语教师确保词汇及搭配教学中所使用的实例必须来自真实的语境。此外,对英语水平相对较高的学习者,教师可以帮助其学会如何利用语料库软件从语料库中提取数据、检索搭配,提高其自学的能力和效率。最后,也是搭配教学必须坚持的基本策略是搭配能力的提高必须经过反复地练习。搭配教学的最终目的是帮助学习者将其对搭配的接受性知识(receptive knowledge)转化为产出性知识(productiveknowledge),即能够在具体的口语和书面语表达中准确使用大量的搭配结构。要达到这一目标,唯一有效的做法就是确保学习者能在课堂教学及其课余生活中不断反复地在练习和真实的英语使用过程中运用所学到的搭配,只有这样才能巩固所学知识,并最终提高其搭配能力。这也再起强调了搭配练习的重要性,教师必须在教授搭配知识的基础上设计和组织足够的练习和交际活动,从而强化学习者对所学搭配的掌握,提高其搭配使用的准确性。本研究是对中国英语学习者口语搭配行为的一次尝试性探索。尽管其在研究方法和结论上都不可避免地存在一定局限性,但该研究在一定程度上揭示了中国英语学习者在搭配习得和使用过程中存在的问题和困难,并据此为改进搭配教学提出了具体可行的方法,希望能够借此提高中国英语学习者和教师对搭配教学的重视,并通过采用本研究所提出的搭配教学的具体步骤和策略在一定程度上提高搭配教学的效率,从而促进学习者搭配能力和语言能力的提升。

向倩[2]2017年在《基于语料库的英语同义词语义框架个案研究》文中研究指明英语词汇中具有丰富的同义词,其准确辨析与恰当运用一直是中国英语学习者学习中的一大难点。传统的同义词辨析一般借助于相关词典的释义和例句,因此具有很大的局限性。基于语料库的研究方法为同义词更加直观、全面的辨析提供了可能。传统的辨析方法与基于语料库方法的结合可以使英语同义词辨析变得更为合理有效。国外对基于语料库的同义词研究主要集中在两个方面:英语同义词在本族语语料库中的特征研究及两种不同语言中对应同义词的特征研究。国内除研究英语同义词在本族语语料库中的特征外,也侧重于对中国英语学习者对其同义词的使用进行探讨。国内外学者通常从四个方面对此领域进行探索:语域、类联接、搭配和语义韵,但他们很少提及具体的理论去支撑其研究,从潜在语义的角度对英语同义词进行辨析的研究则极为欠缺。同义词的语义差异来源于贮存在人脑中的背景知识和经验的差异。因此,本研究将在框架语义理论的指导下,基于英国国家语料库(BNC),借助叁个自然语言处理软件WordNet、Sketch Engine及Latent Semantic Analysis @ CU Boulder对十组英语同义词(五组动词同义词和五组形容词同义词)从四个方面进行辨析:类联接、搭配、语义韵和潜在语义,旨在为学习者准确使用英语同义词提供新的方法与依据。研究结果表明,英语同义词在类联接上的差异主要体现在两个方面:类联接模式及每个模式的使用频率,且在大多数情况下,动词同义词和形容词同义词后的搭配介词能够成为区分这组同义词的显着标志。从搭配来说,同义词在其共同搭配模式和唯一搭配模式中都存在差异,且这两种模式下得出的同义词辨析结果具有很大的一致性。任何一组同义词在语义韵上都存在差别,有的具有明显不同的语义韵;有的即使具有相同的语义韵,但在每种语义韵所占的比例上也会有不同。每组同义词的潜在语义相似值都不同;且通过比较同义词所在句子之间连贯性的平均值可得出:搭配词的意义较为集中的同义词所在句子连贯性的平均值要比搭配词的意义较为分散的同义词所在句子的连贯性的平均值高。英语同义词在以上四方面的差异都可以用其相关的背景知识与经验去解释。本研究建议教师应适当地将基于语料库的同义词辨析方法运用到课堂上,使学生能够在大量真实的语料中学会全面分析与理解同义词;同时,教师应加强对学生的词汇背景知识的输入,分析不同同义词的语义框架,同时鼓励学生通过广泛阅读、通过与英语母语者交流等方式正确运用词汇。

徐琰[3]2003年在《基于语料库的ONLY研究》文中进行了进一步梳理ONLY这个词在某种程度上来说是个有意思的英语单词,在口语和书面语的语料库中,ONLY都是一个高频词。人们在日常生活中经常使用这个词,尤其是在口语中。实际上,很多语言学家都对ONLY这个词做了多方面的研究。本文旨在从另外一个不同的角度来对ONLY这个词做出诠释和理解,即把全文对ONLY的研究建立在对语料库的研究和分析上。基于研究ONLY在各个不同的语料库中的分布特性和这个词本身在语料库中呈现的特点,本文展开了以下分析和研究: 第一章简略介绍了本文研究的依据和主要的研究方法。同时引用了以往语言学家列举的有关ONLY的语言现象和问题,也粗略阐述了作者对这些问题的疑问和自身的看法。第二章则介绍了本文中所使用的主要的叁个语料库,它们是BNC、MICASE和TIME。在本文的第叁个部分中,研究的重点是ONLY这个词在口语和书面语的语料库中出现的主要的用法。语料库里搜集得出的数据用于比较ONLY在不用的语料库中分布的特点。统计方法得出的结论是ONLY这个词多以形容词的词性形式出现在口语语料库中,相反多以副词的词性形式出现在书面语的语料库中。本文的第四个部分则用句法分析来比较含有ONLY的语料之间的异同点。本章采用最为流行的转换生成语法中的最简方案来建立语料的二叉树型结构,来研究副词形式ONLY的特性和在句子中的位置。研究发现ONLY几乎可以出现在句子中的任何位置上。正文的最后一个部分研究了复杂的歧义现象以及该现象和ONLY的关系。鉴于歧义现象本身的复杂性,本文仅提出自己的观点和对歧义的解决方案。作者提出ONLY引起的句子歧义和某种特定的句法结构相关联。 结论部分主要重申了研究的结论和意义,并且重点提出了本文的研究成果对英语教学和英语第二语言习得的建议。

刘嘉[4]2018年在《基于语料库的中国学者和本族语学者在学术论文中情态动词应用的对比研究》文中提出情态动词虽然形式简单,但无论在语义还是语用用法方面都较为复杂,作为传统语法的核心构成,情态动词是最为常见的情态表达方式。情态动词在英语中的使用相当广泛,可以表达说话人对某一事件或行为的主观态度和观点。中外许多学者曾从不同角度对情态动词进行了深入广泛的研究。对于国内学者们而言,能够在学术论文中精准无误地使用情态动词是一个挑战。因此有必要针对学术语篇中情态动词的使用进行深入细致地分析。作为各国专家学者进行学术交流的重要手段,学术论文成为学术界关注的焦点。在当前学术写作研究领域,学术英语的语篇分析是研究热点之一。在计算机技术迅猛发展的形势下,语料库的研究方法已被普及应用于学术英语的语篇分析中,这不失为一个重大转折点。过去,主要采用定性分析法来对海量学术英语语篇进行分析,而如今有了语料库,可以综合采用定性分析法、定量分析法进行研究。另外,基于海量学术英语语篇的语言研究也能够提升究结果的更精准性,能够为国内学者更加精准无误地使用情态动词起到良好的指导作用。本文依据Coates和Biber的研究成果选择了九大核心情态动词can,could,may,might,must,shall,should,will和would作为研究对象运用定量的方法,基于CRAC和COCA语料库,采用对比分析方法,对国内学者和本族语者在学术论文写作中情态动词使用的差别进行研究,并依据Mindt的情态含义分类理论从语义特征方面进行了对比分析。研究结果表明:国内学者存在情态动词过度使用现象。具体而言,情态动词CAN,WIIL,SHOULD常被过度使用,而COULD,WOULD,SHALL,MUST,MIGHT往往被过少使用;本族语者与国内学者在情态动词的使用方面存在明显差别。国内学者往往不常使用COULD和WOULD情态动词。本文通过语料库的对比分析,使国内学者了解到情态动词的过度使用或使用不足甚至误用的具体问题,进而使国内学者在学术论文撰写阶段,使其情态动词的使用方式更接近于本族语者。

吕娉[5]2018年在《基于语料库的英汉中动构式对比研究》文中研究说明中动构式在句法上为主动形式,而语义上隐含被动意义。自Keyser&Roeper(1984)提出中动构式以后,其特殊的句法形式和语义特征成为国内外语言学家研究的热点话题。汉语中动构式的研究始于Sung(1994)。英汉中动构式以往的研究主要聚焦于中动结构的派生机制、英汉中动构式的对比研究,以及极少数的语料库研究。然而,对英汉中动构式的句法语义研究多用定性内省法,基于数据分析的研究较少。此外,汉语中动结构仍然没有统一的界定标准。因此,本研究以Goldberg构式语法为理论依据,以语料库(英语为COCA和BNC,汉语为CCL和SLC)为依托,旨在对英汉中动构式的句法语义特征做全面的对比研究,尝试回答如下叁个问题:(1)汉语中动构式如何界定?(2)英汉中动构式的论元、动词和附加语在句法和语义上存在哪些异同?(3)典型和非典型中动构式有哪些句法语义特征?非典型英汉中动构式有何异同?本研究得出了如下结论:(1)只有附加语指向动词VP和指向隐含施事的“NP+V起来+AP”构式才是汉语中动构式。(2)英汉中动构式的论元,动词和附加语在句法和语义上存在以下几点异同:就论元而言,英汉中动构式句法主语的语义类型多样,但汉语主语语义类型比英语丰富;英汉中动构式的施事一般在语义层存在而不在句法层投射,但是也存在少量施事在句法层投射的中动句,其中施事在句法层投射的汉语中动句的数量比英语中动句的数量多。就中动动词而言,它是派生不及物动词,英汉中动词在及物性、动词类型、动词形式以及动词的体态等方面都存在异同。就附加语而言,英汉中动句附加语在句法类型和语义类型上都存在异同,而附加语的存在是为了充当话语的信息焦点。(3)英汉中动构式存在典型和非典型之分。典型中动构式具有以下特点:句法上主语是动词的内论元,动词具有[+自主],[+及物]特征,修饰语必须在句法层出现等;语义上具有隐含施事、非事件性等特点。典型英汉中动构式都包括性质中动句、难易中动句、时间中动句和适意性中动句;非典型汉语中动句不允许动结构式存在,并且非典型汉语中动句中非受事论元作主语的情况比非典型英语中动句非受事论元作主语的情况多。

张旭洁[6]2006年在《基于语义网络的类自然语言的知识获取与转换的研究》文中研究说明让计算机自动获取知识是智能系统研究者一直以来的梦想,而作为人机交互接口的自然语言理解与知识表示的研究是目前非常热门的领域:自然语言理解可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。自然语言是知识的主要载体,自然语言理解的研究建立在多个学科的基础之上,具有较大的研究意义。本文在框架与语义网络两种知识表示方法的基础上,设计了一个框架与语义网络相结合的结构化知识表示语言BabelL,并建立了基于BabelL语言的知识获取系统。通过分词与依存语法分析工具的处理,提出了基于规则方法的汉语到语义网络语言的转换算法,实现了知识的半自动获取。在实现知识半自动获取的基础之上,本文运用语义网络语言的语言推理能力,完成了基于语义网络语言知识库的简单内容的问答。 本文主要有以下几个方面的研究成果: (1) 设计了结构化知识表示语言BabelL,为半自动知识获取构建了知识结构体系 结构化知识表示语言BabelL结合了框架与语义网络这两种知识表示方法,能更加自然、灵活的表示与描述知识。 (2) 设计了基于规则方法的汉语到语义网络语言的转换算法 在汉语到语义网络语言的转换中,以分词、依存句法分析器为工具,分析生成依存叁元组,并从依存关系树库中提取出依存叁元组到语义网络语言的转换规则,利用这些规则实现了从依存叁元组到语义网络语言的转换。 (3) 运用XML实现了对规则集的管理 传统规则方法的缺点包括:规则维护较困难、鲁棒性差;为解决这些问题,本文创新性的运用了XML技术实现规则集在转换中的灵活控制,大量的规则不需要以条件语句的形式写入程序,同时建立了一种基于语料的支持规则生成和维护的规则管理工具,并采用了默认规则,提高了系统的鲁棒性。由此很好的解决了传统规则方法的弊端。 (4) 在语义网络语言这种知识表示形式的基础上,实现了语义网络的线性推理与简单问答

高丹丹[7]2016年在《基于语料库的“耳”隐喻英汉对比研究》文中进行了进一步梳理隐喻产生于概念的体认性,是基于身体经验而产生的。因此基于相同的人体结构和身体经验,人类所使用的隐喻也具有普遍性。然而,研究发现了大量非普遍性隐喻的存在。也就是说,在语言使用中,隐喻的变异性同隐喻的普遍性同样常见。正是由于概念的体认性,人体隐喻在认知语言学领域内被广泛研究,但是大多数对人体器官的研究在研究方法上都存在着局限性。本研究运用了隐喻识别程序(MIP)和概念本体库方法(SUMO)对英汉语中人体词“耳”的隐喻模式分别进行了分析,具体解释了人体器官使用中隐喻普遍性及变异现象。本研究首先从英语语料库“当代美式英语语料库”和汉语语料库“中文特性描述系统”中分别随机摘取语料各1000条,再将它们按照MIP的方法分为本义用法和非本义用法。随后,根据字典和其他工具所提供的意义对非本义语料进行意义划分并找出关键隐喻示例。然后,使用本体库工具查询这些示例的SUMO节点和定义,得出英汉两种语言中“耳”的隐喻模式。根据得出的模式,分析两种语言中隐喻模式的异同并解释形成异同的原因。本研究拟在解决以下问题:1)英汉两种语言中“耳”的主要隐喻模式有哪些?2)英汉两种语言中“耳”的隐喻模式有何异同?其形成原因是什么?本研究的主要发现在于:1)英语中“耳”的隐喻有叁种:EAR AS A CONTAINER,EAR AS AN OBJECT OF MANIPULATION和EAR AS AN OBJCT;汉语中“耳”的隐喻有两种:EAR AS AN OBJECT OF MANIPULATION和EAR AS AN OBJECT。2)英汉中“耳”的隐喻模式相同点有两个:两种语言中都存在EAR AS AN OBJECT OF MANIPULATION和EAR AS AN OBJCT这两种隐喻模式;EAR AS AN OBJECT OF MANIPULATION这一隐喻模式在两种语言中都有叁个分类用来表示感情和心智生活。英汉中“耳”的隐喻模式不同点也有两个:英语中“耳”的隐喻有叁种而汉语中“耳”的隐喻有两种;英语中有EAR AS A CONTAINER这一模式而汉语中不存在这一模式。3)通过比较英汉两种语言中“耳”的隐喻模式及其异同点,本研究发现相同的身体经验形成了相同的隐喻而不同的经验关注点导致了隐喻的变异。本研究能够加深人们对语言使用背后的认知机制及跨文化的概念体认性的认识。当然,由于语料库中语料数量以及质量的影响,本研究也存在一些不足,需要在今后的研究中进一步改进和完善。

李颖玉[8]2009年在《基于语料库的欧化翻译研究》文中研究说明在语言接触过程中,一个自然而又重要的结果就是接触双方的语言发生词汇、句法甚至语音和语用等层面的变化。英汉语言接触中“受西洋语法影响而产生的中国新语法”就被称为“欧化的语法”(王力,1985:460)近年来,英语作为当今世界的一种强势语言,使现代汉语发生了较为显着的“欧化”。客观地说,这些“欧化”一方面给汉语的健康和发展带来一定的不良影响,另一方面也为汉语的丰富和完善带来了新鲜的血液。然而,“欧化”这个原本自然的现象从被认识的那一刻起便被赋予了太多的消极含义。英汉翻译作为英汉语言接触的重要手段之一,必然与汉语的欧化产生有着千丝万缕的联系,因此也就成了欧化现象的“出气筒”,而欧化的译文更是毫无怨言地成为了众矢之的。那些“蹩脚的”、“估屈聱牙”的欧化译文固然应该批评,但是正如“批评”这个词本身一样,人们更多地注意了缺点和错误,而严重忽视了“评论判断”和“优点长处”这两层涵义。事实上,欧化的翻译除了“蹩脚”,还可以有良好的经济性和特殊的表现力;而那些的确“估屈聱牙”又无任何价值的译文也不是仅靠批判就能改善。因此在当前形势下,正视欧化翻译问题、积极深入地研究欧化翻译现象是件十分重要而有意义的事情——对翻译事业本身如此,对更好地理解现代汉语正在发生的种种变化也是如此。本研究以翻译学为核心,从语言接触的视角出发,充分利用语料库方法的优势,对当前英汉翻译中出现的欧化翻译现象进行实证研究;在定量研究、定性研究和实验研究的基础上对欧化翻译进行较为系统全面的描写和挖掘。新兴的接触语言学和语料库语言学给本研究提供了十分有价值的思路和方法。此外,研究中还借鉴了历史语言学、社会语言学、应用语言学、对比语言学以及汉语研究等领域的相关成果。本研究的主要内容分为九章,可以分为四个部分,即基础铺垫、研究主体、拓展研究及研究结论。基础铺垫,包括前两章。第1章首先介绍了研究背景,然后对相关概念和术语作了较为深入的讨论,接着对研究的价值、创新、目标及方法等方面作了详细的评估和介绍。第2章主要从与本研究关系最为密切的几个领域入手,介绍并评述了接触语言学、语料库语言学、翻译学及汉语研究等研究中的主要研究文献,还特别对语言学研究中从静态的规定性“标准”走向动态的描写性“规范”作了回顾和评析。研究主体,包括第3-6四章内容。第3章对欧化翻译现象进行了较为全面的分析,不仅从内部机制和外部影响两方面论述了欧化翻译的必然性及合理性,还列举了常见的表现形式。在此基础上,研究提出了积极欧化和消极欧化的概念,并进一步讨论了区分积极欧化和消极欧化的必要性及其一般原则。第4章详细介绍了研究所使用的语料库及检索、统计和分析工具,重点讲述了英汉翻译译文语料库的建设方案与过程。第5章是本研究的核心内容之一,主要从词汇和句法两个方面对译文中出现的典型欧化案例进行了大量的语料库统计和语言学分析,总结和评估了汉语译文受英语语言词汇及句法结构影响所产生的变化。研究发现,英汉语言接触的确能够导致汉语译文出现欧化,但是以往的研究对欧化具体表现认识尚存不足,人们的主观感受也不完全正确;定性分析的结论虽有很多可借鉴之处,但也有不少需要纠正的看法。第6章就语料库研究的结论进行了问卷调查和统计分析,重点考察了公众对欧化译文的喜好和敏感程度。它不仅是语料库研究的重要补充,也是区分积极欧化与消极欧化的重要标准。拓展研究,包括第7、8两章。第7章和第8章分别从积极欧化和消极欧化的角度出发,结合以往的理论与实践研究结果和本研究的语料库与调查分析结论,对译文中出现的欧化现象进行分析和整理,并分别研究了积极欧化对翻译理论与实践的价值和启示以及消极欧化译文的优化策略。研究结论。第9章简要地总结了研究成果,提出我们不仅应该正确对待英汉接触和汉语欧化,还应该正确认识翻译中的规范和创新,从而促使英汉翻译真正走上健康发展的道路。本章最后还指出了研究存在的局限性,并对相关问题的进一步深化研究提出思路。本研究的创新之处(详见1.4)有以下几点:首先是研究观念发生了重要转变,从静态转为动态,从消极转为消极与积极并重。这样一来,对欧化翻译现象的研究空间得到了很大的拓展,研究问题的结论也就更加全面而客观。第二是研究方法的改善。本研究充分利用了标注语料库的价值,结合了定量分析与定性研究的优势,用大量真实的译文语料对欧化翻译进行了较为系统的实证研究,用更为丰富、可靠的结果对现有定性研究结论进行了必要的检验和修正。第叁是研究视角从单一的语法研究扩展到语法、语义、语用叁个平面的研究,使欧化翻译的分析、积极欧化的价值认定及消极欧化翻译的优化策略都成为立体的宏观与微观相结合的研究。第四是研究对象明显扩大,从自建译文语料库到参考语料库再到最新的电视节目语言案例,研究中不仅包括了书面语,还有口语和研究过程中不断发现的新案例。种种努力对于更加全面、真实地了解欧化翻译现状起到了很好的保障和补充作用。本研究的理论价值(详见1.3.1)在于将语言接触因素引入翻译研究,分析和评估英语对英汉翻译造成的影响及其在中国社会文化中的地位和作用,为翻译学和接触语言学理论研究进行了相互补充;通过大量的实验数据和调查结果纠正和补充了欧化翻译研究中存在的理论偏见,筛选和确定了欧化翻译研究中需要关注的主要对象和重点;纠正对欧化翻译的片面看法,大胆提出“积极欧化”和“消极欧化”的理论模型、分类原则及动态规范;本研究的实践价值(详见1.3.2)主要体现在翻译研究及翻译实践与教学领域、现代汉语研究及政策制定、对外汉语教学、辞典编纂和语料库建设等领域,对帮助普通的语言学爱好者及广大公众了解欧化翻译、自觉使用规范汉语也有一定的积极意义。其主要价值可以简要概括为以下几点:对翻译研究而言,本研究初步摸清了欧化翻译的基本情况,进行了必要的分类及规范制定,为今后的研究作了一定的基础性工作;同时研究的思路、方法和结论对直译及异化研究的深入能够起到重要的提示作用。对翻译实践与教学而言,本研究不仅有助于树立正确的翻译观、有助于翻译工作者了解新时期翻译工作的新要求,还为翻译实践提供了具体的理论指导和案例资料,拓展了翻译批评的思维空间和参考规范。对现代汉语研究及政策制定而言,语料库调查结果有助于了解现代汉语的发展现状,预测其演变趋势,在研究和管理工作中做好准备工作;而问卷调查结果则提示,在语言研究和语言政策制订方面需要充分尊重和考虑公众意愿。此外,本研究还可以帮助汉语教师和外国学习者(特别是来自英语国家的)了解英汉语言接触及影响,正确把握正、负迁移及其动态规范;研究使用的语料库除了可以为类似研究直接提供资源之外,还为汉语语料库的建设积累了一定的经验和教训;新外来词语的译介原则还可为相关辞典的编纂提供参考。

林珺丽莎[9]2017年在《老舍小说《二马》两个英译本的译者风格研究》文中研究指明《二马》是老舍于伦敦居住期间完成的一部作品,于1929年发表,属于老舍最早期的小说作品之一。《二马》作为老舍外译数量最多的作品,其译本却并未引起国内学者足够的重视,少数的《二马》译本研究也仅局限于吉姆逊译本的单译本,尚未触及多译本对比分析。在中国推行“走出去”的大政策背景之下,针对一些在海外受到积极反响的中国外译作品进行研究,显得尤为重要,意义十足。本论文为基于语料库的译者风格研究,通过自建小型平行语料库,采用定量与定性结合的研究方法,以老舍作品《二马》的吉姆逊和杜威廉两个译本为研究对象,对两个译者的风格进行对比分析。研究主要基于词汇、句子和语篇叁个层面,利用语料库检索软件得到标准形符比、平均词长、平均句长等统计数据,辅以具体的实例分析,试图较全面地描述吉姆逊和杜威廉两个译者的翻译风格异同。词汇层面的研究显示,与吉姆逊译本相比,杜威廉译本的词汇丰富度更高,平均词长更大,词汇密度更强,长词比例较大,说明杜威廉的译本在词汇面上较吉姆逊难度更大,而且译本的信息负载量更大。句子层面而言,吉姆逊译本呈现平均句长较长的特点,而且从属连词比例较大,因此句子复杂性更高,主要原因是由于吉姆逊多遵从原文的句子结构,而杜威廉则倾向将源语文本中的长句拆分成多个小句、短句。语篇方面,本文主要聚焦两个译本的可读性分析,引入Lix可读性参数评比,结论显示,两个译本的可读性均很高,但杜威廉的可读性系数较吉姆逊更高,说明杜威廉的译本更易于读者接受,恰好印证了杜威廉译本作为畅销书定位的特点。本研究的重要意义在于验证了语料库在译者风格研究中的适用性,并揭示了目标语文化和源语文化间地位差距、目标读者、译者的个人文化背景、翻译观等因素对译者风格的解释力。尽管研究尝试全面描述两个译者的风格异同,但仍存在许多不足与缺憾之处,比如,本文仅关注了两个译本的正文本对比,并未涉及到前言、注释等准文本的分析。此外,本研究仅专注在吉姆逊和杜威廉两个译本的比较,未纳入《二马》另外两个译本,为未来的研究留下了许多空间。

胡佳仪[10]2014年在《基于语料库的大学英语写作中的词块研究》文中研究表明词块作为一种能将功能与形式融为一体的语言单位,能更好的体现出语用、语法及句法之间的关系。目前,语言学界对于词块的研究主要分为两大类型:以理论研究为主的理论驱动型和以语料库为基础的语料库驱动型。虽然理论驱动型研究可以为词块的研究提供充足的理论支撑,然而与之相比,以语料库为基础的语料驱动型研究能为词块的进一步研究提供更为有力的数据支撑;并且以语料库为基础的研究更着眼于语言的真实使用情况,涵盖了各种类型下的词块分类,比以理论为依据的研究更具现实意义。但是,目前关于中国大学英语学习者词块方面的研究多数仅仅集中在以理论探索为主,尤其以写作为研究角度的基于语料库的词块研究还不多见。本文作者经过研究发现这些基于语料库的词块研究大多从英语本族语语语料中提取本族语者最常用的词块,并将其作为参照标准,然后将这些词块放到中国英语学习者的语料库中来获得中国英语学习者的词块使用水平。然而,由于词块与主题内容较为相关,要找到跟中国学生的作文题目相同的英语语料库并不是十分容易,因此本文作者放弃了以本族语语料库中的词块作为参照标准的做法,尝试自建语料库,从研究自建的语料库内部寻找参照标准来检验词块的使用和语用水平之间的关系。首先,作者收集了兰州交通大学非英语专业学生200篇作文,并将这两百篇学生作文按照评分标准分为优秀的50篇和其余水平一般的150,使用了AntConc3.2.0等语料库分析软件分别从优秀作文和水平一般地作文中提取3-6词长的词块并经过人工筛选,最终得到有效的词块和其频率数;然后,将从50篇优秀作文中提取的词块作为参照标准放入另外的150篇学生作文中得到这些词块在这些学生作文中的出现频率;其次,作者使用SPSS13.0软件将水平一般的150篇学生作文的成绩作为因变量,词块出现的频率作为自变量进行相关性分析;最后得出结论,证明词块的使用频率和学生的写作成绩呈显着相关。为了进一步得到中国大学英语学习者词块的结构特征和语用功能,并将其与本族语者词块的结构特征和语用功能做以比较,本文作者再次以200篇学生作文自建语料库,并将英语本族语作文语料库(LOCNESS)作为参照语料库,作者用AntConc从两个语料库中分别提取3-6长的词块,经过人工筛选,最终得到有效词块及其出现频率;然后参照Altenberg (1998)的分类标准,作者将词块分为分句成分、完整分句及不完全词组;最后作者全面分析并比较了每种分类下自建语料库和英语本族语作文语料库(LOCNESS)中词块的结构特征及其语用功能,并使用卡方检验证明在每种分类下两个语料库中词块出现频率的呈显着性差异。分析显示两个语料库中对于词块的使用呈现出一定的共性:无论是在自建语料库还是在英语本族语作文语料库(LOCNESS)中词块都作为一种普遍的语言现象,大量频繁地出现在语言输出中,其中叁词词块均占最大比率,并且分布态势呈现出词块长度越大则数量越少的特点;在这叁种类型的词块中分句成分占得比例最大,其次是不完全词组,完整分句所占比例最小;分析还显示,在写作过程中,我国大学生也用到了同本族语者相同功能类型的词块,例如如情感功能,教化功能,评述功能,组织功能等,与此同时,在Altenberg (1998)对于单一分句的语用功能分了六类的基础上,本文作者研究发现单一分句还具有作为原因状语,结果状语,条件状语以及让步状语的作用。在对比研究中的统计数据表明,与本族语者相比,虽然我国大学生作文中大量出现词块,然而其使用状况却差强人意。与本族语者相比,我国大学生在词块使用上存在明显的简单化和口语化倾向;同时在某些词块的使用上还存在过度使用或下意识的避免使用的倾向等问题。造成词块使用偏差的可能原因为受母语负迁移影响,中国学生更习惯使用英汉语义对等的口语体和书面体,导致了语言表达的不清晰,中介语的发展进入石化阶段。在一些极具文化涵义和文化背景的词块的使用上,中国学生也下意识的采用了避免采用甚至放弃使用的策略,这在一定程度上也反映出中国学生在词块的习得上缺乏文化意识。在此基础上,本文作者提出了一系列英语学习和教学方面的建议,以期对中国学生的英语写作有所裨益。

参考文献:

[1]. 基于语料库的中国英语学习者口语搭配行为研究[D]. 郑李卉. 浙江大学. 2016

[2]. 基于语料库的英语同义词语义框架个案研究[D]. 向倩. 广西大学. 2017

[3]. 基于语料库的ONLY研究[D]. 徐琰. 大连海事大学. 2003

[4]. 基于语料库的中国学者和本族语学者在学术论文中情态动词应用的对比研究[D]. 刘嘉. 兰州理工大学. 2018

[5]. 基于语料库的英汉中动构式对比研究[D]. 吕娉. 鲁东大学. 2018

[6]. 基于语义网络的类自然语言的知识获取与转换的研究[D]. 张旭洁. 云南师范大学. 2006

[7]. 基于语料库的“耳”隐喻英汉对比研究[D]. 高丹丹. 山东财经大学. 2016

[8]. 基于语料库的欧化翻译研究[D]. 李颖玉. 上海外国语大学. 2009

[9]. 老舍小说《二马》两个英译本的译者风格研究[D]. 林珺丽莎. 广东财经大学. 2017

[10]. 基于语料库的大学英语写作中的词块研究[D]. 胡佳仪. 兰州交通大学. 2014

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于语料库的ONLY研究
下载Doc文档

猜你喜欢