成人在线学业情绪倾向的测度方法研究,本文主要内容关键词为:在线论文,学业论文,倾向论文,成人论文,情绪论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G434 文献标识码:A 文章编号:1006-9860(2011)06-0055-06
—、引言
学业情绪(Academic Emotions)指在教学或学习过程中与学生学业活动相关的各种情绪体验[1]。这个概念最早由德国教育心理学家Pekrun于2002年提出[2],目前已成为国外教育学与心理学研究的一个热点,引起了各国学者的广泛关注[3]。据CNKI检索(检索日期2011-3-18),我国自2005年起陆续出现学业情绪的专门研究,迄今共64篇论文,研究方法主要有文献研究、理论构想和实证研究,研究对象主要集中在青少年、大中小学生。对在职成人在线学业情绪的测量评价,尚未见文献报道,但有基于情感计算的相关外围探讨,如:e-Learning中的情感计算[4]、情感计算技术在远程教育中的应用探讨[5-11]、基于人脸检测和表情特征提取的网络教学中学业情绪识别模型[12]、中文文本情感倾向性分析[13-15]等。相对于常用的学业情绪测量评价方法(问卷调查、访谈、现场观察等),情感计算为我们提供了崭新的技术路线和评价视角。
心理学研究表明,良好的学业情绪不仅有助于学生认知活动的开展和主动学习态度的培养,而且有助于建立良好的师生关系,促进学生身心健康发展[16]。成人在线学习者,肩负工作、家庭的责任,工学矛盾突出,在基于网络的在线学习平台上进行远程自主学习,其学业情绪如何?怎样及时了解、评价在线学习过程中的学业情绪倾向?这是富有人本意蕴和应用价值的研究话题。本文拟借鉴情感计算这个前沿领域的有关研究,从文本情绪倾向性分析的视角,对此进行探讨。
二、研究设计与方法
(一)技术路线。构建情感权值词典并以此为基础,综合运用情感计算、社会网络分析、文本挖掘、内容分析、多元回归分析等方法,揭示成人在线学习活动文本纪录语料中所蕴藏的学业情绪倾向及其相关影响因素,解析在线学业情绪倾向与学习社区环境因素的相关系数与回归系数,建立基于情感权值词典的成人在线学业情绪倾向的测度方法,为成人在线学业情绪的监控和调节提供相关切入点。
(二)关键概念的操作定义。成人在线学习者:参加高等学历教育、利用基于计算机互联网的在线教学平台进行远程自主学习的、处于工作阶段的成人学生群体。在线学业情绪:指学习者在线学习时,蕴藏在学习社区活动文本纪录的情感词和帖子语义中,通过词语情绪色彩分析、权值计算和语义理解等方法可以观察测度的、与学业相关的情绪体验。
情感权值词典:情感(Feeling)即情绪过程的主观体验[17],情感权值词典是面向情感词识别与情绪倾向性计算的中文情感词语集,每个情感词由人工赋予一个表示情绪倾向性的极性与强度的权值,权值的范围根据经验定义为[-20,20](如狂喜的权值是20,绝望的权值为-20)[18],正值表示积极情绪,负值表示消极情绪,权值的大小反映了情绪极性的强度,如某个词的正值越大,其表征的情绪倾向越积极,反之则表示情绪倾向越消极。
(三)情绪倾向的极性与强度的分类标准。根据普通心理学、情绪心理学对情绪的两极性及其分类标准[19][20],结合在线学习社区的文本语境特点和测度的可操作性,本研究将情绪倾向性基元分类为积极、中性、消极,强度分成高度(强)、中度、一般(弱)3个级别。参考沈阳等人的研究[21]和Likert量表的赋值方法,设中性情绪为基线,赋值为[-5,5],通过基于情感权值词典的情感倾向分析软件ROST EA计算得出情绪倾向值(其计算公式详见文献[22]),极性与强度分为:高度消极(-∞,-25)、中度消极[-25,-15)、一般消极[-15,-5)、中性情绪[-5,5]、一般积极(5,15]、中度积极(15,25]、高度积极(25,+∞)。以绝对值的最高点来确定特定文本语境中的情绪主导倾向;以极性与强度分段统计结果的总体百分比,来理解特定文本语境中的整体情绪氛围。
(四)抽样与数据预处理。研究对象的抽样:根据“成人在线学习者”的操作定义,采用典型抽样(Typical Sampling),选取拥有全国用户量最大的在线学习平台(“电大在线”)、全国远程高等学历教育学生规模最大的电大系统远程开放教育学员群体。
在线文本语料抽样:首先采用便利抽样(Convenience Sampling),以安徽“电大在线”为目标文本语料来源。该平台数据集的时间跨度为2001年11月8日至当前研究时点2011年3月4日,共约134万条记录,属大样本在线学习文本数据库。然后采用典型抽样,具体选取2010-2011学年度第一学期(2010.9-2011.1)在线教学活动较多的“中国法律思想史”“财务管理”课程社区的交互文本作为研究对象。对目标文本数据作必要的清洗和预处理(噪声数据剔除、特征提取、分类统计、关键字段匹配等)后,共选取132名社区成员的9049条帖子进行相关的测度实验分析。
为提升ROST EA计算结果的解释力,我们将ROST EA值按照Likert 7等级量表方法重新赋值(具体方法见表1),然后再进行后续的数据分析。
(五)研究工具。综合运用中科院计算所研制的汉语词法分析系统ICTCLAS和情感迁移学习系统Sentifier,武汉大学ROST虚拟学习团队研制的内容挖掘系统ROST ContentMining(ROST CM)和情感倾向分析工具ROST Emotion Analysis Tool(ROST EA),海量分词研究版TestSegEx,社会网络分析软件UCINET、NetDraw,社会科学统计分析软件SPSS,DPS数据处理系统,课题组自研的“电大在线”学习行为监控系统、在线学习语料特征提取工具、在线学习领域自定义情感权值词典等,以进行在线交互文本的内容挖掘、情绪倾向性测度以及相关分析。
三、研究结果与分析
(一)情感权值词典的构建与扩展
词语的情绪倾向分析是文本语义情绪倾向性分析的基础工作。基于文本的情绪倾向性信息识别,一般需要拣出目标文本中能够体现情绪倾向的词语,并判断其倾向性的极性和强度,找出所抽取的词语与主题的关系。词语情绪倾向分析目前主要有三种方法:由已有的电子词典或词语知识库扩展生成情绪倾向词典,无监督机器学习的方法,基于人工标注语料库的学习方法[23]。相对而言,利用已有词典比较简便经济。
情感权值词典方法是一种重要的文本语料语气、情绪倾向分类方法,其优点是不需要语料训练集[24]。本研究中承担情感倾向分析软件ROST EA的研发人员,从网络文本语料中筛选出1万多个常用情感词,由三位同行对其平行遍历标注权值,经加权平均后得到每个情感词的权值,进而构建了ROST EA情感权值词典。该词典与程度词词表、常见否定词词表、停用词表、领域用户自定义词表共同构成了ROST EA进行情感计算的重要依据。理论上,源于网络语料的ROST EA情感权值词典,其语料覆盖面可以照应网络教学平台中的文本语料。为增强跨领域移植的适应性,兼顾在线学习文本语料的领域特点,我们以ROST EA情感权值词典为基础权值词典,以在线教学领域文本为目标语料,构建领域用户的情感权值扩展词典(自定义词表)。扩展词典的构建过程主要是:从“电大在线”平台的“课程互动社区”数据库,随机抽取课程讨论文本数据语料1万条,在过滤掉重复帖、广告、纯数字等类型帖后,采用Sentifier和ICTCLAS,对样本语料进行情绪倾向测试分类和词语切分,再人工筛选提取高频特征词310个,参照《现代汉语语法信息词典》(北京大学计算语言学研究所,2000版)进行情绪倾向性权值标注。
为保持算法统一,自定义词表参照ROST EA情感权值词典的倾向性分类标准、权值的范围和标注方法[25],每个情感词对应一个表示情绪倾向性的权值[-20,20],倾向性基元分类为积极情绪、中性情绪和消极情绪。邀请3位在线教学专家(其专业背景为中文、教育学、心理学)平行进行权值标注,经加权平均后,得到了拥有310个情感词的在线教学领域用户扩展权值词典。
在后文的实验中,我们将加载用户扩展词典前后的测试结果,与人工判断结果进行比对,检查计算的正确性,(当用户扩展权值词典与ROST EA权值词典的词语重复时,ROST EA依用户赋予的权值计算)。结果显示,其情绪极性的正确率分别为72.9%、82.7%,情绪强度的准确性分别为68.3%、79.7%。可见,领域用户扩展词典的加入,起着积极的修正作用,可以有效提升ROST EA跨领域应用的适切性和准确性,具有重要的应用价值,利用ROST EA基于情感权值词典进行在线学业情绪倾向性测度可以达到比较高的测评精度。
(二)在线学业情绪倾向测度与社区整体情绪氛围理解。中文文本情感倾向性分析的研究,大致分为词语情感倾向性分析、句子情感倾向性分析、篇章情感倾向性研究、海量信息的整体倾向性预测四个研究层次[26]。根据这个思路,结合在线学习社区文本的语境特点,本研究对在线学业情绪倾向(Online Academic Emotions Tendency,OAET)的测度分为:基于情感权值词典的词语情绪倾向性测度()、每个帖子的文本情绪倾向性测度()、以教学活动或特定时段为单元的每个学习者帖子集的文本情绪倾向性整体测度()、以教学活动或特定时段为单元的所有学习者帖子集的文本情绪倾向性整体测度()。
通过对“电大在线”平台交互语料的统计发现,每个教学活动单元的帖子基本围绕预设的教学章节内容(这也印证设置“中性情绪倾向”的合理性);交互用语既有正式书面语,也有典型的网络词汇;每条记录通常字数有限(平均43个字符),均表达了一个相对完整的意思。因此,对该类型语料进行情绪倾向性测度,不需要刻意考虑上下文的语境,比较适用以词、句情绪倾向为计算单位的ROST EA算法(其算法详见文献[27])。
值已在情感权值词典中标注,运用ROST EA可得各帖(“句子”)情绪倾向值()。在各帖情绪倾向分析的基础上,可以很方便地进行帖子集(“篇章”)的情绪倾向和社区整体倾向性态势分析(、)。、是基于的一种变化,实即以教学活动或特定时段为单元,经数据预处理后,将每个或所有学习者的帖子集分别作为“篇章”,对其中的各种主观性信息(情绪倾向的极性、强度等)进行分析、提取和总体判断,生成“篇章”的情绪链,从而避免数据碎片化,实现对学习者个体或群体的文本情绪倾向性进行整体测度。
以“中国法律思想史”的在线社区交互文本为例。根据上述测度方法,经数据预处理后,以ROST EA为计算工具,加载用户扩展词典后,对目标文本进行情绪倾向性测度。对返回结果,我们可以按照性别、年龄、教学活动单元、特定时间段(如学期初、学期中、学期末,早、中、晚,工作日、双休日)等为单元分类统计和可视化呈现,描述特定时程的情绪状态,揭示情绪强度变化的信息,总结情绪变化的周期性规律。图1、图2呈现的是以时间线为单元的情绪倾向性测度结果。
值为我们追踪个体在线学业情绪倾向性的具体分布,提供了情绪发生的时程表现和细粒度的观测点,为在线学业情绪倾向的监控与调节提供了具体的语境依据。、值则揭示了学习者个体或群体在某个教学活动或特定时段的连续体上情绪倾向的变化情况。因此,我们可以将、分别作为学习者个体情绪倾向性的总体态势、在线学习社区整体情绪氛围的映射指标。
假设上述观测变量与在线学业情绪倾向相关。基于上述研究设计和计算公式,我们对抽样入框学期课程“中国法律思想史”的在线交互语料进行挖掘分析,得到在线学习社区环境因素的标准化解(见表2)及其与在线学业情绪倾向的相关矩阵(见表3)。
心理学研究表明,情绪的启动与起伏变化会受到多种因素的影响。表3显示,在线学业情绪倾向与各观测变量之间存在不同程度的正相关,其中与求知诉求、社会交往诉求和教师支持响应的相关达到显著性水平。这表明前述假设成立,同时也揭示了对在线学业情绪变化有潜在影响的相关因素。
四、结论与讨论
(一)结论
本研究借鉴情感计算这个前沿领域的有关成果,综合运用多种研究方法,构建了情感权值基础词典和在线学习领域专用的情感权值扩展词典,揭示了成人在线学习语料所蕴藏的学业情绪倾向及其相关影响因素,建立了成人在线学业情绪倾向的测度方法和回归模型。
实验结果表明,运用情感权值词典进行学业情绪倾向分类,达到了较高的精度,通过大规模的在线学习语料提炼的在线学习领域用户扩展词典有利于提升测度的精度。相关矩阵(见表3)揭示了在线学业情绪倾向的相关影响因素,映射了在线学习心理与在线学习行为的关联。回归模型解析了相关影响因素的影响力,可以较好地预测在线学业情绪倾向,标准化回归系数bk实即学习社区环境因素对学业情绪倾向的作用系数(见表4),反映了在线学习社区环境对学业情绪倾向的影响力大小。
(二)讨论
1.根据相关矩阵、回归模型和标准化回归系数,可以获得对在线学业情绪进行监控、干预和调节的相关切入点。网络虚拟学习环境以及在其中开展学习的学习共同体,是在线学习社区的核心组成要素。学习者个体的在线学习投入、求知诉求、社会交往诉求以及教师的支持响应,都会对学习社区的整体情绪氛围、整体网络密度和社区黏度(Stickiness)产生直接的影响。其中,学习投入的平均水平(即社区的人均访问次数、人均参与教学活动次数、人均有效在线时长、人均发帖量、人均有效帖数、人均帖子容量或长度等),既清晰地表征了学习社区的黏度,也映射了学习者个体及共同体的学习韧性。对学习投入水平偏低、处于观望者角色、学业情绪倾向比较消极的学习者,要及时干预和引导。通过持续提升教师的支持响应水平,不断满足学习者个性化的求知诉求、社会交往诉求,可以有效提升在线学习社区的知识性黏度和社会性黏度,进而提升社区黏度和社区网络密度,调节社区整体情绪氛围和情绪倾向,促进师生双方在情绪交流中的相互理解和在线学习者的学习绩效。
2.成人在线学业情绪倾向测度研究,对成人在线学习心理与行为的监控与评价,具有重要的实践意义,为构建人机和谐的交互环境、改进在线教学、促进学业完成,提供了学业情绪方面的研究支持。基于网络的在线学习环境容易使学习者缺乏归属感、产生孤独感,因此远程教育院校需要加强对学习者在线学业情绪的管理,充分利用在线交互文本中蕴藏的学业情绪信息,挖掘在线学业情绪变化的周期性规律,重点关注负面的、消极的学业情绪对学习进程的影响。当然,研究者需要注重情绪倾向评价的伦理道德。在情绪倾向评价的过程中,一定要尊重学习者的个人权利和个人隐私,同时要正确认识学业情绪和学业绩效的关系,不能简单地认为:学业情绪倾向积极的必定是学业成功的学习者,学业情绪倾向消极的必然是学业失败的学习者。
3.文本情感倾向性分析是一个极具研究价值和应用价值的新兴研究方向,受到国内外越来越多的研究机构的重视,目前比较多的应用于面向在线新闻评论和产品评论的舆情监控和意见挖掘[36][37]。本研究为这个新兴研究方向贡献了成人在线学习领域的应用探索,所建立的基于情感权值词典的在线学业情绪倾向测度方法,期待能为今后同类研究提供一种可资借鉴的技术路线、测度框架和参考案例。当然,面向新兴方向的研究方法,还需要在实践中不断检验和完善。我们拟在后续研究中,从以下四个方面对该方法进行检验和完善:(1)对不同学科专业的在线学习活动纪录文本语料,进行学业情绪倾向的大样本测度实验,为测度方法的验证与改进提供实证依据;(2)修订完善ROST EA情感权值基础词典,进一步筛选和扩展种子词的词性与数量,优化情感词典的权值标注精度和情绪倾向性的强度分段阈值,以提高情绪倾向的测度精度;(3)修订完善在线学习领域专用的情感权值扩展词典(自定义词表),以进一步增强ROST EA跨领域应用的适应性和准确性;(4)优化ROST EA的算法,以进一步增强对词组搭配、疑问句式、语篇语境的理解能力和计算精度。与此同时,我们将密切关注网络语言的最新变化,积极借鉴中文自然语言处理、信息检索、情感计算等人工智能技术的最新成果。经过上述严谨的后续工作,本研究建立的测度方法,将会获得不断趋优的测度精度,进而能够为在线学业情绪的监控与调节提供更精细的参考依据。
(本研究得到武汉大学信息管理学院沈阳教授及其ROST虚拟学习团队的ROST EA软件支持,谨此致谢。)