听音识人——语音频谱与人格特质的关系初探,本文主要内容关键词为:频谱论文,特质论文,人格论文,语音论文,关系论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 B842;B848
1 前言
达尔文在他的经典名著《人类和动物的情绪表达》中说:“对许多动物(包括人类)来说,发音器官是表达情绪的最有效的工具之一”(Darwin,Ekman,& Prodger,2002)。牛、猪、狐猴等哺乳动物的语音中都包含情绪成分(Düpjan,Schn,Puppe,Tuchscherer,& Manteuffel,2008;Watts & Stookey,2000;Zimmermann,2009)。我们可以通过语音的声学特征来知觉说话人的情绪状态(Johnson,Emde,Scherer,& Klinnert,1986;Simon-Thomas,Keltner,Sauter,Sinicropi-Yao,& Abramson,2009)。“声学特征(基频,语音持续时间,共振峰频率)足以交流大量的情绪信息”(Dmitrieva,Gelman,Zaitseva,& Orlov,2008)。有些研究者甚至认为音乐之所以有情绪感染力,就是因为它和人的语音在声学结构上相似(Juslin & Laukka,2003)。
声音似乎不止于传达情绪。文学作品中出现的情绪化语音,常与人物性格有关(袁行霈,2003)。正如不同乐器因其音色而被听众赋予不同性格特质(Payne,2010);人也会因其言语特质(清晰度、流利度)而被听者做出不同的人格特质评判(Stagner,1936)。语音的响度会影响听者对说话人外倾性的认知(Scherer,1978);语音的速度也会影响异性伴侣认知说话者的人格,女性倾向于认为说话速度快的男人更加开放、外向(Gocsál,2009);应聘者的言语特征会影响面试官对他们人格的评价,进而影响面试成绩(DeGroot & Gooty,2009)。公司职员的语音吸引力与他的宜人性和责任感也有关系,最终影响他(她)的工作表现(DeGroot & Kluemper,2007);甚至有研究表明,从言语的韵律特征评判说话人的大五人格有一定准确性,即使听者不懂说话人的语言(Mohammadi,Vinciarelli,& Mortillaro,2010)。
总之,在许多人观念中,语音特征能够反映人格特质。但很少有研究去证实或证伪这一观念。虽然有研究发现:不同说话类型(响亮-快/响亮-慢/轻柔-快/轻柔-慢)的人在16PF人格特质量表和明尼苏达人格特质量表上的得分都有显著差异(Markel,Phillis,Vargas,&Howard,1972)。但因为语言内容本身的复杂性,说话的速度、响度容易被人有意操纵、进行掩饰;相比而言,言语中单个音节的声学特质比较稳定,是人从小学习发音时养成的模式,有些特质甚至能延续一生(吴宗济,林茂灿,1989)。因此,本研究试图揭示单个音节的声学特质与人格特质的关系。研究人单音节的声学特质在不同情绪状态和不同人格个体间的差异,对人机交互和机器仿真语音的发展都有帮助,并且能证明或证伪人们“听音识人”的观念。
2 研究方法
2.1 实验设计
被试接受人格测验,然后听电脑报告虚假的人格测验结果(积极的或消极的),并对每条虚假报告口头回答“是”或“不是”反馈自己是否同意,并在电脑上按键描述自己听到此条人格测验结果的情绪状态。按照情绪的维度理论,将情绪状态分为“中性”、“积极”和“消极”三类(斯托曼,1986)。人格测验选用国际通用的信度和效度已被大量研究证实(Conn,Rieke,Personality,&Testing,1998)的卡特尔16PF人格特质中文版量表,其16种人格特质分别是:A:乐群性,B:聪慧性,C:情绪稳定性,E:恃强性,F:兴奋性,G:有恒性,H:敢为性,I:敏感性,L:怀疑性,M:幻想性,N:世故性,O:忧虑性,Q1:激进性,Q2:独立性,Q3:自律性,Q4:紧张性。情绪状态采用被试主观报告:1—“积极”、2—“平静”、3—“消极”。语音频谱指标用Praat 5.1.30语音软件分析录音“是”和“不是”,取前三个共振峰的频率和波段:F1:第一共振峰频率,F2:第二共振峰频率,F3:第三共振峰频率,B1:第一共振峰波段,B2:第二共振峰波段,B3:第三共振峰波段。共振峰是人类语音中传递信息的重要成分,已有的研究证明共振峰足以传递大量的情绪信息(Dmitrieva,Ge1man,Zaitseva,& Orlov,2008)。所以,我们选择上述频谱参数进行研究。选择语音“是”,是因为它们在日常生活中出现的频率很高,其频谱参数更能反映说话人习惯化的发音模式,研究的潜在应用价值也更大。
2.2 被试
共有45个志愿者(20男,25女)参加实验,年龄在18~23岁之间,均为在校大学生,普通话标准清晰。在这之前,他们都没有参加过16PF人格测评。
2.3 材料
16PF人格测验软件,装有录音声卡的电脑,录音话筒,Praat 5.1.30语音分析软件。
2.4 实验过程
实验前被试填写了知情同意书,主试向被试保证实验不带任何伤害和人身攻击,被试可在实验的任何时间自愿退出。
实验在安静的实验室里进行,被试单独在电脑上完成卡特尔16PF人格测验,然后在实验室外休息10分钟。然后,主试回来告诉被试人格测验结果已经分析好,请被试回到实验室里听测评结果报告,并给予反馈。
为了防止主试效应,报告由电脑上安装的Word朗读软件朗读。所有被试听到的都是一模一样的虚假人格测评结果。报告的内容包括:1)不包含人格测验结果的无关问题,例如:“您是本科生/理科生吗?”;2)虚假的积极结果,例如:“测验结果显示,您的逻辑推理能力/言语理解能力很强,您觉得是这样吗?”3)虚假的消极结果,例如:“测验结果显示,您的虚荣心很强/情商很低,您觉得是这样吗?”被试只需对话筒回答“是”或“不是”,并按数字键回答自己听到结果时的情绪状态:1—“积极”、2—“平静”、3—“消极”、4—“不确定”。每类问题6个,混合在一起随机呈现。整个报告不超过10分钟。
报告结束后,立即向被试说明真相,讲清实验的设计和目的。所有被试都理解了我们的实验,并且觉得有趣,离开实验室时不带任何负面情绪。
3 结果
实验共记录到569个包含/Sh/辅音的回答,其中:中性情绪状态下,有37个被试(14男,23女)回答了188个“是”;24个被试(10男,14女)回答了71个“不是”;积极情绪状态下,有40个被试(16男,24女)回答了116个“是”,13个被试(6男,7女)回答了22个“不是”;消极情绪状态下,有25个被试(11男,14女)回答了56个“是”,32个被试(13男,19女)回答了116个“不是”。
被试回答“是”时的元音音节/i/常常被省略,很难清晰地划分出/i/音节片段,所以本研究只分析“是”和“不是”中的辅音/Sh/的前三个共振峰的频率(F1、F2、F3)和波段(B1、B2、B3)。
独立样本t检验结果显示:男女被试组在所有语音参数上均无显著差异,t的绝对值最大是1.83,p值最小是0.07。因此,后继分析不再考虑性别因素。
配对样本t检验结果显示:“是”和“不是”的辅音频谱在第一共振峰频率上差异显著,t=3.03,p=0.004;第二共振峰频率上差异边缘显著,t=1.88,p=0.067。因此,后继研究将区分肯定回答“是”和否定回答“不是”两种反应类型。
3.1 被试16PF人格特质分数总体分布
所有被试的16PF人格特质标准分的均值、标准差见表1。从表1可见被试组的人格特质分数分布没有太大异常,说明本研究的结果适用于正常人群。
3.2 情绪在频谱参数上的效应
将被试积极情绪状态下回答“是”的辅音频谱参数减去中性情绪状态下回答“是”的辅音频谱参数,得到33个被试的积极情绪状态频谱参数变化量,然后与0进行t检验,结果见表2。从表2可见积极情绪的效应在肯定回答“是”的辅音第一和第三共振峰的频率变化量上显著。
皮尔逊相关分析结果发现积极情绪状态下的第一共振峰频率变化量与敢为性(H)显著负相关(r=-0.367,p<0.05);第一共振峰的波段变化量与情绪稳定性(C)显著正相关(r=0.423,p<0.05)。
其它条件下可配对的被试数量都不足(N<16),没有进行分析。
3.3 频谱参数与人格特质分数的相关
不同条件下频谱参数与人格特质的相关见表3。
积极情绪状态下回答“不是”的被试只有13个,所以没有做相关分析。
4 讨论
如前所述,虽然人们认为语音特征能够反映人格特质。但以往很少有这方面的实证研究,仅有少量的研究也只关注超音段特征如语调、语气,极少有人研究语音频谱参数与人格特质的关系。这是因为一般认为语音频谱主要由人发音器官的先天生理结构决定(Ladefoged & Johnson,2010)。但也有研究表明:歌手的表现是否出色与其共振峰参数有关(Schutte,et al.,1995),演员的共振峰参数也与平常人有显著差异(Bele,2006)。这些现象说明:语音频谱参数可以被后天经验改变,并不完全由先天生理结构决定。本研究仅使用单个音节“是”的辅音/Sh/的声学特质,就揭示出多个人格特质与语音参数存在显著的相关关系(具体见表3)。而Nesic的研究发现人在平静状态下说元音字母/a/和/i/的基频和他的TPQ测验结果伤害—躲避、奖赏—依赖分数存在显著正相关,和新异—寻求分数存在显著负相关(Nesic,1998)。这表明人格与语音(不论是辅音还是元音)很可能蕴含着密切的关系,听音识人是存在心理学依据的现象。这一结果也与“音乐系学生的人格特质与其偏好的乐器的音色有显著相关性”的研究结果相吻合(Payne,2010)。
本研究结果显示积极情绪在肯定回答“是”的第一个音素/Sh/的频谱参数上效应显著,而该音素的平均时长是0.14秒,说明情绪效应的发生非常快。此外,语音频谱参数的变化量与情绪稳定性(C)和敢为性(H)都有显著相关;表3显示与频谱参数有显著相关的人格特质主要集中在敢为性(H)、敏感性(I)上。有研究认为这些特质与个体的人际交往行为和情绪有密切关系(Conn,et al.,1998)。上述现象很可能是语音的情绪易感性和人际交往功能决定的:在个体成长、社会化的过程中,人格特征和语音频谱特征逐渐形成,不同个性的人偏好不同的“演奏”方式。语音特质和人格特质的相关性很可能是人个性偏好选择的结果;就像歌手、演员偏好不同的发音方式,与常人有不同的共振峰参数,而且这些参数都可以经过长期训练改变(Bele,2006;Schutte,et al.,1995)。敏感性高的人在中性情绪状态下偏好低频的共振峰发音,敢为性高的人在中性情绪状态和积极情绪状态下偏好更低的共振峰频率和波段。个体的情绪变化特点,人际交往中的情绪控制、表达特点更可能影响语音频谱。此外,呼吸、胸腔和声门肌肉的收缩等生理过程对人类的语音特征都有影响(Juslin & Laukka,2003),人格特质也可能经由这些生理过程间接地影响语音的频谱特征。
表3的结果还显示不同情绪状态和不同回答类型下的语音频谱参数与人格特质的相关不一样,这表明语音频谱与人格特质的关系并不简单,因此要真正揭示两者的关系还需要进一步系统操作和精确地控制有关的变量和影响因素。例如:本研究中使用虚假人格测评结果反馈操作被试情绪状态,被试按实验预期报告“积极”、“消极”的比例不高(报告积极结果时,被试按键选择“积极”的比例是58.1%;报告消极结果时,被试按键选择“消极”的比例是65.6%),这种情绪的口头报告法虽然为不少研究所采用,但其客观准确性一直存在争议(Robinson & Clore,2002),因此未来的研究需要更客观准确的情绪测量方法。
总之,本研究运用单一的语音“是”中的辅音就初步揭示语音频谱与人格特质存在一定的关系,虽然本研究所揭示的相关还是零散的,但它预示着通过进一步的系统研究破解听音识人的规律是有可能的,这是令人欣喜的。据我们所能了解到的,这是第一篇报告不同情绪状态下语音频谱参数与人格特质关系的文章。随着当代录音技术的发展,记录人们自然状态下的语音越来越容易;而计算机运算能力和软件技术的发展都允许对大量的语音样本进行系统的分类和研究,探究语音频谱与说话者情绪、人格之间的关系,就变得越来越具有理论意义和实用价值。理论上,相关研究有助于促进对情绪和人格发展的理解,甚至提出新的理论;应用上,语音与人格、情绪的关系研究将促进人格与情绪测评更加客观正确与方便,有助于听众或人机交互中的电脑了解说话者的心理状态和个性特征,有助于人机交互和机器仿真技术的发展。