语音超文本系统中锚点标记方式的比较研究,本文主要内容关键词为:超文本论文,标记论文,语音论文,方式论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
语音超文本系统中常见的超链接锚点标记方式包括言语相关标记与非言语相关标记两种[1~3]。言语相关标记是通过增加提示词或改变链接词的其它语音属性对锚点进行标记的方式,它主要包括语言学线索(linguistic cues)标记、语音质量的改变(voice quality changes)和多重语音(multiple voices)标记三种。语言学线索标记是通过增加提示词突显超链接锚点的标记方式。如,在Productivity Works的WS系统中每个超链接锚点前都呈现提示词“链接”[2]。语音质量的改变是借助语音特性(如音量)的变化突显超链接锚点的一种标记方式。多重语音标记是在语音暗示假设(the voice connotation hypothesis)基础上发展起来的,它是运用言语者转换(如男女声转换)对超文本结构进行表征的一种超链接标记方式。非言语相关标记是通过增加非言语信号突显超链接锚点的标记方式,其标记信号包括听标和耳标两种。James在她的AHA系统中采用非言语信号标记超链接锚点,这是采用非言语相关标记的典型系统”[1]。目前的语音超文本系统中,非言语信号相对于超链接锚点呈现的时相存在三种类型:非言语声音前置于超链接锚点呈现、非言语声音与超链接锚点同时呈现和非言语声音后置于超链接锚点呈现。James等人在其实验中要求用户对三种标记方式进行评价,结果发现,多数用户更喜欢使用非言语声音与超链接锚点同时呈现的方式[4]。Morley等人运用五点量表对三种呈现方式的主观偏好的研究也得出了一致的结论[5]。
James对言语相关标记与非言语相关标记在语音超文本系统中的应用开展的一系列初步研究指出,两种标记方式均可用于语音超文本中的信息表征,但其适用的表征对象有所差异。言语相关标记适用于表征语音超链接锚点,而非言语相关标记则更适用于表征语音超文本的整体结构[1,4,6~8]。Walshe等人提出了适用于盲人用户的语音超文本系统[9]。在该系统中,他们采用树状结构表征信息,并用听觉耳标区分信息树上不同层次的信息。另有研究表明,虽然言语相关标记有助于提高对超链接锚点的检测概率,但它同时会降低句子的可懂度,因此采用听标或者耳标这些非言语相关标记表征语音超链接更为合适[5]。
Bronstad等人以检测正确率和反应时为指标,比较了在随机数字系列中增加提示词“链接”突显超链接锚点(言语相关标记)和以“嘟”声与超链接锚点同时呈现(非言语相关标记)两种标记方式下的作业绩效,结果表明后者优于前者[10];他们的另一项研究结果表明,在表征语音超文本系统的结构时,非言语声音线索优于言语表征[11]。然而,他们的实验材料为无意义的随机数字和单词序列,这与实用的语音超文本系统相距甚远,由此影响研究的外部效度。Wang等人比较了男女声变调标记和声音加重两种言语相关标记方式下的链接词检测率和句子理解绩效,结果显示,前者的链接词检测率高于后者;两种标记方式下对句子的理解绩效均较无标记句子条件产生明显下降,但两者间的差异不显著“[12]。白金华对三种非言语声音标记方式及标记声与链接词所含元素的相对时相进行了研究,结果表明,三种标记方式中尾字标记方式的绩效最佳,全词标记方式次之,首字标记最差;上述标记方式对句子的理解均无显著影响[13]。
现有对于语音超链接锚点标记方式的研究大多属于粗略的主观评价研究,且研究结果并不一致。笔者认为,不同标记方式工效的比较应以特定的标记方式中对其设计参数的优化研究为前提。因此,本实验以链接词的检测率、句子理解和主观评价为指标,综合考察尾字标记和全词标记(非言语相关标记)方式与男女声变调标记(言语相关标记)方式对于作业绩效的影响,旨在为语音超文本系统的设计提供工效学依据。
2 方法
2.1 被试
被试为18名浙江大学非语言专业的在校本科生或研究生,男女各半,年龄在21~26岁之间,听力正常,裸眼视力或矫正视力在1.0以上,均未参加过类似实验。
2.2 实验材料
实验的阅读材料取自汉语水平考试(HSK)听力测验,初选出长度适中(20到40字)的300个陈述句(如“她总嫌我回家晚,今天只好破例请假早回家一会。”)及与其对应的理解测试题目(如:“说话人以前是不是请过假?A请过一次假;B请过多次假;C没请过假;D不用请假”)。由45名非语言专业的在校本科生完成阅读理解作业,并对所选句子的难度以五点量表进行评价。在理解正确率为60%以上的句子中,删除主观评分在2.0以下(难度过低)或4.0以上(难度过高)的句子,共入选130句。入选句子均由杭州电视台新闻栏目的专业播音员录制。在每个陈述句中选取一个名词或动词词性的两字词作为链接词,再从该句中选取另两个两字词作干扰词,用以检测被试能否正确识别链接词(如“刚才出现的话中,具有特殊标记的词是:A回家;B破例;C今天”)。链接词在句子中的位置有前、中、后三种。以Cool Edit软件合成标记声与链接词或男女混合声,形成三种测试材料:(1)标记声与被标记的链接词的尾字同时呈现,且持续100ms(尾字100ms);(2)标记声与被标记的链接词的首字同时呈现,且持续至尾字发音结束(全词);(3)在以男声呈现的句子中,链接词用女声替换(男女声)。
130句材料中10句用于预备实验,120句用于正式实验。正式实验采用的句子分为三组,每组含40句。三组句子分别在链接词在句子中的位置、句子长短及其难易程度上进行平衡。
2.3 实验装置
本实验的主要装置由P4兼容计算机和立体声耳机构成。屏幕分辨率为1024像素×768像素。语音材料的平均声强约为82.5dB,范围约为80~85dB;标记声“嘟”采用频率为2000Hz的纯音,其平均声强约为80.6dB。实验环境采用日光灯照明,桌面照度为:265lux,测试问题以黑底白字方式呈现。白字的亮度为64.7cd/m2,黑色背景的亮度为2.8cd/m2。
2.4 实验设计与程序
实验采用被试者内设计,全词、尾字100ms和男女声三组句子构成三种实验条件。以拉丁方平衡实验顺序,每种条件下,各句子的呈现顺序做随机安排。
实验的流程如图1所示,每次试验先呈现一个频率为1000Hz,延时500ms的纯音信号,然后播放由播音员朗诵的句子。句子结束后,屏幕上将立即显示检测被试能否正确识别链接词的问题1,要求被试以相应的字符键做反应,随后屏幕将呈现检测句子理解程度的问题2,要求被试按键作答。若被试在15s内未能完成按键反应,则将本次试验记为错误。
实验前每位被试先进行训练。正式实验分两节,每节包含60次试验,两节实验间休息10分钟,整个实验约需一小时。实验结束后,要求被试从三个维度分别以五点量表进行主观评价。三个维度分别为喜好程度(1表示很不喜欢,5表示非常喜欢)、影响句子理解的程度(1表示完全不影响,5表示影响极大)和链接词检测的难易程度(1表示极难觉察,5表示极易觉察)。
图1 实验流程
3 结果
3.1 不同标记方式对作业绩效的影响
图2为被试对不同标记方式下链接词的检测率。对三种标记方式下链接词检测率的方差分析表明,三种标记方式下链接词的检测率存在显著差异(F(2,34)=47.21,p<0.01)。对各标记方式平均数差异的q检验表明,在链接词为两字词时,男女声标记方式的检测率明显高于全词标记(p<0.01)与尾字100ms(p<0.01)方式,全词标记与尾字100ms之间无显著差异(p>0.05)。
图2 不同标记方式下链接词的检测率
图3 不同标记方式下句子理解的正确率
不同标记方式对句子理解的影响如图3所示。从3图中可以看出,不同标记方式下被试对句子理解的正确率均较高(高于84%)。方差分析表明,不同标记方式对句子理解无显著影响(F(2,34)=1.66,p>0.05)。
3.2 链接词在句中的位置对绩效的影响
不同标记方式下链接词的检测率及句子理解的平均正确率的位置效应见图4和图5。
图4 不同位置的链接词检测率
图5 不同位置的句子理解正确率
方差分析的结果表明,尾字标记与全词标记方式下,链接词检测率均出现目标位置效应(尾字标记:F(2,34)=13.37,p<0.01),全词标记:F(2,34)=6.13,p<0.01);男女声标记方式下,链接词检测率不存在目标位置效应(F(2,34)=0.54,p>0.05)。对尾字方式和全词方式目标位置效应分别进行q检验的结果表明,尾字标记方式下,中部与后部位置的链接词检测率均高于前部(p<0.01),但两者间无显著差异(p>0.05);全词标记方式下,前部绩效明显低于后部(p<0.01),中部与后部和前部差异均不显著(p>0.05),即后部位置绩效最高,其次是中部,前部最差。
方差分析的结果表明,三种标记方式下链接词的位置对于句子理解的影响均未达到显著水平(全词标记:F(2,34)=0.92,p>0.05;男女声标记:F(2,34)=1.89,p>0.05;尾字标记:F(2,34)=2.65,p>0.05)。
3.3 主观评价
图6 为被试对三种链接词标记方式的主观评价结果。方差分析表明,标记方式对三种主观评价指标均存在显著影响(喜好程度:F(2,34)=20.04,p<0.01;句子理解:F(2,34)=4.36,p<0.05;链接词检测:F(2,34)=5.79,p<0.01)。进一步的q检验结果表明,被试对男女声标记方式的喜好程度明显优于全词标记与尾字标记方式(p<0.01),而全词标记与尾字标记方式无显著差异(p>0.05);男女声标记方式下对链接词的检测明显易于尾字标记方式(p<0.01),但与全词标记差异不显著(p>0.05);男女声标记对句子理解的影响显著低于尾字标记(p<0.01),但与全词标记也未出现显著差异(p>0.05)。
图6 主观评价结果
4 讨论
4.1 不同标记方式下的信息加工
James曾用主观评价法对言语相关标记(男女声变调)方式与非言语相关标记(耳标和听标与链接词同时呈现)方式进行比较,结果显示,男女声变调方式优于非言语相关标记。她认为,这可以用语音暗示假设加以解释[8]。语音暗示假设认为,言语加工并不仅仅是一种离散的符号加工过程[14]。个体在对言语内容进行抽象加工的同时,能自动提取某些语言学线索之外的(extra-linguistic)伴随信息(如言语者、性别信息等)。这些伴随特征信息的加工是以内隐的方式进行的,并不占用认知资源[15~18]。
本研究发现,男女声变调标记的链接词检测率显著优于全词标记与尾字100ms标记方式。笔者认为,在非言语相关标记方式下,标记信号与链接词同时呈现可能产生声音位移现象,即短语作为一个“意义单元”以整体的方式进行加工。受认知资源容量的限制,被试在对短语语义加工时无法对同时呈现的非言语声进行平行加工,从而导致其把非言语声知觉为在短语之前或之后呈现[19],从而降低了被试对链接词检测的正确率;在男女声变调标记方式下,根据语音暗示假设,被试在对句中链接词内容加工的同时,自动提取了朗诵者的性别信息,形成对链接词的识别,这无需额外的加工资源,从而产生了男女声变调标记方式优于全词与尾字标记两种非言语相关标记方式的结果。
这一结果用于指导语音超文本设计时应当慎重。首先,在本实验中被试将全部注意资源用于完成任务,这与日常生活中的情形有较大差别。其次,许多研究认为,非言语相关标记具有明显的学习效应,用户的作业绩效会随使用时间的增加而明显提高[4]。笔者认为,所有被试均为新手可能是造成非言语相关标记条件下绩效较差的原因之一。再次,本实验中采用的语音超链接锚点文字均为双字词。当语音超链接锚点文字增多时,情况是否如此尚需进一步研究。因此不能根据上述结果简单地推论出在听觉超文本界面设计中不能采用非言语相关标记。
4.2 不同标记方式下链接词在句中的位置对绩效的影响
本研究分析了不同标记方式下链接词的位置效应。结果发现,三种标记方式条件下在句子理解指标上均未产生目标位置效应;男女声标记方式下被试对链接词检测不存在目标位置效应;尾字标记和全词标记方式下链接词在句子前部时的检测率均明显低于后部,尾字标记方式下中部和后部的链接词检测率无显著差异,而全词标记方式下后部的链接词检测率高于中部。
笔者认为,这可能是由于被试在完成链接词检测与句子理解双重任务时,更倾向于采取在保证句子理解的基础上检测链接词的策略。不同标记方式在链接词检测指标上发生的目标位置效应差别可以用认知资源分配和声音位移效应加以解释。Huguenard和Lerch曾对用户使用语音界面时的认知资源分配进行分析。结果表明,对语音信息呈现进程的跟踪占用大量的认知资源[20]。实验中,被试为保证对句子的理解需实时监控语音呈现进程,占用较多的认知资源,此时分配于链接词检测的资源相对较少。采用男女声标记方式时,由于对链接词的检测占用被试的认知资源较少,有助于句子前部和中部的链接词在长时记忆中的存储加工,因而未发现目标位置效应。采用尾宇和全词标记方式时,被试对链接词的检测需占用的认知资源较多,并且可能存在前述的声音位移现象,从而提高了对句子前部和中部的链接词记忆储存加工的难度,导致目标位置效应产生。同理,由于声音位移现象的存在,也导致了尾字标记方式与全词标记方式在目标位置效应上的差别。
笔者认为,在语音超链接标记方式的设计中,对标记方式的选择应慎重考虑标记词的呈现位置,在被标记词大多处于句子前部的系统中,推荐选用男女声标记方式。
5 结论
本实验通过对尾字标记和全词标记两种非言语相关标记方式与男女声变调的言语相关标记方式的工效学比较,主要获得以下结果:
5.1 男女声变调的言语相关标记方式下对链接词的检测率高于全词标记和尾字标记两种非言语相关标记方式,但上述三种标记方式对句子理解均无显著影响。
5.2 采用非言语相关标记时,链接词在句中的位置显著影响其检测率。尾字标记方式下,链接词处于句子中部和后部的检测率显著高于前部;全词标记方式下,后部位置绩效最高,中部次之,前部最差。
5.3 主观评价显示,男女声变调标记方式最佳,其次是全词标记方式,尾字标记方式最差。
根据本实验的结果,笔者推荐男女声变调标记可作为语音超文本链接词标记的首选方式。