网络音频信息检索的用户行为研究_信息检索论文

网络音频信息检索的用户行为研究,本文主要内容关键词为:信息检索论文,音频论文,用户论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

目前,网络上有大量的音频信息资源。据CNNIC“第31次中国互联网络发展状况统计报告”显示,截至2012年底,网络音乐用户规模为43 586万,网民中上网收听音乐的用户比例达到77.3%[1],网络音乐服务成为用户经常使用的一种服务,那么目前音频搜索引擎能否满足用户对各种音频信息的需求?用户采用何种策略检索音频资源?这是本文所关注的问题。

研究者对音频检索用户信息行为的探讨主要从两方面开展:一方面,通过问卷调查的方式了解用户的音频检索行为,如Lee和Downie问卷调查了解了用户的音乐需求、应用和检索/浏览模式[2];Lee和Waterman通过问卷进一步调查了用户如何应用目前已有的音乐服务,并分析了用户喜欢的原因[3]。另一方面,研究特殊群体或是专题网站的用户信息行为,如Lai和Chan调研了244名香港浸会大学音乐图书馆的用户,了解他们的需求、使用模式和偏好[4];Maguire等人在音乐项目实验调研访问时发现,改善用户界面是提高音乐数字博物馆访问的最佳方式[5]。国内还未见对音频信息检索行为的研究报道,本文采用实验和行为观测相结合的方法,采集并提取用户在Internet环境下检索音频信息过程中的行为和动作,从关键行为分布和过程状态的转移两个方面考察音频信息检索过程中的行为方式和行为规律,研究用户在音频检索过程中使用的检索策略,并从心理学角度分析其原因。

2 研究设计及过程

2.1 研究过程

本研究在真实的Internet环境下进行用户实验,使用行为观测技术和内容分析法,研究普通用户在网络音频信息检索过程中的关键行为的一般特征。主要过程如下:

(1)征集被试者:笔者在某一全校公选课上征集被试者,利用实验课上机时间要求被试者以自然的搜索方式尽快而准确地完成4个网络音频信息检索任务,不限定任务完成的时间,可以随时选择继续或放弃。

(2)录制检索行为:利用屏幕录像软件Camstasia Studio实时录制被试的音频信息检索行为,每个音频检索任务单独录制,最终每个被试者生成4个.mp4格式的视频文件。

(3)数据分析:收集被试的视频资料,回放每个视频,采集行为样本中的关键行为,按时间顺序进行编码记录、归纳统计,讨论音频信息检索的一般行为特征和规律。

2.2 检索任务的设计

前期笔者对某一全校公选课的200名同学做了“网络音频资源的信息检索需求”问卷调查。结果显示,全体同学都有检索音频信息的经历,其中71.2%的同学为了娱乐搜索音乐信息,25.7%的同学表示会为了某个场合(比如婚礼庆典)或某种学习需要(比如备课)检索音频信息,比如伴奏、朗诵等。另外,还有同学表示会根据心情来搜索不同的音乐。

因此,笔者充分考虑了日常生活中音频信息检索的情境需求,设计了4种类型的检索任务:(1)歌曲检索:搜索“中国好声音”节目歌手平安唱的歌曲;(2)表达情绪的音乐检索:搜索一首能够表达心情喜悦的音乐;(3)课堂教学音频检索:搜索朱自清《春》的配乐朗诵;(4)伴奏检索:搜索儿歌《春天在哪里》的伴奏音乐。4个任务涵盖了生活中不同的需求,经过预测试5人次,均具有一定的搜索广度和深度。

53位日常生活中经常进行网络音频信息搜索的本科生参与了正式实验,最终采集到有效搜索过程行为样本207个(其中在第4个任务中因操作失误有5个样本没有完整记录)。

2.3 关键行为定义

关键行为的定义是本研究的基础。研究参照了Fukumoto的行为定义[6],结合当前音频信息检索工具的界面特点,最终定义了3大类8种关键行为(如表1所示)。根据表1定义,对207个行为过程中的关键行为进行识别并编码,将结果集保存在Excel中。

3 研究结果

3.1 检索行为的总体分布情况

本研究对音频信息检索行为编码后的所有样本进行统计,表2给出了关键行为的出现频次和每个过程平均出现的频次。每个音频检索过程中发生的关键行为平均有6.97个,最多的是更换提问式,平均每个过程要更换1.75次。从统计结果来看,被试者更多地选择与音频有关的某一检索入口进行搜索,更换检索入口的行为较少发生,选择网页搜索引擎来浏览网页列表或点击网页结果的情况也很少,反映了检索音频的某些定势心理。另外,音频下载频次为1,说明用户能够正确保存音频信息。下面,笔者进一步考察了初始检索入口、检索入口与提问式的更换等关键检索行为。

3.2 音频检索入口

音频检索入口是用户有检索提问行为发生的网页页面,本文考察了初始检索入口和后续检索入口。初始检索入口是用户第一次检索音频信息时所在的网页页面,后续检索入口是用户在检索过程调整时有检索提问行为的页面,不包括通过检索结果进入音频来源网站浏览的情况。实验过程中观察到的初始检索入口如表3所示。被试者检索音频信息主要有三种途径:专业音频搜索引擎(35.8%)、网页搜索引擎(33.8%)和专业音频客户端软件(33.8%)。61.4%的被试者选择百度搜索引擎,其中,32.4%的被试者选择百度的音乐专题搜索,29%的被试者使用百度的网页搜索音频信息,因此,百度成为用户最常用的搜索引擎。笔者进一步考察了被试者使用搜索引擎的行为,发现被试者习惯使用浏览器设置的默认导航页面,比如hao360网址导航页面、搜狗网址导航页面、hao123导航等,这些导航页面都嵌入了多个搜索引擎入口,有80人次(63%)选择这些页面中嵌入的百度搜索引擎入口进行检索,仅有47人次在浏览器窗口中直接输入百度网址,26人次选择百度网页入口检索,21人次选择百度音乐入口检索。由此可见,网址导航页面能够给用户检索信息提供极大的便利性,能够缩短检索的时间,提高检索效率,这可能是被试者喜欢采用网址导航网站的原因。

用户在初始检索界面输入检索词查询未果时,会做出调整,选择其他检索入口。笔者考察了后续检索入口,只有56人次调整了检索工具,67.8%的人在选择百度音乐没有搜索到满意结果时调整到百度网页搜索,19.6%的人从其他检索工具调整到百度音乐搜索,另外,还有调整为音频客户端软件、搜狗音乐搜索引擎、音频专题网站(5sing.com、wo99.com等)。总的来看,在整个检索过程中,共有135人次(65.2%)使用百度搜索引擎检索到满意的音频信息,百度成为用户检索音频资源的有效工具。

3.3 四类任务检索入口比较

上述的音频检索入口与曹梅研究的图像检索入口[7]有所不同,同为多媒体信息检索,曹梅研究的89个有效过程样本中,首次检索入口使用图像搜索引擎的有97%,Google图片占59%,百度图片占38%。而音频检索入口中音频搜索引擎仅占35.8%,所以有必要进一步研究音频检索工具使用多样化的原因,笔者分别对四类任务的检索入口进行了统计,这些检索入口是检索到满意结果的入口,结果如表4所示。

任务1是搜索一名歌手唱的歌曲,被试者使用的检索工具比较一致,84.9%的被试者选择了专用的音频检索工具:45.3%的被试者选择了百度音乐搜索,39.6%的选择了音频客户端软件;任务2是搜索表达心情喜悦的音乐,75.5%的被试者选了专用的音频检索工具,并且56.6%的人选择了直接输入自己喜欢的能够表达心情喜悦的歌曲进行查找;任务3是搜索《春》的朗诵,与前两个任务不同,75.4%的被试者选择了百度网页搜索引擎;任务4是搜索儿歌《春天在哪里》的伴奏,52.1%的被试者通过百度网页搜索引擎找到满意的结果,31.2%的被试者采用音乐客户端软件检索到满意的结果。任务3和任务4表明,没有人通过百度音乐搜索引擎检索到满意的结果,这里值得注意的是有2人次通过两个音频专题网站下载了伴奏曲子。

由此可见,百度音乐搜索引擎在检索歌曲、表达心情的音乐等方面能得到满意的结果,在检索朗诵和伴奏音乐时有些差强人意;酷狗、酷我音乐盒等音乐客户端软件的搜索比较便捷,能够完成4类任务;虽然5sing.com、wo99.com等音频专题网站只有在任务4中有2人次使用,但据笔者的进一步考察,这些网站拥有丰富的音频资源,类别众多,检索项易用,均能完成这4类任务,音乐搜索引擎如何有效地整合这些资源丰富的音频专题网站,是一个值得关注的问题。

3.4 检索入口的跳转行为

在音频搜索过程中,被试者可能会变换音频检索入口,即发生检索界面的跳转,如从百度音频跳转到百度网页,从百度网页跳转到酷我音乐盒等。72.9%的音频检索过程行为样本(151个)自始至终基于一个检索入口来检索,过程中不发生检索人口的跳转。27.1%的检索过程(56个样本)中会有检索入口的变换行为,其中,任务1有5人次变换入口(2.4%),任务2有11人次变换入口(5.3%),任务3有18人次变换入口(8.7%),任务4有22人次变换入口(10.7%)。变换1次入口的占16.9%,变换2次的占7.2%,3%会有3次以上的变换行为。

笔者进一步考察了音频检索入口的变换时机,主要从音频检索需求表达尝试的次数和检索时间两个方面分析用户在音频检索过程中对首次检索入口的坚持和容忍度。首先,统计被试者离开某个检索入口之前音频检索提问式的尝试次数。结果表明,被试者在不断调整提问式平均超过3次后,就倾向于考虑变换检索工具了。其次,统计被试者离开某个检索入口的时间点。结果表明,被试者在首次检索入口搜索音频时间平均超过106秒时,倾向于变换检索入口重新展开搜索。

总的来看,音频检索过程中发生检索工具变换次数不是太频繁。检索工具的变换频率与所检索的任务密切相关,任务1和任务2变换频率较低,任务3和任务4变换频率较高,可能原因是大多数被试者习惯把百度音乐搜索引擎作为第一检索入口,而用百度音乐搜索不到时就发生了较高频率的变换检索工具。在遇到搜索障碍时,被试者总是首先更换检索关键词,只有在多次更换关键词仍未能获得满意信息时才会考虑更换检索入口。实验中,每个检索入口提交查询请求的平均为1.96次,最多达7次,其中任务1的查询请求的平均次数为1,任务3的查询请求次数最多,平均为2.76次。可见,不同的任务需求也是影响检索音频检索行为的因素之一。

4 讨论分析

4.1 网络音频信息检索的途径

初始检索入口和后续检索入口数据共同显示,基于关键词的百度搜索引擎是网络音频信息检索的最主要途径,安装在计算机上的音乐客户端软件成为检索音频信息的另一个重要工具。百度音乐搜索引擎是用户查询歌手、歌名、歌词、专辑的首选工具,百度音乐对朗诵、伴奏等资源收录不够丰富,用户倾向于选择百度网页查找这些存在于分散的教学网站中的资源。可能的原因是当前主流音频搜索引擎自成体系,在与网络音频专题数据库的互操作上存在较大问题。这带来了一个实际检索障碍:通过百度网页搜索很容易从结果中进入某个专业音频库,而通过百度音乐搜索很少能够进入到专业音频库中去。而对于表达喜悦心情的音乐检索任务,没有用户采用百度音乐的分类目录“音乐心情”。诸如百度音乐的音频信息分类目录、5sing的专业音频数据库网站等优质音频资源因资源整合、检索习惯等方面的障碍尚未进入大多数用户视野,在一定程度上造成网络音频资源建设的浪费和产生信息孤岛现象。因此,网络音频资源的整合成为一个值得思考的问题。

4.2 网络音频检索中的定势心理

首先,定势心理在用户选择音频检索工具时起到主要作用,大多数用户习惯于长期使用某一两个所熟识的搜索引擎;其次,在音频信息检索过程中,用户倾向于使用首次检索入口来检索音频资料,只有在查找不到满意结果时才更换检索工具,总的来看,更换检索工具的情况较少发生;再次,在遇到检索障碍时,大多数用户倾向于选择更换检索提问式的策略,而不是立马更换检索工具进行重新检索。这些结果与朱明泉[8]对网页搜索和曹梅[7]对图像搜索的研究结果一致。定势心理很大程度上导致了定向行为策略的普遍性。

因此,首次检索入口是音频搜索引擎生存的重要竞争点。CNNIC“第31次中国互联网络发展状况统计报告”显示,截至2012年底,搜索引擎用户数4.51亿,使用率为80%,稳居互联网第二应用之位[1],可见未来搜索引擎市场的竞争仍将非常激烈,音频搜索引擎的竞争状态同样如此。

4.3 检索入口变换的心理阈值

虽然有定势心理的存在,但用户对某个检索策略的容忍程度是有限的,当某个检索状态造成较多挫败时,用户倾向于调整检索思路。研究中观察到,音频信息检索思维的跳转发生在两种情况下:一种是音频搜索引擎查询不到满意的结果时,用户选择网页搜索引擎或音频客户端软件检索;另一种是一般网页搜索结果会带来关于网络音频资源库的索引,引导用户进入音频专题网站,带来较大的信息空间的跳转。用户检索思维跳转的心理阈值发生在调整提问式平均超过3次,或者检索时间平均超过106秒。

检索入口变换的心理阈值的意义在于,有助于了解用户对首次检索入口的坚持和容忍程度,跟踪用户心理状态,把握用户检索思维跳转的时机,在检索工具变换之前提供系统干预措施,提高用户粘连度[7]。

4.4 检索情境对检索过程的影响

从音频信息检索任务1~4的检索过程来看,用户首次检索入口的选择更多依赖习惯,首次选用的检索工具能够完成检索任务时则不再更换检索入口,当无法完成检索任务时会选择其他检索入口,所以检索任务对检索入口的跳转形成较大影响。这与赖茂生等人关于网页信息检索的研究结论基本一致,他们认为被试者进入一些后续检索入口依赖一定的环境,尤其受被试者执行当次搜索任务所获搜索结果的影响,而不是依赖习惯[9]。

5 结语

本文以用户实验的方法考察了网络音频信息检索的关键行为:初始检索入口、后续检索入口、检索入口的跳转行为,并且考察了不同检索任务带来的检索过程的差异性、任务对行为过程的影响,研究结果表明:(1)网络音频信息检索过程中,用户的检索入口选择与跳转行为较大程度上受用户的定势心理影响;(2)用户对检索工具有一定的容忍度,检索入口的变换阈值可以为系统实施干预措施提供时机上的指导;(3)对于不同的检索任务,需要采用不同的检索工具获取满意结果,折射出当前网络音频检索资源组织与整合方面的问题,建议网络音频数据库在保护自身知识产权的情况下,建立合理的发布机制,寻求与音频专题搜索引擎合作;音频搜索引擎也应该向着资源整合与共享的方向发展。

除了上述的关键行为外,发生在检索过程中的浏览行为、提问式特征、提问式调整行为等都可以反映音频信息检索的行为特征和用户心理,是本研究下一步继续关注的方向。

标签:;  ;  ;  ;  ;  ;  

网络音频信息检索的用户行为研究_信息检索论文
下载Doc文档

猜你喜欢