MyLibrary的用户研究,本文主要内容关键词为:用户论文,MyLibrary论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
自1998年由Eric Lease Morgan领导的团队开发了My Library @ NCState后,目前全世界包括我国在内,已有众多图书馆启用了MyLibrary系统。研究者们对MyLibrary寄予厚望,期望MyLibrary能完成个性化服务的重任。事实上,特别是国内,MyLibrary却一直未达到研究者期望的高度,迫切需要个性化服务的用户对其的使用热情也未曾达到预期的高度。原因之一自然是MyLibrary系统本身还不够完善,然而笔者认为更重要的原因是对MyLibrary用户的重视程度不够。据笔者随机的调查发现:MyLibrary多由技术部管理,技术人员更愿意将MyLibrary定义为一项技术创新,而对用户本身关注自然不足。这一事实也可以从有关MyLibrary的研究论文得以证明,笔者在CNKI中检索出30篇题名带有“MyLibrary”的文章仅有三篇带有“用户”。可见,对用户本身的忽视是一个事实存在的问题。而MyLibrary的使命是为用户提供个性化服务,可说MyLibrary系统是因用户而生,这点我们从Morgan所下的定义“MyLibrary是以用户为中心,以个性化选择为界面的图书馆信息资源搜集提供方式,是根据用户个性特征进行的有针对性的图书馆信息服务”[1]就可得知。基于这样的矛盾,本文将探讨MyLibrary的用户研究,在研究过程中区分传统的用户研究,以MyLibrary用户研究的不同之处作为研究的重要内容,期望能为MyLibrary的发展提供一些借鉴意义。
1 MyLibrary用户研究方法
Wang.P.& Tenopin曾经将用户的研究方法分为定性方法和定量方法两大类,其中定性方法包括:直接观察法、出声思考法、访谈法、问卷法、个案分析法等;定量分析法包括:调查法、测试法、实验法和事务日志法等。[2]然而,因为MyLibrary本身的特殊性,这些适合网络用户研究的方法并不都适合于MyLibrary用户研究。其一,个性化服务不是个别服务,而是针对普遍性用户提供的服务,[3]其二,用户相对于图书馆馆员来说,MyLibrary用户是虚拟的,针对这两个特点可以剔除小样本的研究方法,如个案分析法,测试法和用户研究广为流行的实验法,同时可以剔除面对面的研究方法:如直接观察法、出声思考法。剩下的访谈法、调查法和日志法,笔者认为也是可以使用或者经过改良后可以适用于MyLibrary的用户研究中。
(1)日志法。日志法是通过直接提取系统里的日志来分析用户行为,它具有普遍性和非接触性,非常符合MyLibrary的用户特点,因此,他成了MyLibrary用户研究的主要方法之一。
(2)调查法。我们可以认为MyLibrary系统的“用户资料文档”为调查法,用户资料是了解用户信息的重要途径,他是MyLibrary系统提供推送服务的主要依据,因此,我们把调查法也列为主要方法。
(3)访谈法。这不是面对面的访谈,而是网络的实时或非同一时间的对话,在MyLibrary用户研究中,他可主要用于MyLibrary的主要用户和一些具有特殊需要的用户,从而更好地保证主要用户获得准确的个性化服务,我们把访谈法列为MyLibrary用户研究的辅助方法。
2 MyLibrary用户研究内容
2.1 用户兴趣的获取
MyLibrary系统的工作原理是根据用户兴趣为用户返回系统认为对用户有用的信息结果,而过滤去除系统认为与用户无关的信息,或者直接推送系统认为用户会有兴趣的信息,因此,对用户兴趣把握得准确度就至关重要。一旦对用户兴趣把握不准确,推荐给用户不需要的信息,就将不但不能给用户提供服务,反而给用户造成负担。并且,用户如果多次得不到有价值的个性化信息服务,也将会放弃对MyLibrary系统的使用。所以,用户兴趣是MYLibrary用户研究的一个重点。
2.1.1 用户资料文档分析
MyLibrary系统设计有一个记录用户信息的用户资料文档,其具体包含以下内容(1)用户资料文档首先包含用户注册信息。MyLibrary系统的特点之一是用户认证(Authentication)。[4]用户第一次使用该系统,需要注册,用户认证的目的之一是将用户区别开来,另一目的就是获取用户的有关资料以分析用户的兴趣。我们知道,用户的资料越详细,用户的兴趣分析预测就越准确,然而,用户的易用性心理和惰性心理又决定,如果注册过于繁琐,用户将放弃使用该系统。并且,用户保护隐私的心理将决定他首次不愿意公开自己的一些私人特征。针对这样一对矛盾,设计一份必填和选填内容相结合的注册信息页面,并且隐藏选填内容,只保留“您可以选填更多的信息以确保您得到更准确的信息服务”,这样,一份简洁的注册信息将能通过用户的心理关。那么如何在简洁的注册信息里保证获取更重要的信息呢?用户名、密码是必须的,另外笔者认为应该加上用户专业与用户学历。根据笔者对用户信息行为的研究得知:用户因专业、学历的不同在信息需求与信息行为上呈显著性差异。[5]一般来说,用户需求与专业最为相关,对于高校和其他研究机构来说尤甚,学历则决定用户需求层次的不同。调查表明,一个博士生比本科生需求的信息层次更高,比如,本科生只需与专业相关的国内书籍与期刊,而博士生则对外文资料有大量需求。因此,用户名、密码、专业、学历将构成必填的注册信息,将会较好地解决用户心里与系统获取的矛盾。同时,用户随时可填写或者修改选填项目,可由身份、专业兴趣、业余兴趣等构成。(2)用户的首页设置,可随时修改。(3)用户的个人链接。(4)用户的信息定制。
通过上述分析,用户资料文档是由用户填写的准确度较高的用户资料。根据用户资料,我们可以分析出用户的兴趣:用户的专业信息是其主要兴趣;用户设置的首页为其当时最感兴趣的类别;用户的个人链接为用户感兴趣的相关类别;用户的信息定制为用户迫切需要的信息。将用户身份与其他几类信息相关分析,得出用户的兴趣深度。
用户资料文档分析为静态分析,所以不能表现用户兴趣的动态变化性,而且用户资料并不可能提供得很全面,因此这只是分析用户兴趣的方式之一。[6]
2.1.2 日志分析
日志分析即直接从系统里提取日志来分析。在以往的网络信息用户研究时,它存在着自己固有的缺点,即日志不能和特定的用户联系起来。MyLibrary的用户研究则不存在这个问题,上文已述,MyLibrary的用户认证确保了用户的明确性,用户日志可以与具体的用户一一联系起来,这些为MyLibrary用户研究使用日志分析提供了可行性与准确性。
日志分析一般是从日志里清理出用户链接的页面,输入的关键词,在页面停留时间的长短,是否保存了页面等信息,从这些信息里分析提取用户的兴趣。简单地分析,用户链接的页面,即可以认为用户对该类有兴趣;输入关键词的类和保存页面的类都是用户感兴趣的类,停留时间长则是用户相对比较感兴趣的类。当然,我们在分析用户时不能仅仅这样简单表面地分析,这些行为其实是互相关联的,为了更深入地了解用户,往往引进数据挖掘技术,寻找错综复杂的用户行为。我们可以举例分析,如果一个用户多次输入了该类关键词,打开了链接,停留时间很长,且保留了该页面,我们可以认为该类是用户当时的突出兴趣;如果用户偶尔输入了该类关键词,打开链接,但停留时间很短,我们可以认为该类为用户的偶然兴趣;如果用户输入了该类关键词,并未打开链接,我们可以判断是用户的误操作。这样的分析是枚举不尽的,系统实际的算法分析也比这简单的举例分析复杂得多。同时,某次的日志具有偶然性,并且,用户的兴趣是动态的。所以,我们对用户的日志分析必须是长期性的,分析不单从某次日志的内部分析,还需要将日志综合分析,我们可以定义用户长期习惯访问的类目为用户的主要兴趣,是MyLibrary系统提供个性化服务的主要依据,其他行为则为次要兴趣,是短期个性化服务提供的辅助依据。
日志分析除了依靠数据挖掘技术从零散的行为里找出有规律的兴趣,还应依赖算法模型来具体确定用户的兴趣。目前流行的用户建模技术有三种:用户手工定制建模,示例用户建模和自动用户建模。[7]根据检索文章所知,这些模型都为计算机领域专家所设计,都是从定量的分析来测量用户兴趣,因此我们还需要定性的分析方法加以辅助,才能更准确地把握用户兴趣。举个例子,用户A需要研究课题P,在这一过程中,他需要大量有关P类的资料,然而,P类并不是A研究的重要方向,故他做完课题P则不再需要该类消息。对于这个例子,如果是用模型算法来计算,P类信息一开始就被赋予了比较重的权值,当他不再需要P类信息时,权值减少,但并不是立即消失,其计算结果,P类信息将还是A的主要兴趣。因此,我们就需要结合数据挖掘技术,也需要定性分析方法,从而分析出P类信息不再是A的主要兴趣,才能为A准确地过滤信息与推送信息。
2.1.3 用户对推送信息的反馈
前两种用户研究方式更多的是系统单方面的研究,研究结果自然会有失偏颇,为了弥补这一缺憾,可以充分利用用户的反馈信息。笔者以为,最简单又最可靠的方法是根据用户满意度来获取。具体方法是,推荐信息与满意度文件相链接,在推送的每个问题下附上一行“○非常满意,请多推荐该类信息;○比较满意,可继续推荐该类信息;○满意,谢谢推荐;○比较不满意,不需要推荐该类信息;○非常不满意,请不要再推荐该类信息”。用户只需单击一下其实际的满意度情况,我们将在满意度文件里回收到结果。这一方式满足用户的省力性原则,而一旦用户愿意参与,将增加MyLibrary系统对用户兴趣把握的准确性的砝码。只要系统能为用户提供准确的个性化服务,根据用户的惯性心理,用户将会喜欢MyLibrary系统的使用,同时愿意进行更多的信息交流。
2.2 用户分类与聚类
用户的分类是为了实现为用户提供个性化服务,聚类则为了给有相同兴趣的用户提供相似的个性化服务。
2.2.1 根据用户登陆次数分类与聚类
根据用户登陆MyLibrary的次数,可将用户分为生疏用户,临时用户和专家用户[7]第一次登陆MyLibrary系统视为生疏用户,MyLibrary需要对这类用户特殊关照,处处可以得到“帮助”;登陆过一两次而不曾再出现的用户视为临时用户,可以不需要对该类用户予以过多的注视,甚至可以不再给他们提供推送服务;经常登陆使用MyLibrary的为专家用户,专家用户在使用时可以略去众多烦琐的中间环节,并且应该是MyLibrary重点关注需要推送服务的用户对象。
2.2.2 根据用户兴趣分类与聚类[8]
根据上节的兴趣分析,我们可以得到某些用户具有相同的兴趣或者某类相同兴趣,同时,我们也可以根据用户的信息交流来获知用户具有相同的兴趣:经常互相交流的用户或者在同一主题下讨论的用户为具有相同兴趣的用户。我们在用户分析时,就可以用多重分类与多重聚类的方法将用户多重置于具体的兴趣群中,这样,既可以将信息更完整地找到适用的用户,也可以实现通过观察同类用户的兴趣来完善用户兴趣的获取,从而给用户提供更完善的个性化服务。
2.2.3 根据用户信息反馈分类与聚类
根据调查,并不是每个用户都会对信息进行反馈。我们将经常反馈者定义为MyLibrary的主要用户,这部分用户是积极使用系统,同时喜欢个性化推送与检索等个性化服务者,是MyLibrary工作的主要对象。偶尔有反应的用户为不排斥MyLibrary的用户,是MyLibrary需要争取的用户。从来不反应者为不喜欢推送服务者,根据调查得知,并不是每个用户都喜欢推送服务,对于不喜欢者,主动推送是一种负担,因此应取消对该类用户的推送服务。我们可以认为,取消对该类用户的服务亦是个性化服务的一种体现。
3 结束语
在MyLibrary系统发展的过程中,我们如果能对MyLibrary用户投入更多的关注,找出MyLibrary系统的主要用户与潜在用户,准确把握用户的兴趣,为需要个性化服务的用户提供准确的个性化服务,将会促使用户使用MyLibrary的热情。我们有理由相信,只要有用户积极的参与,MyLibrary必将能突破现在发展的瓶颈,从而承担起它在个性化服务中的重任。
收稿日期:2007-09-05