知识门户的个性化服务现状及优化研究,本文主要内容关键词为:现状及论文,个性化服务论文,知识论文,门户论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2009-06-04
分类号 G354.25
CLASS NUMBER G354.25
网络信息资源快速增长与用户信息获取之间的矛盾加剧促使人们寻求有效的信息资源组织形式,资源目录、学科信息导航的产生为用户提供了文献信息的线索,但这并不能完全满足用户的需求,他们需要一种可以直接获取有价值知识内容,更个性化、便于利用的信息平台,知识门户在这种需求环境下应运而生。知识门户是以信息资源的集成为基础,面向用户提供知识服务的个性化信息资源组织形式,是知识共享与知识交流的平台,通过对某一主题资源的深层次组织,分析用户的需求,并以此为基础,动态地为用户提供其关注的信息和知识。为了解知识门户开展个性化服务的现状,本文对国内外若干知识门户进行网络调查,并在此基础上探索优化知识门户的个性化服务策略。
1 知识门户个性化服务现状
为了解国内外知识门户的个性化服务现状,笔者采用网络调查法对国内外若干有代表性的知识门户开展个性化服务的情况进行调查,包括:①韩国知识门户(Korea Knowledge Portal,KKP)[1],由韩国数字信息振兴局(Korea Agency for Digital Opportunity & Promotion,KADO)建立;②光子学知识门户(ISP Knowledge Portal)[2],由国际光子学学校建立,链接到20个类别的光子学及相关领域的资源,并提供相关服务;③IBP Knowledge Gateway[3],由世界卫生组织及Implementing Best Practice(IBP)成员建立,用来支持多样化的虚拟实践团体;④上海社科知识门户[4],由上海社会科学院与上海图书馆联合成立,搜集整理国内外社会科学文献资料,是我国哲学社会科学领域有特色的文献资料基地;⑤EcoPort[5],是关于生态学的知识门户,由世界粮农组织、佛罗里达大学和史密森学会(Smithsonian Institution)合作建立,有包括国际农业研究磋商小组在内的150多个技术支持机构,为各国政府、研究机构和个人提供范围广泛的植物及病虫害等自然知识;⑥E-Knowledge Portal[6],由美国教育研究服务(Educational Research Service,ERS)建立,为学生和教育工作者提供可靠的有关教育研究的信息。上述知识门户的服务功能如表1所示,用“√”作为提供相应服务的标记。
通过调查发现,知识门户的个性化服务形式可以分为以下几种:
(1)集成式知识检索及导航。集成式知识检索及导航是把各类型信息资源作最大限度的集成,按一定规范严格选择和描述,形成规范的知识组织体系,使用户以最少的步骤获得所需的多种服务,或者通过知识导航服务节省用户时间,提高查询和利用效率。这种服务形式主要表现为知识地图(知识导航)、一站式检索和检索推荐系统。
(2)定制服务。定制服务是一种主动式服务,以用户需求为中心,集成已有的应用和技术,分析用户的使用习惯和兴趣,允许有需要的用户设定自己需要的资源类型、表现形式和系统服务功能,并向用户推荐相关知识或知识载体。这种服务形式主要表现为页面定制、提供内容或内容返回形式定制,还包括动态定制信息推送,即把最新的信息根据用户的需求以用户定制的方式主动提供给用户。
(3)互动服务。知识门户为用户提供交互性平台,用户可以向咨询员提出问题,寻求解决问题的方法,并把对服务的评价和意见及时反馈。交互性平台具有更新速度快和多方面参与等特点,知识门户可以根据用户的意见改进服务,充分利用用户推荐的有价值资源。互动服务主要表现为参考咨询和用户评价与推荐。参考咨询按提供服务时间可以分为实时互动参考咨询和异步参考咨询,按提供服务机构可分为独立参考咨询和联合参考咨询,其中实时互动参考咨询、异步参考咨询和联合参考咨询是目前应用比较多的形式。
(4)知识交流服务。知识交流服务是知识门户根据对用户需求倾向和行为的分析,推荐相同爱好、相同信息需求的用户组成团体,也可以由用户自发组成群体,提供集体定制信息服务,发表个人知识和互相交流,还可以在线交流或者以定期发送邮件的方式交流,使以经验、观念形式表现的隐性知识得以充分利用。主要表现形式有论坛、日志空间、在线聊天。
2 知识门户个性化服务存在的问题
从表1看出,所调查的各知识门户都提供知识检索和导航服务,此外KKP提供用户评价与知识交流服务,而咨询服务和定制服务欠缺;ISP提供用户推荐和个人知识空间;IBP提供E-mail咨询、最新通讯推送和知识交流服务;上海社科知识门户提供互动服务,其中咨询服务比较全面,但缺乏定制和知识交流空间;EcoPort提供E-mail咨询、用户评价和推荐及知识交流服务;E-Knowledge Portal提供服务相对全面,4种类型服务都有涉及。调查后发现各知识门户的个性化服务存在以下问题。
2.1 定制服务不完善
根据笔者的实际利用情况,推送服务只有KKP、IBP、上海社科和E-KP以邮件方式向用户提供最新的通讯,其中上海社科知识门户提供《上图信息》订阅邮件推送服务。目前定制服务存在的问题是推送服务的内容只是网站的通讯,不能真正实现依据用户需求进行定制推送。对于页面定制,调查的门户多数只能提供统一的检索界面,不能根据页面和内容返回形式定制。定制服务不完善的主要原因是用户需求分析不够,没有用户需求信息的收集和分析,就无从提供定制和推送服务。在对用户需求的分析方面,所调查的知识门户都有用户登记系统,但只是一种身份认证系统,或记录检索历史,或用来解决服务收费问题,对用户需求的分析还不够深入。
2.2 提供的内容不够知识化
知识门户提供的内容主要指知识门户提供的知识服务,所谓知识服务是以信息和知识的搜寻、组织、分析、重组的知识和能力为基础,根据用户的问题和环境,融入用户解决问题的过程中,提供能有效支持知识应用和知识创新的服务[7]。
调查发现,现有知识门户提供的内容不够知识化,主要指检索结果揭示不够深化,还停留在文献属性集成及网络链接上,没有对数字资源进行深层次的概括和重点提取,缺乏数据挖掘和知识重组,不能为用户提供能够直接利用的信息。调查中只有少数知识门户对检索结果进行概括,其他都直接链接到数据库或者相关网站。
2.3 资源集成有限
调查显示,知识门户对可获得的资源进行一定程度的集成,经过标引分类后提供检索和导航服务。资源集成在知识门户中得到普遍应用,但也存在不足。首先,集成的资源有限,自身有资源数据库的知识门户对网络资源的获取能力比较弱,而门户只有网络资源或只凭用户分享资源而没有自身的数据库和获取网络资源的能力。其次,集成形式单一,仅限于对其他资源的链接导航,不能满足用户范围广、层次深的信息需求,也难以实现跨部门、跨系统的资源利用。国外的知识门户都提供了一站式检索,上海社科知识门户还不能对异构数据库进行统一检索,这也是国内知识门户及信息服务机构的普遍问题。
2.4 缺乏用户交流空间
现代科学研究更需要团体的合作,不同地域相同研究领域用户之间的交流逐渐得到重视。从所调查知识门户的实际建设来看,国外的知识交流空间已经比较成熟,各个知识门户都以各种形式或多或少地为用户提供交流空间,但国内在这方面尚处于起步阶段,上海社科知识门户没有提供这种服务形式,尚待进一步发展。
2.5 咨询服务缺乏人才保障
在所调查的知识门户中,用户的评价和推荐服务大部分能有选择的进行。上海社科知识门户和E-KP的参考咨询服务比较全面,尤其是在线专家咨询,其他知识门户都没有提供。这是因为这两个知识门户都有图书馆联合建设,有学科馆员等专家人员保障在线咨询的进行,而其他知识门户缺乏相关人才的保障,大多是E-mail服务或者没有咨询服务。
3 知识门户的个性化服务优化策略
在知识门户的个性化服务过程中,用户需求是推动个性化服务发展的动力,对用户需求的分析应贯穿整个服务流程。要解决知识门户存在的以上问题,优化知识门户的个性化服务,就要从用户的需求分析入手,针对门户存在的问题,加强资源获取与集成、信息分析与提供,重视知识定制推荐和知识交流空间的建立,并完善人才培养等支持条件。
3.1 用户需求分析
对用户需求的分析是个性化信息资源组织体系的基础和出发点,对收集到的用户信息经过处理和分析后,才能掌握用户的信息行为,从而为个性化信息资源组织提供指导。用户的生活、职业、社会环境等方面的差异决定其拥有不同需求,只有充分考虑用户的需求差异,才能提高个性化知识服务的针对性和用户的满意度。因此对用户需求、兴趣、爱好的了解和获取是个性化信息资源组织的关键。
对用户偏好和需求倾向的收集和分析包括两方面:①用户偏好信息收集。一是用户注册的信息,包括姓名、年龄、专业等基本信息;二是对用户输入的检索词、浏览及下载行为的追踪与分析。为了收集用户的兴趣信息,在用户界面上提供按等级区分的概念,一旦用户选择了一个概念,下一级就会提供下位类更多的(面更窄的)概念,用户可以选择最相近的偏好信息。在用户兴趣信息获取方面可以采用二元模型,即感兴趣和不感兴趣,用户可以通过登记系统选择感兴趣和不感兴趣的信息并赋予权重,例如感兴趣最高权重10,不感兴趣最高权重-10,逐级减少或增加50%,这样可以体现不同偏好对用户的重要程度,有效解决用户偏好模糊不清的问题[8],对有效实现定制及推荐服务有重要作用。②用户模型的建立与应用。用户模型实际上就是对用户行为、需求偏好的结构化描述,以确定其所需信息服务的类型。用户模型的建立对实现系统与用户的互操作有重要意义,是有效实现个性化服务的关键[9]。
另外,用户需求的动态变化决定系统必须更新用户模型,可以通过用户自身修改登记信息,或观察用户的检索和浏览行为跟踪用户需求信息,同时重视用户对系统提供知识内容的评价和反馈,以此为依据提高服务质量,这样才能时刻把握用户需求变化,做好个性化服务。
3.2 资源获取与集成
为了收集全面而高质量的网络信息资源,知识门户可以使用Vertical Spider(垂直蜘蛛或垂直爬虫)技术进行网络信息资源的获取,见图1。
图1 知识门户网络信息资源获取模式[10]
Vertical Spider利用元搜索(meta-search)加强聚焦爬虫(Focused Crawler)的抓取功能。元搜索方法不仅使用聚焦爬虫抓取网页,而且在爬取过程中还利用元蜘蛛(meta-spiders)以增强聚焦蜘蛛的爬取能力。聚焦爬虫从领域专家推荐的一系列起点URLs开始,从收集的起点页面中提取出超链接,按照相关性放在URL序列中;同时利用元蜘蛛不断地把用户的提问请求发送到各个主要搜索引擎,综合各搜索引擎返回的高相关度URLs,返回到URL序列中。集成后的搜索引擎返回结果更加全面,质量更高,因此将这些结果加入到URL序列中可以有效防止聚焦爬虫局限在特殊的超链接群体中。元抓取工具还可以获取到深层网络的隐藏内容,大大提高网络资源集成的质量。在获取网络文件之后,利用索引工具对收集的每个文档切词,并记录各个词汇和文档之间的关系,创建可供搜索的文档索引,然后将索引储存到门户数据库中以备文献检索和进一步分析所需。
知识门户除了要获取外部网络资源之外,还要将网络资源与内部资源集成。内部资源指系统购买或自建的数字资源以及用户上传的相关资源,包括各专业数据库、特色数据库、图书馆的书目数据库和机构知识库等,例如上海社科知识门户就提供上海图书馆书目检索数据库和上海社科院书目数据库。在集成各类资源的基础上,将存放在门户数据库、数据仓库和文档中的信息经过进一步的深度挖掘转变成可利用的知识,并把这些知识通过一站式检索界面传送到用户面前。
3.3 信息分析与提供
为了增加提供内容的深度,可以利用关键词推荐、文件概述和主题地图[10]等功能提高内容的知识化程度,使个性化服务更符合用户需求并节省用户的时间,提高满意度。
关键词推荐是通过推荐同义词或相近关键词规范和修改用户的检索提问,可以直接利用现有的搜索引擎或较好的数据库的此类功能,例如Google、ProQuest或Scirus Search Engine等。
文件概述是对一个给定的网络页面进行归纳概括,用户可以对页面有个快速的大概了解。当用户在系统中选择概述一个网络文件时,系统首先从语法上分析这个网络文件,去掉所有与内容不相关的HTML标签,利用分析和综合方法识别有代表性的重要语句。首先根据句中的关键词、句子在段中的位置以及相关句子中专有名词出现的频率把所有句子排列;然后将经过语法分析的整个文档分成若干分块,利用相似对比功能相互对比,两个临近的分块相似性低就表示是一个主题,再根据对这些分块的评估进行排列;最后按照重要顺序提取句子直到达到想要的概述长度,产生一个经过语法分析的网页概述。概述一经形成,系统就在原始文件中定位和突出这些句子,可以帮助用户快速决定这个文件是否有用。
主题地图是通过自组织的图形算法在二维图上把检索结果分成不同领域,每个文件用一个或者几个关键概念表示并在图中显示,主题相近的概念相邻。用户可以看到返回结果的分布情况并看到每个领域的内容,从而实现检索结果的可视化。
3.4 知识推荐
基于计算机的推荐系统是为了解决网络环境下的信息超载问题而设计的,它的基本构思是通过展示排行以及个性化地向目标用户推荐事物或(和)人来帮助用户决策并了解新信息。
从20世纪90年代推荐系统成为一个独立的研究领域开始,国内外有很多对推荐系统在数字图书馆中的应用研究,知识门户可以吸取推荐系统在数字图书馆应用中的经验和教训,发挥推荐系统提供个性化服务的优势,增强知识门户个性化服务能力。
目前,推荐系统的技术类型包括:协同过滤/社会过滤系统、基于内容的系统、基于知识的系统、复合推荐系统等[11]。协同过滤系统的应用最为广泛也最成功,知识门户可以利用协同过滤系统,或者集成其他技术一起为用户提供知识推荐;可以聚合相似偏好的用户,结合其他用户对资源的评价,向用户推荐其可能喜欢的资源;可以提高检索效率与效果,为用户提供准确与适合的指导性资源;可以利用推荐技术对知识门户获取的最新资料或最新更新进行过滤,进行个性化定制推送;可以通过对用户提供的信息和系统记录的用户访问习惯、偏好等信息的分析,将有用知识主动推送给有需求的用户或者用户群,保证用户及时获取最新的相关信息。在做好用户需求分析的前提下,推荐系统可以实现信息找人的服务模式,减少用户寻找信息的时间,提高用户浏览和检索的效率。
3.5 用户交流平台
随着Web 2.0的发展,为用户提供知识交流和共享空间是知识门户个性化服务的趋势。知识门户中数据库与网络信息资源的获取和集成在一定程度上消除了显性知识资源共享的障碍,但由于地域不同以及人们的藏私倾向,隐性知识资源共享还存在障碍。为消除隐性知识交流的障碍,知识门户应提供实时互动式服务以及用户可以发布和共享知识的平台,为用户与咨询员或特定领域专家提供对话的机会,也为有共同兴趣或者不同地域从事同一领域研究的人们提供交流的机会。
实时互动式服务是以不断创新的知识为基础,是一种知识密集型、智慧型的咨询服务方式。用户和咨询员通过登录服务器,进入实时咨询系统,利用问题解答数据库、电子邮件、在线聊天、共同浏览等形式,解决用户获取知识过程中的疑难问题,帮助制订获取策略,必要时将有价值的页面推送给用户,为用户提供解答的途径。
用户之间交流平台的提供,首先根据用户模型将有相同偏好的用户聚类,或者由用户自主建立特定领域主题的共享空间,用户群体在此空间内可以对相关主题进行讨论,评价信息资源,还可以向其他用户推荐资源。在用户允许的情况下,系统还可以跟踪提取有价值信息,提供给系统的其他用户。当然,这种交流系统还有很多问题,例如无用信息的增多、用户的搭便车(Free Ride)习惯等,还需要进一步研究解决,提出鼓励和规范制度,完善交流机制。
3.6 人才培养
高素质信息人才的培养是提高知识门户个性化服务质量的重要支撑条件。个性化服务的实现除了应用智能化技术,还离不开知识主体的参与。知识门户必须放大视野,从知识服务这一核心出发,建立完善的人才体系,可以通过自身培养或者联合共享人才。例如上海社科知识门户的联合参考咨询,用户可以享受到国外学科馆员的咨询服务。这些知识创新型人才提供各类型交互服务,解决用户利用门户时出现的问题,引导用户找到想要的知识,提供跟踪服务,提高用户获取知识的能力,伴随用户的整个科研过程,成为用户身边的咨询员。在与用户的交互服务过程中,要激发用户利用知识的主动性和创造性,为用户明确自身需求、分享自身经验、发挥创造性和提高知识创新水平创造良好的环境和氛围。
标签:个性化服务论文; 推荐系统论文; 相关性分析论文; 用户研究论文; 空间分析论文; 用户需求论文; 用户分析论文; 信息集成论文; 数据检索论文;