数字图书馆信息服务平台的建设,本文主要内容关键词为:服务平台论文,数字图书馆论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[分类号] G250.76
1 数字图书馆的服务体系
图书馆的终极目标是服务,任何规划、决策、目标,都必须定位于用户,满足他们对信息和知识的需要。数字图书馆结合了先进的信息技术、网络技术,使得图书馆服务内容不断扩展,服务方式不断增多,服务功能日益强大。
数字图书馆的服务系统是一个以数字化知识资源为基础、以用户需求为中心、以先进的信息技术为手段的一体化服务平台,构成这个平台的基本服务包括信息检索服务、参考咨询服务、个性化推送服务、信息定制服务等等。随着知识资源的积累、用户需求的翻新、信息技术的提高,还会引入更多的服务,每个服务都是独立的模块,象积木一样搭在现有的服务平台上,不断扩展整个服务系统,使得数字图书馆的效用得到最大的发挥。
下文介绍几个基本概念和一些关键技术。并以中国人民大学数字图书馆的建设为实例探讨各种服务的解决方案。
2 信息检索服务
实现数字图书馆中的信息检索服务涉及如下关键技术:
(1)结构化信息检索。在目前的应用背景中,元数据主要有两种不同的存储方式,即关系数据库方式和XML方式,有些以XML描述的元数据实际也采用关系数据库系统来存储。在这两种方式中,数据都具有非常好的结构,可直接利用标准的结构化查询语句进行检索,把用户的查询条件当作不同字段的关键字处理即可。
(2)全文检索。全文检索是指以全文本信息作为检索对象,建立全文数据库,除了具有布尔逻辑检索功能外,还具有文本检索功能,并允许用户以自然语言检索,直接获得原文中的有关章节和句段[2]。这里的重点在于全文索引的建立、自然语言的理解、检索模型的选用。常见的方式是,对全文本采用倒排索引,自然语言的理解做到基于词典的分词和词频的统计,检索模型常采用向量空间模型。
(3)异构、异地数据源的检索。异构、异地数据源检索的难点在于资源整合,最终的解决方案一定是资源建设者和资源使用者的通力合作,在这个目标到达之前,中间件技术将会起到非常关键的作用。
(4)概念检索。在本体库的基础上,计算机对于文本的理解不再是传统的隔离的字符串,而是一些概念的集合以及概念与概念之间的联系。基于概念的检索从概念层次、知识层次来检索知识网络,可以显著提高信息检索的智能程度,从更高的层次上实现了关联检索。难点在于本体库的建设、基于规则的推理。
(5)多媒体检索。多媒体检索是指对多媒体数据(如视频和音频等)所蕴涵的语义进行自动理解,按照用户的查询要求找出内容相似性。难点在于多媒体数据的特征提取。[2]
(6)检索效率的提高、检索结果的分类与排序。目前大多数搜索引擎返回大量信息然后由用户自己进行筛选,但如果通过智能化代理由系统帮助用户完成这种个性化的筛选过程可以提高检索效率。系统可以通过用户的一些背景资料,跟踪用户的行为,以及由一些反馈机制返回的信息得知用户没有在检索信息中表述出来的意图;结合用户个性特征对检索结果进行分类与排序,可以更好的满足用户需求。
信息检索服务涉及到各种技术,存在很多难点,在实际建设中我们采取与资源建设同步、不断扩展的方案。以中国人民大学数字图书馆为例,提供以下检索方案。
其一,元数据检索。实现基于元数据的馆藏资源统一检索。馆藏资源既包括图书、报纸、期刊等纸质资源,也包括各种类型、多种媒体的数据库,每种资源有不同格式的元数据。信息检索服务应提供组合条件查询的统一检索界面,对不同资源抽取出统一的元数据描述,使用关系数据库存储,利用SQL语句进行查询。
其二,统一检索。实现基于统一界面的不同系统资源检索。人大图书馆网络数据库不断增多,采用的方式有本地镜像、提供检索阅读账号等。用户要使用这些资源就得打开不同的数据库,进入不同的系统,一定程度上增加了用户操作的困难。针对这种情况可采用元搜索引擎技术,在不同的系统上提供一个统一的抽象层次,使得不同系统对于用户来讲是透明的,用户可通过一个统一检索界面获得多个数据源资源。
其三,关联检索。随着知识资源库的建立实现关联检索。人大图书馆建设的“经济学学科知识门户”包括学术论著库、专家学者库、学术机构库、学术会议库等十一个资源库,并在这些数据库之间建立各种关联。这种建构理念和方法可以说是在建立基于经济学学科的数图领域本体库,不仅描述了各种概念,还通过标引体现了概念和概念之间的联系。当这个巨大的本体库建立之后,就可以使用概念检索的技术实现关联检索和更高级的智能检索。
其四,多媒体检索。随着多媒体数据库的建设实现多媒体数据检索。人大图书馆正在开展校园网视音频服务系统建设,为视音频资源的收集整理、数字化处理、揭示、存储及基于校园网的视音频服务构建系统平台,使人大师生能够通过校园网方便快捷地检索到教学科研所需要的相关视音频资源,并可下载或在线播放,从而促进视音频资源在教学科研中的作用。
3 参考咨询服务
数字化参考咨询服务是指以人力资源为媒介、以因特网为基础而提供的信息服务。主要服务形式包括[1]:Help系统和FAQ信息服务、非实时网上参考咨询系统、实时网上参考咨询系统、同步浏览页面的咨询系统。
数字化参考咨询服务的关键技术包括:
(1)FAQ库的建立与管理。FAQ库是以关系数据库存放常见问题及解答,查询时使用SQL语句即可。随着用户不断使用,咨询员可以了解到用户新的问题,从而把新的问题及解答添加到数据库中,来不断充实FAQ库。在实现时可以考虑一种自动添加新条目的方式,当用户提出的问题在问题库中不存在时,或者当用户通过非实时咨询平台进行咨询时,系统自动收集这些问题,提供给咨询员,咨询员将问题规范化并解答后,系统自动将该条目保存。
(2)实时参考咨询平台。实时参考咨询平台的功能类似聊天室,不同的是,该聊天室是一对多的模式。从咨询员的管理界面来讲,他应该能及时看到来自不同终端的连接和提问,并进行回答。从用户的界面来讲,他只需要看到自己与管理员之间的对话记录。另外,对于FAQ库中存在的问题,直接通过库表的检索得到答案,不存在的问题再提交给咨询员。
(3)Co-browsing技术。Co-Browsing(共同浏览),即图书馆员可以和异地用户一起浏览网页,这种功能对于指导用户利用网络资源是很有好处的。如当用户在使用数据库时,图书馆员可以把制定好的检索策略提供给用户,并对用户随时进行指导,目前的web call center即是其应用成果之一。[3]
上述各项服务既独立存在又相辅相成,共同组成了数字图书馆参考咨询服务系统。中国人民大学数字图书馆网络参考咨询服务系统包括如下服务项[4]:
①E-mail咨询。用户向馆员提交问题,馆员把解答发送到用户填写的电子邮箱(非实时)。
②常见问题(FAQ)。列出图书馆服务内容、服务项目、馆藏资源及其利用方面的常见问题,做简明扼要的解答。提供问题列表和查询接口。
③咨询馆员解答。将咨询馆员和学科馆员的信息放到网上,便于用户以电话(实时)和电子邮件(非实时)方式进行咨询。
④实时咨询。用户和咨询馆员通过登陆服务器进入实时咨询系统,模拟面对面咨询的情景进行咨询问答,又称为实时交互式参考咨询服务。
⑤咨询案例。整理各类咨询记录,列出有代表性的咨询问题,给出问题的查找途径和结果。提供案例列表和查询接口。
⑥参考工具。提供百科全书、字典辞典、指南手册等方面的在线参考工具,方便用户查找各类问题。
⑦培训中心。对各种电子资源的使用进行统一的课程培训。可以看出,人民大学数字图书馆针对本校教学和科研的发展方向,实现了对各学科、各专业、各层次用户的多层次、多主题、多方式的数字化参考咨询服务,是一个典型的立体咨询系统。
4 个性化推荐服务
个性化推荐服务是指使用多种数据分析技术,根据用户兴趣信息向用户及时、主动地推荐用户需要的且以往没有获得的知识资源信息,并能根据用户对推荐内容的反馈进一步改进推荐结果。个性化推荐服务涉及的技术非常广泛,系统实现也比较复杂。这里介绍其中一些关键技术:
(1)用户兴趣建模。通过各种方式收集用户兴趣,比如表单、用户访问行为跟踪、用户背景信息获取等,从而建立用户个性描述的模型。
(2)用户兴趣聚类。比较用户间兴趣的异同,计算某一用户与哪些用户具有相似的资源偏好。根据用户兴趣聚类,可以把用户划分成兴趣小组,进行协同推荐。
(3)基于内容过滤(Content—based Filtering)。通过抽取用户以往访问的资源的特征组成对用户兴趣的描述,然后比较新资源的特征与用户兴趣是否相同(或相似),如果相同,则把该资源推荐给用户。采用基于内容的过滤的系统,关键是用户建模(User Modeling),识别不同用户的兴趣、目标,从而建立相应的用户兴趣模型,据此向用户提供个性化服务。
(4)协同过滤(Collaborative Piltering)。不考虑资源具有什么形式的具体内容,仅通过收集到用户对一些资源的评价(一般通过评级打分),比较用户之间的兴趣相似程度(距离),根据他与其它用户之间兴趣的相似程度(距离)和其它用户对资源集合的评价进行资源的推荐和共享。
下面以“数字图书馆个性化推荐系统”(DLPers)为例,介绍一种有效的实践方案。
“DLPers”是中国人民大学信息学院和图书馆根据教学科研用户利用数字化资源的需求而共同研发的。DLPers具有以下特征:一是针对性,即根据不同的用户采取不同的服务策略,提供不同的信息知识;二是主动性,按照用户的专业特征、研究兴趣主动推荐相应的资源;三是引导性,通过用户交互式查询和知识评价,培养用户个性、引发需求、引导需求,提高数字资源的利用率。
用户通过互联网代理服务器访问数字图书馆资源时,一般带有各自的兴趣进行查找。DLpers通过个性化推荐系统的人机交互界面,可以收集到用户访问图书馆资源的情况。对用户以往访问情况进行分析,得到用户对哪些资源感兴趣以及用户对资源的评价。把这些信息分别存放在用户兴趣信息库和用户资源评价库中。用户信息库存放了大量用户的兴趣信息,用于进一步分析哪些用户具有相同的兴趣。
在向特定一个用户进行推荐时,考虑两个方面:
其一,比较该用户的兴趣信息与哪些资源相匹配,筛选出符合用户兴趣信息的资源(基于内容的过滤);
其二,把和该用户具有相同兴趣的其它用户对资源的评价也作为推荐结果的一部分。综合这两个方面,对推荐结果作进一步分析,向用户提供预测用户感兴趣度较高且以往用户没有获取的资源信息(协同过滤)。
DLPers系统已经作为人民大学数字图书馆建设中的一个亮点开始投入试用,由于系统结合了多种推荐方式,并利用不同特征描述用户兴趣,试用效果令人满意。
5 信息定制服务
信息定制服务是指用户根据自己专业需求,对数字图书馆知识资源系统和网络学术资源进行有选择的定制,系统定期检索、下载,并按用户要求以不同方式加以推送。这是对信息检索服务的拓展,用户一次性提出检索条件和相关要求,系统根据要求定期的执行用户的检索条件,把检索结果推送给用户。信息定制服务的实质还是信息检索,主要关键技术同前述。但信息定制服务更强调以用户为中心,是一种个性化服务方式,尽管在这里并不是主动的信息推送,但是在提供该项服务时,要注意广泛了解用户需求,接受用户的各种意见建议,及时推出新的服务。人民大学数字图书馆目前提供以下信息定制服务[4]:
(1)课题检索服务。为本校教师、研究生的各种研究课题(包括研究生的学位论文课题)及校外用户的课题提供文献检索服务。可根据要求,以书目、索引、全文等方式提供检索结果。
(2)事实、数值信息检索服务。提供人文社科各学科领域有关事实性信息的检索服务。提供科学数值、统计数据以及一些特殊要求的数据信息检索服务。
(3)文献收录及被引用检索服务。查询作者、论文、期刊等被SSCI、A&HCI、SCI、CSSCI收录及其引用情况。
(4)期刊目次传递。图书馆将用户选中的每一期新到期刊的目次页用E-mail方式传送给用户。
(5)新书推介。新书推介是从新上架的新书中精选的几种有代表性的、经典的图书,做重点介绍。
6 结束语
数字图书馆建设的本质是为用户提供更加丰富实用的服务,目前取得了一些进展,但是和用户的实际需求还有很大一段距离,在资源建设与整合集成、检索方法以及主动推送的质量保证等方面都还有待进一步的改进和完善。因此我们任重而道远,必须通过实施典型系统不断探索,广泛了解用户需求,重点研究关键技术,真正把数字图书馆的建设做到实处。