基于Web3.0的OPAC概念_图书馆论文

基于Web3.0的OPAC概念_图书馆论文

基于Web3.0的OPAC构想,本文主要内容关键词为:OPAC论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 当前OPAC系统的不足

联机公共检索目录(Online Public Access Catalogue,OPAC)是用户查询与浏览资源的平台与窗口,可以查询馆藏资料及其状态信息、借书信息、违规信息等。OPAC系统自上世纪70年代诞生至今,经历了三个阶段的发展历程,每个阶段OPAC系统的功能与特点都有了很大改进,但是与高速发展的信息技术和不断推陈出新的文献类型相比,OPAC的发展仍显迟缓。在Google、Yahoo、Baidu等网络搜索引擎的影响下,90%以上的大学生首选搜索引擎查询网络资源[1],用户利用图书馆OPAC的搜索策略、搜索习惯和期望值都发生了不同程度的改变,OPAC系统的缺陷与不足越来越突出,主要体现在以下几个方面:(1)OPAC为用户提供了包括题名、责任者、ISBN、文献类型、出版者等多种检索途径,检索界面相对繁琐。(2)面对众多的资源类型,用户希望通过一次查找,就可检索到分布在纸质资源、电子资源、网络资源等不同资源类型中的资料,实现一站式检索,OPAC在日益丰富的数字资源类型检索方面面临挑战。(3)用户检索的关注点是文献内容和知识点,而不是知识的载体,停留在文献单元与载体形态层次上的OPAC显然难以满足这种需求。(4)按照学科分类进行浏览,可显示某一学科门类的信息,满足用户从学科角度查找信息族性,大部分图书馆OPAC没有提供学科关联检索功能[2]。(5)在检索方式上,缺少通配符检索、短语检索等辅助检索形式。(6)多条件检索方面,二次检索、检索词错误提示等优化检索措施需要改进。(7)缺乏用户评论、文献封面显示、馆藏地址的三维立体构成等。(8)无法根据兴趣和知识的相关度对检索结果排序。作为图书馆自动化集成系统(ILS)的子系统,OPAC的功能设置体现了图书馆的服务能力和业务水平,影响着图书馆服务质量与资源绩效。在新的网络环境下,OPAC系统应该利用Web3.0技术与理念,更新和完善系统功能,提高图书馆资源的利用率。

2.新一代网络模式——Web3.0

1994年10月由蒂姆·伯纳斯·李在麻省理工学院(MIT)计算机科学实验室成立万维网,使互联网得到迅猛发展,网络资信迅速增加。用户面对海量庞杂的信息,难以有效满足特定需求,为了解决这个日益激化的矛盾,互联网从最初的Web1.0,发展到Web2.0,再到如今的Web3.0。Web1.0的本质是聚合、联合、搜索,其聚合的对象是巨量、芜杂的网络信息。Web2.0是以Flickr、Craigslist、Linkedin、Tribes、Ryze、Friendster、3Things.com等网站为代表,以Blog、TAG、SNS、RSS、Wiki等社会软件的应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式[3]。Web3.0是Web2.0进一步发展的结果,目前还没有权威、确切的定义,最常见的解释是,网站内的信息可以直接和其他网站相关信息进行交互,能通过第三方信息平台同时对多家网站的信息进行整合使用;用户在互联网上拥有自己的数据,并能在不同网站上使用;完全基于Web,用浏览器即可以实现复杂的系统程序才具有的功能;其核心软件技术是人工智能,能够进行语义的智能学习和理解。简言之,Web3.0的网络应该是基于语义搜索+开放式Tag+智能匹配的新门户;应该是广域的、广语的和广博的,是跨区域、跨语种和跨行业的;是下一代互联网发展的核心[4]。它具有以下特征:

2.1 智能化。

Web3.0对Web2.0时期杂乱的微内容进行最小单位的继续拆分,同时进行词义标准化、结构化,运用本体对微内容进行规范描述,使其基于语义连接,微内容之间可以互动。利用RDF的三倍存储器(RDF triple store),可以迅速建立起网络内容之间的本体联系,也就是说整个因特网络可以看为一个复杂的本体库[5]。通过添加机器可以理解的元数据到网页,使机器能够理解网页内容,从而提供基于语义的检索与匹配。用户只需输入用自然语言表达的查找信息,计算机通过动态内容搜索引擎(Dynamic content engine)在三倍存储器中进行本体化操作,在网络中自动搜集,对各种信息资料的比较、权衡、甄选、评价等工作全部由计算机代替,用户得到的就是自己所需的信息。比如,在搜索框中输入“我想买一个带有电子辞典的手机,预算是2000元”,这样的查询可以很快地被解析,同时从互联网上聚合到有效的信息,组合出一套可供用户选择的方案。

2.2 个性化

在Web1.0的时期,用户只是被动接受信息,并不能修改这些信息,到了Web2.0时期,用户不仅能够阅读,而且还能发布、编辑、评论网络信息。当网络发展到Web3.0时代,由于用户的广泛参与,各种网络资源将会极大地丰富。在筛选过滤用户生产的内容(UGC:User Generated Content)的基础上,引入偏好信息处理与个性化搜索引擎技术,对用户的行为特征进行分析,既可以寻找可信度高的UGC发布源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳个性搜索方案,帮助用户快速、准确地搜索到想要信息内容,避免了大量信息带来的搜索疲劳。另外,Web3.0网络由微单元(Widget)构成,用户可以根据自己的兴趣、爱好、需求、知识等组合单元,构建出个性化的信息平台,每个人都能看到同一个模式的综合化门户将不复存在[6]。平台将根据用户信息需求和搜索偏好,通过交互界面聚合,推送用户个性化的需求。

2.3 精准化

Web3.0网站是基于用户需求的智能过滤器和多元化需求满足平台,利用Mashup技术对内容信息进行整合,并用本体精确地阐明信息内容特征,使得内容信息的特征性更加明显,从而便于互联网用户的搜索与整理;应用UGC技术筛选过滤信息,提高信息的可信度,网络更加清洁,信息的质量与可靠性大大提高;应用聚合技术和挖掘技术,使搜索信息更加迅速、准确;低层数据库信息交换机制使标准的信息实现了跨网站、跨平台流动,因此,获取信息将变得比以往任何时候都要便捷[7]。目前比较成熟的Web3.0网站有雅蛙(www.yaawa.com)、大脉网(www.my160.com)、阔地(www.codyy.com)等,都可实现信息的个性化、主动自由聚合,跨平台操作,信息一站式服务及部分Widget应用等。

2.4 兼容性

在Web3.0环境下,网络技术更加开放兼容,整个互联网就是一个数据库,每一个网络服务器都是这个库中平等的存储单元,都拥有平等的查询入口,这一数据库的查询入口可以是任何一个网络节点的终端,用户只需输入查询命令就可以了,不必考虑本系统是否与其他服务器系统存在兼容性,及本查询语句是否适合其他服务器的调用程序等问题,系统自动在后台为你操作。Web2.0只能通过PC终端链接到互联网平台上,而Web3.0具有良好的模块定制功能,Widget自由组合,所以除了PC机,移动电话、电视、PDA等都可以成为智能终端,使得各种终端的用户群体都可以享受到互联网的便利。在Web3.0条件下,语义网已经发展成熟完善,底层数据库具备完整的信息交换机制,可以直接和其他网站的相关信息进行交互,实现windows、unix和mac系统的融合兼通,并能将设计和编程、三维虚拟现实技术和交互网络编程技术等高度融合,通过第三方信息平台同时对多家网站的信息进行整合使用[8]。

3 Web3.0时代OPAC构想

3.1 OPAC成为独立系统

传统的OPAC作为ILS的子系统,密切依赖于后台数据库以及其他架构。检索引擎技术的发展为OPAC检索功能的改进提供了可能。通过一个独立的产品导出图书馆书目数据库,到一个新的检索引擎,可以根据第三方检索环境的需求重整数据格式。数据经过重新整理、建立索引、供新一代OPAC使用。由于书目数据库不断更新,外部的这个检索引擎需要通过增量更新和重新索引进行同步。这样使OPAC与现有的ILS系统分离,摆脱后台数据库的限制,根据需要灵活、方便地添加相关工具与插件,如联邦检索、链接解析器和电子资源管理系统等,以及WEB上将会出现的插件,使图书馆的OPAC与WEB环境的发展保持同步,成为独立于ILS的图书馆核心技术。

3.2 检索范围广泛

电子资源的类型和数量在图书馆资源中所占比例不断增加,用户对电子资源的需求和依赖程度也在提升。Web3.0环境下,网络资源更加丰富、更加可信,成为用户获取信息的首选;底层数据库具备完整的信息交换功能,使跨平台的信息聚合成为可能,可以将书目数据、电子资源、网络资源等整合到一个检索平台。用图书馆书目处理印刷版资源,用联邦检索处理电子资源,用网络搜索引擎处理网络资源,使图书馆所有馆藏内容(包括传统的ILS的内容和图书馆订购的全部电子资源)和网络资源都能够通过OPAC界面获取。一个更为扩展的视角是建立一个成熟、稳固的检索环境,能够处理书目数据、电子资源、网络资源,这个环境统一了传统书目的那些细致的功能,包括状态显示和请求功能,并能够同时发现在线的电子内容和网络资源。

3.3 书目内容丰富

传统书目仅仅提供基于MARC的文本显示,OPAC将增强不同来源内容的显示,加大为读者提供的信息量。这些增强内容可以与ILS系统的书目信息相结合,包括封面、摘要、目次、书评及推荐等。OPAC界面显示检索记录时,向增强内容提供方发送ISBN或者其他唯一标识符。如果找到了,就提供相关的图像或者其他数据。增强内容只显示,而不影响检索过程。增强内容弥补目前OPAC书目揭示层次浅、内容单一的问题,使读者通过增强内容提供方的信息更深刻了解图书的内容和价值[9]。未来理想的图书馆书目应该扩展适用范畴,涵盖印刷版和电子版内容,处理图书馆订购的本地和远程的内容。在这一扩展的视角中,OPAC要为所有类型的资源提供获取途径,除了文本资料,还要为包括图像、音频、视频、动画等类型的内容提供检索和显示的工具。

3.4 信息内容相关联

传统的OPAC检索结果集是一条条独立的书目记录,结构扁平单调,缺乏内容层面的相关性链接,用户不易辨别文献之间的联系。FRBR(Functional Requirements of Bibliographic Records)作为一个文献的描述模型,可以引导元数据之间的互影射,自动提供不同图书相关内容的链接[10]。我们可以引入FRBR的思想和概念来改造书目的结构,探索描述书目记录之间的联系,并将这种联系显示给用户,使OPAC可以基于书目内容关系显示检索结果。另外,可以增加可视化技术,形象地显示信息主题与相关对象之间的关系,如荷兰Medialab Solutions公司推出的Aqua Browser Library可视化OPAC系统,利用树形图来表示,用空间定位体现书目信息之间的关系,用空间节点的邻近度与布局来表达主题词相关度,节点上主题词的大小表示包含主题词的书目信息数量[11]。

3.5 检索高效准确

OPAC能够自动更正用户输入的不准确或错误的检索词,如美国北卡罗莱纳州立大学OPAC系统提供了关键词自动更正功能,输入一个错误的检索词,系统会自动更正,并提供相似单词的链接。采用分面技术提供分面导航,利用分面缩小检索范围;用户每次选择分面时,系统会返回一个携带着新分面的文献清单,这一逐渐缩小检索结果集的过程一直持续到用户对检索结果的质量和检索的文献数量都满意为止;我们可以通过不同的范畴来抽取表现分面的词汇,包括个人名称、地理名称、分类、主题、日期范围、媒体类型以及语言等,这些词汇可以很容易地从MARC记录获取[12]。另外,还可以引入WEB中的标签云,利用标签云相关协定,用字体大小来表示相关程度;用户点击云中的标签时,按照所选标签缩小检索结果集。

3.6 检索结果按相关度排序

检索结果相关度排序是检索界面成功的重要的因素之一,Google、Yahoo、Baidu等搜索引擎已经证明相关度排序是最受用户欢迎的排序方式,即使结果有成千上万个,用户最感兴趣的内容总是排在列表的最优先位置。相关度排序是通过精确的算法提炼而成,是根据其他提出相同检索请求的用户选择的条目,以及与检索主题相关的外部资源被链接的频次进行判断的[13]。OPAC可以选择目次、摘要、注释等作为相关排序的选择条目,另外,浏览率、借阅率也可以作为排序和推荐的主要指标,用户行为相关资料列表也可以成为推荐的方式。如Encore检索平台利用Innovative开发的Right Result的技术,按照相关性返回检索结果,并对结果分组,给各组都加添标签,反映相关度和本级中的文献数量。

3.7 以用户为中心

Web3.0时代的OPAC系统由微单元构成,用户可以根据个人特征和需求构筑个性化信息平台。该平台可包括读者定制新书推荐、近期新到图书目录展示,定制个人提醒服务,如快到期图书提醒、超期图书提醒、预约到书提醒、委托到书提醒,定制个人借阅信息,如当前借阅状况、历史记录、个人违章历史等,根据需求添加服务模块,如网上续借、预约、新书订购征询。OPAC对用户的检索请求进行分析、推理、拆解,在不断积累的基础上,得出用户的检索偏好,根据个人的检索偏好,对整合的数据资源进行检索。用户可以通过各种信息终端(手机、PAD等)访问OPAC系统,当用户身边没有电脑和网络,又需要立即获取馆藏资料、图书催还等信息的时候,多终端的信息服务将发挥其作用。

3.8 用户高度参与

Web3.0的一个重要特征就是信息的自由发布、整合与利用。用户是信息提供的中坚力量,图书馆将更加重视与用户的合作,提供可供用户发布、整合信息的平台,并提供强大的技术支持对信息进行高度聚合,从而能够通过多种渠道信息的整合来满足用户提出的各种需要。用户添加评注、实现RSS定制、提供标签检索,是用户参与OPAC建设的主要模式。在Web3.0时代,还增加用户之间的互动,用户可以写出书评、个人观后感等信息,让朋友分享,促进图书爱好者之间的交流和互动[14]。读者可以查到自己喜爱的图书,还可以了解他人对该书的看法,进而找到自己的书友,在和书友的互动交流中,形成某一图书知识领域的网上社交圈,大大提升图书馆的网上服务内容。

标签:;  ;  

基于Web3.0的OPAC概念_图书馆论文
下载Doc文档

猜你喜欢