未来图书馆信息服务的新模式——与商业搜索引擎联姻,本文主要内容关键词为:信息服务论文,新模式论文,图书馆论文,未来论文,搜索引擎论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[中图分类号]G250.7 [文献标识码]A [文章编号]1005-6610(2009)07-0013-05
在信息通讯技术的强有力推动下,我们进入了一个全新的网络时代——Web2.0。人们的信息行为发生了很大的变化,更加关注快速、有效、便利的共享信息。正如维基百科所显示的,在这个时代中,人们获取信息的首选是网络、搜索引擎,而谷歌是其中最受欢迎的。[1]当学术谷歌如火如荼的发展之时,谷歌又风风火火地开展其数字图书馆计划,图书馆界不少人士都对此忧心忡忡,图书馆面对如此强大的竞争对手,将如何去发展?谷歌是否会取代图书馆?图书馆信息服务应该如何定位?联姻——竞合,也许是最好的答案。通过与搜索引擎进行合作,图书馆可以使自己在网络环境可见。
1 图书馆信息服务转型的必要性
Web2.0时代的到来,现代信息通讯技术的运用,如Wiki、RSS、SNS等网站,正在改变人们的信息行为。Web2.0环境下,图书馆信息用户转变成为了信息消费者,他们可以在以下多种信息服务提供方式中进行选择,如商业搜索引擎、SNS网站、维基百科、网络标签以及由图书馆提供的电子资源。但是需要我们注意的是,OCLC的2006年全球报告中曾指出,有89%的大学生在进行信息搜索时会选择商业搜索引擎(如谷歌),而仅有2%的学生会选择图书馆的网站。人们信息行为的改变从一定侧面反映了信息服务模式的转变。Web2.0环境下的信息服务更多的是要关注用户的感受。
图书馆的信息中心地位在Web2.0浪潮下开始动摇,图书馆的信息资源已经不是用户在进行信息搜索时的首选。因此,在这样的大环境中,图书馆应当利用各种网络工具与平台,全面地多层次地揭示图书馆的信息资源。
互联网用户的行为习惯已经从门户走向搜索,再走向社会网络空间,而图书馆追求的是相反的资源利用模式(如图1所示),即让用户从社交网络至搜索引擎,再至图书馆门户,最终的目标是为了提高资源的最终达到率。
图1 图书馆的反资源利用模式
在Web2.0环境下,我们需要做的是将资源与服务推送至网络或搜索引擎,从而将过去图书馆资源的黑箱变成透明的,但装满资源之箱仍是过去那个图书馆,只不过我们运用更多方法与手段让资源之箱变得多层次立体化地透明而已,而搜索引擎便是这些手段与方法中最重要的一个。[2]其结果也许正如OCLC总裁兼CEO的Jay Jordan在OCLC与谷歌进行合作时声称的,“我们很高兴能够与谷歌合作,通过国际图书馆的合作来完成我们将用户和知识连接在一起的使命。”[3]下面我们将分析谷歌与全球最大的图书馆合作组织OCLC的合作模式,以期从中寻找到未来图书馆信息服务的新模式。
2 OCLC与Google的合作模式
在数字图书馆计划后,而今互联网搜索巨头谷歌继续前进,并以雄厚的资金支持图书扫描计划,同时,加强与图书馆界的合作。2008年5月19日,谷歌与OCLC签订合作协议。借助谷歌图书计划扫描的数字化全文和搜索技术,用户可以轻松寻找到感兴趣的图书,并通过与WorldCat的链接,又可以轻松地定位到拥有该图书的图书馆位置。
2.1 OCLC与谷歌的数据交换协议
2008年5月19日,OCLC与谷歌签订数据互换协议,通过谷歌查询服务支持用户查找图书馆的馆藏。
按照该协议的规定,参与谷歌图书搜索项目的OCLC成员馆,可以与谷歌共享从WorldCat中得到的MARC记录,从而,更好地支持其用户通过谷歌查询图书馆的馆藏资源。谷歌会在谷歌图书搜索和WordCat.org之间建立链接,这将会增加图书馆OPAC(联机公共目录查询系统)和其他图书馆服务的访问量。谷歌将与OCLC共享数字化图书的数据和相关链接,从而,使OCLC有可能在WorldCat中为OCLC成员图书馆表征数字化馆藏。谷歌可以直接从OCLC或者参与该项目的OCLC成员图书馆获得WorldCat元数据。新签订的协议允许OCLC创建MARC记录描述来自其成员馆的谷歌数字化图书,并建立相应的链接。
2.2 检索模式的转化
对于大量的Worldcat成员来说,OCLC与谷歌合作模式的确立实现了检索模式从网络搜索到实体定位的转化。
此前不久,谷歌又推出了新的图书搜索APIs,新的API接口提供了通过ISBN、LCCN和OCLC馆藏号查询Google Books中的相关信息。通过该接口,Worldcat.org用户利用“Get It”链接指到谷歌已经扫描的图书。如果用户在Google图书搜索中发现了一本书,也会通过Worldcat.org链接指向本地图书馆,这就可以完成图书搜索从网络到实体的定位。最终可以通过馆际互借的方式获得此书。
检索模式的转化为用户提供了极大的便利。如图2所示,在此种检索模式下,允许用户依据其使用习惯,通过两种方式进行检索:一个是通过谷歌;另一个是通过Worldcat。用户可以在任何一个地方发现哪一种资源被数字化、数字化的内容存放于何处以及相关资源间的联系,如图书的版本信息、实体图书的馆藏位置等。
图2 图书检索模式
2.3 合作影响
谷歌通过加强与图书馆合作,与图书馆相关服务项目合作,借以为用户提供更多的资源搜索与获取。通过数字化图书馆馆藏,可以增加图书馆的数字资源。“加入Google图书搜索图书馆计划将会显著增加图书馆已提供的数字资源”[4],负责信息服务的哥伦比亚大学副校长、大学图书馆馆长James Neal说,“这让图书馆可以将大部分比较特别的档案和特殊藏书向全世界的学者和研究人员开放,通过这种方式最终改变他们的学识”。[5]
对于OCLC来说,Worldcat拥有世界上最多的图书书目资源,而与Google合作之后,这些资源将被用户在更短的时间内更精确地揭示出来,并为用户链接出实体图书馆资源的存放地点和位置。图书搜索可以使用户快速获取图书主题的基本信息,而不必仅局限在附近的图书馆或书店中。Google创始人布林则对此协议如是说,“Google的目标是组织全世界的信息并使之广为获取与使用。今天,我们与作者、出版者及图书馆一起,向这个方向跨越了一大步。本协议是双赢的,而真正的胜利者是所有的读者。现在,全世界图书中蕴藏的巨大知识财富将存于他们的指尖。”[6]
3 合作模式优势分析
3.1 提高商业搜索引擎检索质量
谷歌数字图书计划的第一个合作者并非图书馆,而是出版商,但考虑到在版图书资源极为有限,而丰富其检索资源的最佳途径便是与图书馆进行合作,只有依靠图书馆的丰富馆藏,谷歌图书搜索才能有更多的内容。另一个方面,OCLC为谷歌提供Worldcat中的元数据,如标题、著者、主题等等,在一定程度上也提高了检索的精确度。
此外,在谷歌图书高级检索中,提供了图书馆馆藏目录的检索,通过此项检索功能,可以更加精确地定位所需信息,而馆藏目录是由相应的图书馆所提供的。
需要注意的是,在使用谷歌搜索引擎的过程中,谷歌仅仅提供了关键词索引,而没有提供主题索引,虽然它的关键词和短语检索质量相当的高,但是受到自然语言(中文检索在这方面的问题很突出)的限制,有可能因为切词的问题,而搜索出某个与主题毫不相干的条目,因此,查准率并不能完全保证。图书馆在信息资源管理过程中对此方面的大量研究或许可以弥补这些不足,从而进一步提高检索质量。
3.2 增加图书馆及其资源的透明度和服务范围
谷歌与OCLC所签订的数据交换协议使得图书馆与谷歌共同提供信息内容给网络用户,这在一定程度上增加了网络用户通过搜索引擎获取图书馆资源的机会与透明度。OCLC副总裁Chip Nilges指出,“用户可以通过Worldcat或者谷歌寻找到所需的资源。”[7]此外,谷歌推出的新的图书搜索APIs在一定的程度上加大了图书资源的透明度。
需要强调的是,图书馆信息服务的宗旨是为用户提供信息资源,使得馆藏资源能够在最大范围内得到共享。但是,由于多种因素的影响,图书馆内的实体馆藏资源在一定范围内进行流通,服务于极为有限的读者群。而通过与谷歌的合作,大量的资源被提供到互联网上,由此,任何一个用户都可以使用到这些信息资源。从某种意义上讲,这样的合作开创了一种图书馆信息服务及利用的崭新模式,是一种更大范围的资源共享模式。正如CIC的主管Barbara McFadden Allen所指出的“这种与Google的伙伴关系是机构协作委员会(CIC)历史上最具特别意义的壮举之一,并为图书馆服务和信息访问的重要转型提供了舞台。我们开放了这些资源,以供各大学之间共享,并更广泛地将这些资源推向社会大众。”
从另一个角度看,图书馆与谷歌合作,将图书馆的馆藏资源置于互联网中,一方面,使得广大用户在使用搜索引擎进行资源检索时,可以对图书馆及其服务有更多的了解。另一方面,当互联网中缺少了用户所需的资源,如实体馆藏资源,就会吸引用户回归到图书馆。
3.3 加速数字图书馆的发展
图书馆发展的大趋势是建设数字图书馆,虽然谷歌的数字图书馆计划不可避免地会掺杂着商业动机与行为,但是不能否认,谷歌的数字图书馆计划加速了数字图书馆的建设。就资金和技术实力两个角度来讲,谷歌都是一个较为完美的合作伙伴。
图书馆数字化建设中的至关重要的数字化扫描成本非常高,密歇根大学曾指出,依靠他们自己的力量对所有的馆藏进行数字化,大约需要六十亿美元的投入。[8]而谷歌作为一个新近快速崛起的商业新贵,有着较为雄厚的资金实力,依靠其利润极大的运营模式,有着足够的实力对图书馆的馆藏数字化进行持续的资金支持。
在进行馆藏数字化时,谷歌还提供了先进的数字扫描技术,这一扫描技术可以快速、无损伤地进行图书的扫描工作,同时提供严格的质量检测以及OCR转化来进行大规模的数掌化运作。此外,一些已经绝版的图书文献是非常珍贵的,在数字化扫描的过程中极容易损坏,而谷歌的数字扫描机器会确保这些图书文献的完整。
另一个方面,数字图书馆是技术的集成体。在进行数字图书馆的建设时,需要大量的技术投入,但目前的状况是,考虑到大型商业搜索引擎在目前技术研发阶段的不断攀高的技术投资以及图书馆静止抑或是不断下降的科研经费,似乎目前图书馆最为有效的运营方式就是将图书馆馆藏内容与商业搜索引擎紧密连接。
4 合作前景展望
图书馆与商业搜索引擎的合作,对图书馆今后的发展将产生深远的影响。在越来越多的图书馆选择与谷歌合作的趋势下,互利共赢是大家所期待的结果。在与商业搜索引擎进行合作的同时,图书馆应当适时地调整自己的建设战略以适应新的合作模式。
4.1 图书馆馆藏重心的转变
OCLC与谷歌的合作,目的就是为了提高资源的利用率。通过网络搜索到实体资源的定位,届时很多数字资源及馆藏实体资源都会实现最大限度的共享。我们所要构建的是一个动态、互联、共享的信息存储空间,其中聚合了各种有用的信息。基于此,图书馆在进行馆藏建设时,不应再固守在以往的面面俱到的方式。事实上,在与商业搜索引擎合作的大环境下,图书馆所面对的用户已经扩大到世界范围内,要做到大而全的馆藏模式也是不可能的,因此,应当坚强特色资源的建设。试想,在网络环境下,坐拥着特色资源、珍藏资源或者专业资源的图书馆必将大受用户的欢迎。在用户愿意为信息付费的前提下,用户可以通过网络共享数字资源,而图书馆在这方面所做的仅仅是对访问的ID或IP进行控制。对于图书馆实体馆藏的资源共享,可以通过馆际互借的方式进行。也许在不久的将来,图书馆也可以实施品牌化的战略经营方式。
从馆藏建设经费角度来看,图书馆可以通过互联网共享大量资源,因此,在采购时可以减少对这部分资源的投入,从而可以节省部分馆藏建设的经费。
4.2 图书馆员身份的转变
谷歌在与图书馆的合作过程中将提供大量的技术支持,未来的局面将会是机器与人脑的合作发展,图书馆能否发挥人的作用,将会是这场合作成败的关键。因而,图书馆应当更多地关注馆员在信息服务中所起的作用。图书馆员应当完成信息管理者向知识提供者的转变。
另一方面,在现代网络环境中,图书馆外的信息的利用要远远多于图书馆内的信息。而且,信息获取的方式也大都是虚拟的。图书馆员在这个时代的主要贡献不仅仅是收集、组织与传递信息,这些都可以交由网络工具来完成,更多的是提高解答疑问的质量。或许我们正在走向一个参考、计划与社区图书馆事业复兴的时代。在用户需求为主导的背景下,图书馆伴随用户的不是机器和算法,而是为用户提供最好服务和经验的人。[9]
4.3 更多的战略合作伙伴
在谷歌与图书馆的合作过程中,某些图书馆系统提供商也认识到搜索引擎的强大功能和作用,而与其加大开放与合作,以期将图书馆资源进行更好的配置,将资源更为精确地推送给用户。如Ex Libris公司所推出的SFX技术(链接解析技术),通过ScholarSFX在Google Scholar搜索结果中额外提供一个链接,用于提示用户其所需的电子文献或书目是否在其SFX技术所支持的图书馆馆藏内,也就是说,当所检文献属于用户使用配合有ScholarSFX技术的学术谷歌进行搜索时,其实质是利用“Google的搜索+图书馆的文献资源+互联网资源的揭示+图书馆馆藏信息+SFX敏感链接工具+用户ID或IP控制”的方式,直接提供给用户便捷的“一站式”资源获取服务,这样读者不仅能查找到所需信息,还能依据所属图书馆的访问权限直接访问资源。[10]
4.4 图书馆业务外包的趋势
在Web 2.0环境下,信息行为不断变化,用户的需求难以把握。社会网络的出现展示了信息服务的新视角,帮助我们更好地服务于用户,开拓信息服务的新模式。显而易见,信息服务的商业同仁们在这构建社会网络的平台方面,已经领先了一步。
在以用户需求为主导的大环境下,图书馆应当做的是利用Web 2.0所提供的基于分享、交流、合作的社会网络平台,更好地为用户服务。OCLC的2007年全球调查报告指出,图书馆应当积极参与并建设基于图书馆的社会网络空间,然而,构建一个好的社会网络空间同样需要大量资金与技术的支持。这种情况再度将难题置于图书馆面前,也许与谷歌的合作仅仅是一个开始,图书馆将会把更多的业务交给其他商业机构来承办。为了能够继续在未来的学术数字资源的市场中生存下去,图书馆必须采取的策略之一就是将其核心业务简化,将相关业务进行外包。
在人们追求梦想中的亚历山大图书馆的过程中,图书馆与商业搜索引擎的合作是一种必然,图书馆应当做的是找好自己的位置,注重人的重要作用,在联姻中更好地发展自己。总之,从这场举世瞩目的联姻中,我们已经看到数字图书馆正向我们策马而来,图书馆必将迎来更加光明的未来。