Google图书馆合作计划的背景、目的与分析,本文主要内容关键词为:目的论文,图书馆论文,背景论文,计划论文,Google论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
2004年末,Google宣布与密歇根大学、哈佛大学、斯坦福大学、牛津大学及纽约公共 图书馆五家大型图书馆合作,将其数千万册馆藏图书数字化,使这些图书信息可以通过 互联网检索。2005年初,又传出普渡大学也将加入这一行列的消息[1]。Google计划是 迄今最大规模的数字化图书计划,Google虽然没有将其计划命名为数字图书馆,但其对 现有数字图书馆建设,已经产生了巨大的影响。
Google计划引起各方巨大反响。誉之者称之为永不毁灭的、指尖上的亚历山大图书馆 ,称关键词全文检索有助于研究者拓展研究范围,纽约公共图书馆主管Paul LeClerc更 认为是“自古腾堡以来信息发行史上最具革命性的事件之一”[2]。毁之者质疑通过关 键词获取图书片断信息不利于学术研究,美国档案协会主席Randall C.Jimerson认为这 将会导致断章取义[3]。
图书馆界对此项计划也存在着尖锐对立的两方观点,赞同方以对Google计划表示“兴 奋”的ALA当任主席Carol Brey-Casiano为代表[4],反对方以对Google大肆嘲弄、认为 Google以信息取代知识的ALA候任主席Michael Gorman为代表[5]。然而,在市场化的背 景下,在用户需求的推动下,对图书馆员来说,即使最激烈的反对者,或许期待Google 计划的最终失败,但更多的是明白计划终将完成的无奈。从兰开斯特在二十多年前(或 者更早还有其他人)宣告图书馆即将灭亡之后,几乎每次相关信息技术出现,就会出现 图书馆衰亡说。但无论对Google计划持赞同还是反对意见,图书馆人大多坚信图书馆不 会灭亡。图书馆所要做的,就是面对现实,作出理性的分析与选择。
1 Google计划的背景
Google数字化图书计划起源于其Google Print服务。2003年10月著名网上图书零售商 亚马逊推出基于图书全文的“书内搜索”,引起很大反响。Google快速反应,于12月推 出Google Print试用版,与出版社合作,索引图书的封面、简介、作者传记或内容梗概 上节选而得的摘要。当时只是一种书摘搜索,与亚马逊的全文搜索差距较大。随着与出 版社合作范围与内容的扩大,Google Print也开始索引图书全文。
虽然Google Print始于与出版社的合作,且在图书馆数字化计划宣布前一直申明暂无 与图书馆合作计划,但由于在版图书占所有图书的比例并不大,故而Google的目光早就 瞄向了大图书馆。在与五大图书馆经过了一年或更长时间的商讨,并且在密歇根大学做 了相当一段时间的图书无损快速扫描试验后,Google终于推出了引起巨大反响的图书馆 数字化计划。Google将Google Print向图书馆的扩展称之为“Google出借图书馆藏书” [6]。
Google Print主页开宗明义,“Google的使命是组织全世界的信息,使之可广泛存取 与使用。”[7]Google创始人之一Page自述,在创立Google前他们就有数字图书馆计划 的设想,该设想变成了Google。Page说,“我们梦想将图书馆员如此钟爱地组织的、广 泛得难以置信的信息得以联机检索。”[8]事实上,通过与图书馆合作的数字化计划,
Google将拥有海量图书的数字化图像和文本,使Google由信息的搜索者,一跃而变成信 息的拥有者,走向其组织全世界信息的终极目标。
2 参与图书馆的目的
已经与Google合作的五家图书馆,都是大型学术图书馆,历史悠久,拥有丰富的馆藏 。从五大图书馆与Google的合作协议,以及各图书馆对本项计划的说明,可以解读出图 书馆参与Google计划的目的。
2.1 建立完整的数字化馆藏
参与馆先前都有自己的数字化计划,并且有不俗的成绩。如密歇根大学图书馆每年数 字化图书达5000册,数字化率在图书馆界名列前茅[9]。再如纽约公共图书馆建立有联 机图片库,含数万取自图书、报刊与照片、印刷品和明信片的数字化图像,被评为2004 年“最佳免费参考网站”。但是,对于有着悠久历史的学术性图书馆,数百万册馆藏要 全部数字化,以现有的速度想要完成遥遥无期。借助于Google这一商业资本及其无损快 速扫描技术,在数年内实现馆藏全数字化的梦想,无疑是Google与参与馆双赢的局面。
和那些独立的数字图书馆项目不同,与Google合作建立起来的数字化馆藏,可以经由
Google访问。同时,参与馆对这些数字化馆藏拥有自己的“复本”,将与本馆计算机管 理系统紧密结合,提供本地更全面的服务。牛津大学指出,此次数字化图书活动“代表 牛津大学图书馆服务朝着发展基于自身无与伦比的实体馆藏的‘虚拟图书馆’长期目标 向前跨出了重要的一步”[10]。
2.2 促进知识获取和信息共享
参与馆在说明其与Google合作数字化馆藏的目的时,几乎无一例外地开宗明义即提到 向公众免费提供信息这一目的。作为公共图书馆的纽约公共图书馆自不待言,宗旨是“ 扩展图书馆馆藏的可访问性”,使其馆藏“由全球用户免费、民主地访问。”[11]
目前,学术信息的自由获取或开放存取(Open Access)是国外学术界追求的目标。斯坦 福大学一直致力于信息共享,从1995年起,所属HighWire出版社通过联机合作学术期刊 出版服务,向学术界免费提供高质量学术论文全文,目前可以提供数百种免费全文期刊 、近百万篇免费论文全文,为此荣获学术与专业学会出版者协会(ALPSP)2003年“非赢 利性出版服务”奖。此次与Google的合作,斯坦福大学将之“视为一个提供公众利益的 机会”,“使之让全世界读者可免费获取”[12]。密歇根大学更坦言,“广泛共享信息 是给社会的无价礼物。作为21世纪的公立大学,我们相信自己的关键使命是站在努力促 进知识获取的前沿”[13]。牛津大学指出,图书的“电子可获得将不仅服务牛津的研究 与学术,而且服务于全世界渴望知识与信息的人们,这符合Thomas Bodley爵士在1602 年创建图书馆的目标”[14]。
2.3 适应读者利用信息习惯,吸引读者利用馆藏
数字化并非目的,如果没有读者的需求为依托,为数字化而数字化不仅没有意义,而 且无法长期维持。Wittenberg进行了一项为期三年的研究,调查全美1233名学生研究习 惯,结论是电子资源成为获取信息的主要工具,尤其是本科生[15]。对很多人来说,没 有联机的信息是不存在的,提供信息的网络检索在今天尤为必要。
哈佛大学说明与Google合作项目的目的是,“向哈佛社区及更大的公众提供一个革命 性的新信息定位工具,以发现图书馆中存在的资料”[16]。斯坦福大学指出,“对因特 网用户,通过Google的图书馆计划,可以发现以前不能访问的图书,比如除图书馆之外 在其他地方找不到的绝版书”[17]。
一般认为,图书馆的读者到馆率因网络的普及而下降,但美国图书馆协会主席Carol
Brey-Casiano提供的数据正好相反:过去十年间读者到馆率增加了一倍[18]。尽管如此 ,纽约公共图书馆的数据指出,2003年有1300万读者到馆,而网站每年有来自200个不 同国家和地区的7500万次访问,这些实际与虚拟的读者都是图书馆的服务对象[19]。
3 对图书馆工作的影响
此次几大图书馆参与馆藏的数字化,美联社的报道认为“反映了图书馆在适应数字世 界中角色的转变”[20]。通过信息推送重塑图书馆形象,让读者了解图书馆的丰富收藏 ,吸引读者利用图书馆提供的服务,原是五大图书馆参与Google数字化图书计划的目的 之一。
然而,Google的数字化图书计划,无疑进一步放大了人们对网络搜索的强烈依赖。密 歇根大学认为,本计划“使图书馆可以期望与重构新千年的图书馆服务”。图书馆服务 如何重构?是一个需要认真研究的课题。
3.1 资源数字化
当图书馆采购大量数字化资源,并为平衡预算而削减印刷本订购时,图书馆作为文献 保障最终依靠的地位受到威胁,未来文献保障的阴影一直悬在图书馆头顶。与Google合 作的图书馆,保留着本馆数字化资源的所有权,用于本地进一步开发,而不是完全依赖 Google提供的服务。与Google的数字化协议包括与本馆计算机管理系统的集成,维护着 图书馆的文献保障职能。这一协议,应当成为图书馆与企业合作数字化项目的模板。
对依靠自身力量从事资源数字化的图书馆来说,对本馆独有的特色馆藏的数字化更加 有价值,能避免类似Google这样的计划出现后,使所有数字化的努力付之东流。图书馆 长久以来建立起来的馆藏,其特色部分是无可替代的。牛津大学图书馆按协议将在今后 三年内数字化100万册以上失去版权保护的旧书。但是“与Google的协议不包含牛津大 学的大量独特或特别珍贵的研究资料(手稿、档案、地图或早期印刷图书)。2001年开始 的OULS‘牛津数字图书馆’创新项目将继续其馆内目标,基于本地需求与学者需要,尽 可能多地数字化本校更高价值的资料。最终目标是与Google复本无缝连接,以质量与深 度俱佳的电子图书馆,向牛津大学用户提供无间断的网络访问。”[21]牛津大学图书馆 的数字化规划,既在公众自由获取与保持本地特色之间取得一种平衡,又强调了数字资 源的整合,堪称典范。
3.2 读者服务
人们担心的是读者已经如此依赖网络,如果图书都可在网上看到全文,岂不更无须到 图书馆?然而,由于版权保护,网上只能看到版权保护之外图书的全文。大量利用率更 高、在版权保护期内的图书只提供目次及少量页面浏览。如果要看全文,Google会提供 二种链接,一是网上书店,一是图书馆。Google早先参加OCLC的Open WorldCat计划, 将OCLC联合目录库中的书目数据结合进它的“学者”(Google Scholar)服务,对检索到 的图书提供“图书馆搜索”链接,帮助用户查找就近的图书馆。根据安排,这项服务也 将推广到Google Print中。美国研究图书馆协会执行主席Duane Webster说,“人们急 于知道,研究生、学者和市民是被引导到使用免费公共资源,还是宁愿掏钱向出版商买 书”[22]。如果读者宁愿花钱选择送书到家的网上书店,而不是费一番周折到图书馆借 书,那显然违背了图书馆参与数字化的初衷。所以,强化外借服务、改进服务方式,尤 其是加强馆际互借、文献传递服务,将是在Google阴影下强化图书馆服务、提高图书馆 文献利用率更重要的一环。
3.3 编目
Google产品主管Susan Wojcicki对Google计划的认识是“标引图书馆图书”,而这正 是原来图书馆编目工作的一部分。Google计划逐词索引图书全文,并通过其关键词检索 提供服务。图书馆编目工作长久以来建立起来的一整套规范化的揭示文献内容、提供分 析著录等方法,将被关键词法取代,存在的必要性大大下降。
也许如许多人(包括密歇根大学教务长Paul Courant)推想的那样,Google计划将引导 更多人走进图书馆的大门,但他们来只不过是为了借到实体的图书,而不是寻求馆员的 帮助。所以,强烈抨击Google计划的图书馆工作者Rory Litwin会说,“我们在Google 的图书馆计划中没有位置”[23]。最终图书馆将变成一个借借还还的场所,在内容组织 方面的专业活动几乎被抹煞,专业性丧失殆尽?现任ALA主席Carol Brey-Casiano出身于 公共图书馆行政管理,她可以满足于读者到馆人数的提高,但ALA候任主席Michael
Gorman是一位编目权威,他对此计划表示愤怒也就不难理解了。
Google的自然语言机器标引与编目工作中的自然语言与人工语言结合的人工标引,最 终竞争结果如何,仍有争议。但在笔者看来,似乎是不言自明:前者仍有改进的潜力, 而后者几乎已经走到了尽头。如果Google像桌面搜索软件那样,推出一套适合图书馆处 理海量全文数据的、不依赖元数据的搜索软件,或许编目工作真的走到尽头了。
3.4 参考咨询
现在很多人认为,网上查不到的内容就是不存在的。在一年前《纽约时报》刊登的文 章中,图书馆参考馆员还很自豪地认为,有很多东西Google上没有,需要依赖有丰富咨 询经验的参考馆员,通过不同途径在网络以外寻找[24]。但似乎这一切都将因Google计 划而改变。随着Google计划的实施与完成,图书馆中所有的内容将都能在网上找到,用 户对图书馆员的依赖进一步下降。最近有一则消息,英国某大学图书馆计划大量削减专 业馆员,包括所有学科馆员,只保留馆长、采访、编目和法律馆员各1名。无论计划最 终是否实施,它所发出的讯息,对参考咨询的未来无疑是有负面影响的。
由于网上可以得到图书馆的所有信息,今后读者到馆的唯一目的或许就是借阅所需图 书。如果图书馆希望继续向读者提供帮助,或许只有选择或扩大参考咨询工作的虚拟化 或数字化程度。
4 结语
国内图书全文的数字化工作已经开展多年,大型的有中国数字图书馆、超星数字图书 馆、方正Apabi数字图书馆等。然而,这些数字图书馆具有相当的封闭性,既不是免费 的,也不能通过搜索引擎检索,甚至还需要安装各自的浏览器才能阅读图书全文。对国 内汉语文献来说,目前既没有古腾堡计划等大规模的免费全文图书计划,也没有Google 的数字化计划,数字化图书不过是图书馆购买的一种数字资源,对大量更习惯于网络搜 索的用户影响有限。然而,有以往Google各项服务从英语开始试行、逐步向其他语种推 行的先例,若干年后Google大规模数字化汉语学术文献的可能性也是存在的。大型图书 馆多年积累的丰富馆藏,对于任何意图组织网络信息资源的企业,都具有吸引力。即使 不是Google,或许也会有其他企业效仿Google模式进行汉语文献的数字化工作。未雨绸 缪,应对可能存在的挑战,对国内图书馆也是很有必要的。