美国的因特网资源组织,本文主要内容关键词为:美国论文,因特网论文,组织论文,资源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在美国,有关因特网资源组织的研究,始于20世纪90年代初。虽然因特网编目技术发展缓慢,但是在前进过程中也出现一些具有较大影响的项目,这些项目代表了美国在因特网编目技术方面所取得的重大进展。本文试图通过对不同时期因特网编目技术的考察,并从重大项目、技术特点以及研究问题等方面作出阐述与分析,为我国图书馆界因特网编目技术的研究与开发提供借鉴与参考。
一 因特网资源组织启动时期
因特网始于1969年美国国防部创建的ARPANET网。20世纪90 年代初期,因特网迅速发展成为连接政府、大学以及商业机构计算机网络的集合体。它为用户和图书馆提供电子邮件、数据存取和文件传输等等服务。因特网的发展异常迅猛,每隔6到15个月规模就扩大一倍。 为了促进网络资源的索引、定位与检索,使因特网对用户变得更加友好,大学和研究机构的信息管理者研制与开发了一批因特网查找工具,如Archie,Gopher,VERONICA,WWW,WAIS等等。
在这些工具中,使用最多影响最大的是Gopher。Gopher最初是由明尼苏达大学于1991年作为一种分布式校园信息系统开发的。Gopher之所以取得成功,是因为它不仅成为当地信息的电子出版发行系统,还成为检索电子出版物的一个途径。它由服务器向用户提供树形结构菜单索引,引导用户查找信息。其导航功能非常强,关键在于根式菜单或叫做顶级菜单的设计。根菜单总是非常简短,一般不超过5~6个切入口。所有Gopher菜单都按字顺编排。由于字顺编排暴露出一定的缺点,越来越多的Gopher改用非字顺编排的方法。根菜单不按字顺编排可以优先安排当地信息,后续链接较大网络的链路,也可以按照特定的次序进行编排。Gopher代表了当时因特网资源组织与利用的技术和方法。
网络电子信息只是一种与传统形式不同的信息,同样存在信息组织与整序的需要。只要这种需要存在,图书馆理应在电子资源环境下发挥应有的组织与整序的作用。然而,在因特网兴起初期,科研人员、计算机专业人员和网络技术人员在因特网资源组织中承担了主要责任。1993年之前,美国的图书馆还迟迟没有介入,图书馆界与因特网组织的各项研究与开发活动联系不多。据密歇根电子图书馆的管理者休·戴维西回忆,1993年她曾接到Yahoo创建者之一杨致远的电话, 杨首先称赞分类思想的伟大,接着向她请教了图书馆学基本知识以及分类法的问题,并询问她所从事的行业未来有否商业价值,戴维西笑着回答,大凡想组织因特网的人,他准是疯了,这是不可能的。戴维西的回答代表了当时图书馆员对因特网资源开发、利用的心态与看法。但是,由于科研人员、计算机及网络技术人员并不熟悉信息资源组织的方法与技术,他们十分需要具有知识分类、编目技能的图书馆员们的帮助。在这种情况下,组织与利用因特网资源成为图书馆使命的延续。图书馆员们投入到了一场信息分布与获取方法的革命之中,他们将依靠自身知识的积累,在因特网资源爆炸的情况下,不断提高技术与技能,最终成为因特网的导航者。
进入这种新的环境,图书馆员们碰到的问题是,他们将制作自己的索引,还是聚集Web资源的目录?他们如何选择主题词? 在因特网编目技术上图书馆行业能从商业机构学到什么?图书馆要跑多远才能迎头赶上?20世纪90年代初期,OCLC开始了一个研究因特网编目的计划,主要研究USMARC和AACR2对网上资源编目的适用性,试验结果表明,MARC/AACR2能够运用于网上编目,有希望找出连接书目记录和所描述资源的方法。
1993年,OCLC和国会图书馆联合组织了一个研究项目,提出一个新的MARC字段,即用来表达“电子资源网址与获取”的856字段。856字段的设置,开创了编目的新时代。
二 因特网编目技术的探索与开发时期
1993年之后,图书馆界开始参与因特网资源组织的活动。对图书馆员来说,在提高访问质量上有着施展他们知识与技能的用武之地,因为,用户们对检索结果随意性极大的搜索引擎和可浏览索引已是怨声一片。在这种情况下,图书馆员们开始进行艰苦的试验。
1 图书馆界推出一系列因特网资源组织重大项目
在此期间,许多公共图书馆都建立了Web网站, 有些网站提供数量巨大的链接,拥有4000个网站的Librarian's Index to the Internet(图书馆员的因特网索引,简称为LII)由一位参考馆员的Gopher 书签文档开始,后转为“贝克莱公共图书馆的因特网索引”,又增加了搜索引擎和主题词表,于1997年3月正式命名为Librarian's Index to the Internet。LII先后雇佣与培训100多位图书馆员参加LII 索引的编制工作,它成了公共图书馆的“核心”资源。就在公共图书馆发展LII 的同时,密歇根大学情报学院开发了另一个项目,即Internet Public Library(因特网公共图书馆), 所提供的参考资料和电子邮件咨询服务形成了它的特色。1997年,俄亥俄州几家公共图书馆同心协力大胆地进行了一次商业性尝试。她们创办了Library Channel (图书馆频道),约有80个客户,其中大部分是公共图书馆,它们既可以从24000 多个网站中进行预选,按预选的网站目录提供链接,也可以建立自己的网址索引。
大学图书馆的职能不同于公共图书馆,为了支持教学与研究,他们瞄准的是学术研究资源,而不是普及性的资源,更希望把记录连接到OPAC上。在加利福尼亚大学,有些图书馆员们认为选择主题途径可能是一种解决办法。加州大学使用修改过的LC主题词标目组织了Infomine,它是以加州大学网站索引形式起动的,资源包括若干学科领域以及社会科学、教育、政府等类信息。加州大学30位图书馆员参与了Web 网站的挑选,Informine拥有了约14000个信息源。大学图书馆界还有一个资金充足的项目叫Scout Report(侦察报告),它设在威斯康星大学计算机系,由计算机网络专家苏珊·卡尔卡里管理,提供对从中专到大学的教育者有参考价值的网络资源。Scout Report每星期五出版,每隔一周还出版三个专题的Scout Report,还有一个由WWW 创建者蒂姆·伯纳斯-李发起的World Wide Web Virtual Library(万维网虚拟图书馆),它是由来自大学方面的专家自愿提供的链接所组成的。在这些志愿者中,有位生物学家第一次创建了类似Yahoo的主网页索引,组织了约300个分散的网站。
在那段时期,商业网站也有很大发展,较好的Web 导航网站都采用了图书馆的技术与技能。当初初出茅庐的Yahoo, 此时已发展成为因特网的台柱,由可浏览的目录演变成多入口的网站。Yahoo之后出现的Look Smart从15万个域名里挑选编成目录,并提供简单的描述。1998年大英百科全书公司重组它的eBig网站,改名为eBlast,在学术结构的基础上增加了新的类目,如旅游、购物与休闲娱乐等,编有12万5 千个网站的索引,并附简短的描述,类目划分为1-5个等级,而顶层一级类目与LC相仿。受到图书馆员们交口称赞的Northern Light所编制的索引对象不是网站,而达到网页一级。1998年6 月志愿者们又组织创办了一种开放式Web目录的Newhoo网站。
2 因特网编目技术的特点
在这个时期,因特网编目采用了不同的技术和方法,但主要是开发便于使用的既能浏览又能检索的搜索引擎。LII 具有搜索与浏览两种功能,它使用了修改后的国会图书馆主题法,分为40个大类,再细分为可浏览的小类。它建立了主题规范文档,为消除不一致性,又设置了参照系统。Yahoo采用了树状主题结构, 它没有用杜威分类法或国会图书馆主题法来组织,而是以既能查找又可获取信息为目标,创建了一种能为不懂分类法的人提供搜索与浏览的结构。Northen Light具有一定特色,虽然它迟迟没有提供可浏览的目录,但是它的索引深度不是网站而达到网页一级。它响应点击的是一套套文件夹,这种文件夹是用关键词或标题进行组织的,有时检索效率很高。最具代表性的是Infomine。通过浏览和搜索两种方式,它提供了大量的检索点。字段和全文本搜索方式让用户很快查到有关学科的高质量的资源。嵌入式布尔代数搜索功能使其执行精确的搜索,搜索结果以动态产生的Web网页返回, 可以按照相关性或者题名字顺进行排列。此外,MARC856 字段的设立为网上资源编目的开展奠定了一个基础。美国的情报市场上推出了因特网MARC编目工具MARCit,把这种软件安装在图书馆浏览器上,当你要将某一网站加进本馆目录时,简单地按一下MARCit图标,输入一些书目信息,存盘,MARCit便会由浏览器“抓取”站点的标题、URL以及其他数据, 自动地在OPAC上建立一条MARC记录。
由于使用MARC实施因特网编目存在诸多的问题,如耗资费时,需要专业编目人员,跟不上网上资源变化等等,因特网社会的参与者们要研制更快更好的Web网站编目技术。1995年,OCLC 和国家超级计算技术应用中心开发了都柏林核心集元数据,即DC,一种由15个元素构成的用于揭示电子资源的元数据集,它的形式大致与卡片目录类同。元数据设计思想之一就是让创建者自己描述Web资源, 这种构想大大地吸引图书馆员用户。
3 出台了一些有关因特网编目的规则、条例
为了在共同理论和术语基础上建立一套电子资源编目暂行规则,适用于不同环境下产生的、由不同机构管理着的分散资源,在这个时期,国会图书馆、OCLC等一些著名的信息管理机构分别推出了一系列有关因特网编目的规则和条例。比较重要的有:
CONSER(Cooperative Online Serials,连续出版物联机合作编目程序)编目手册电子报纸编目规则部分;OCLC的电子资源编目MARC编码规则;OCLC南茜·澳尔松著的因特网资源编目手册与实用指南(二版);CONSER编目规程31模块连续出版物计算机文件远程检索;GPO 计算机文件编目规则;弗吉尼亚虚拟图书馆的VIVA电子馆藏编目规则;国会图书馆的06字段头标区电子资源编目规则;国会图书馆的以计算机文件为载体的制图资料识别规则;国会图书馆电子资源编目暂行规则草案;统一资源定位器地址编码规则;国会图书馆Web网页006、007、008固定字段和头标码的使用规则等等。
三 因特网编目进入重要的发展时期
自1998年以来,虽然美国因特网编目技术向前推进过程中仍存在着许多问题,但是从图书馆和大学方面一些项目所取得的重大进展以及OCLC推出了潜力巨大的CORC系统来看,表明美国的因特网编目又进入了一个新的发展时期。
公共图书馆界著名项目LII(图书馆员的因特网索引), 每月点击数达到一百万次,两年时间里增加了10倍;1998年,它链接的网站达到7000个,而二年后,又增加到1万个。现在LII正打算增强搜索与显示的功能,建立供MARC转换的输入OPAC记录的数据库。威斯康星-梅迪逊大学计算机系为了探索单一界面无缝链接技术,搞了一个试验性项目,叫做Isaac网络。该网的Internte Scout (因特网侦察)计划就是使用最少的五元素元数据集描述资源。Isaac 网的许多成员都拥有独立的资源,其中有的是图书馆创建的,Isaac 网要让众多开发者共享它们的书目记录。Infomine开始与所挑选的大学图书馆一道开展一个叫做National NetGain的试验项目,它使用公用软件来创建infomine与其成员馆共有的记录。
1998年,为了推广DC元数据项目,OCLC建立了一个开放性元数据项目平台,即“在线资源合作编目”,简称CORC。在2000年7月之前,CORC系统的发展处于“奠基阶段”,在这个“奠基阶段”里,有2000个图书馆构筑了一个赖以建设CORC的坚实基础,同时也提出了颇具见识和参考价值的反馈意见。CORC是一系列适用于Web网的编目工具和数据库,使用CORC用户能够用MARC与DC元数据格式为电子资源编目,保持记录里的URL地址,提供授权控制,创建与编辑路径导标。CORC 系统设置的数据库包括:保存电子资源记录的CORC资源目录,可由CORC途径检索的WorldCat,CORC路径导标数据库以及CORC 授权文档数据库等等。经过492个图书馆一年的试验,于2000年7月推出了有偿服务。CORC是一种描述电子资源的书目记录和路径导标的元数据创建系统,可以帮助图书馆的读者精准地检索电子资源。CORC系统给图书馆员们创造了一个机会,通过把他们对知识组织与管理的专长应用于电子资源而成为数字时代的领导者。
四 专家们对因特网编目技术发展的预测
有关未来因特网资源编目技术发展的预测,编目专家迈克尔·戈曼按照描述的级次提出了四种方案:实行完全编目;制作详细的DC记录;制作最简化的DC记录;依靠非结构化完全文本的关键词检索。而编目专家OCLC的马丁·迪龙提出另一种方案,也分为四个等级:传统的编目;某种记录极简单的像DC一样的元数据;带有简单人工编辑帮助的自动索引编制器;不带人工编辑帮助的自动索引代理器。
CORC系统,正成为在网络环境下为本地或网络电子资源创建书目元数据和寻找路径元数据的创建系统。专家们对它寄予极高的希望。OCLC总裁、首席执行官杰伊·乔丹在《因特网编目杂志》撰文预测:“CORC将发展成为综合性Web网的编目服务,并将成为OCLC未来Web网服务的重要部分。”纽约大学医学院诺姆·梅德劳斯认为,CORC系统具有巨大的潜力,它起码能够成为搜索因特网资源的WorldCat,至少可与现有的搜索服务相媲美。OCLC的CORC系统是把传统的合作编目模式移植到动态性Web环境的一种尝试。
对于图书馆界与因特网编目技术发展的关系,加利福尼亚大学理科图书馆员、Infomine协调员史蒂夫·米切尔的看法是,面对发达的商业性导航服务,图书馆界一旦退出竞争,有朝一日他们就不得不要付费访问,因此,从经济角度来看,投资开发图书馆界自己的搜索工具,不失为明智之举。而“因特网公共图书馆”(IPL )的创建者乔·珍妮认为,不应与Yahoo,Google, 甚至包括新兴的商业性专家咨询网站搞竞争,而应走合作的道路,如果这些商业性网站肯与OCLC的CORC,Scout Report或IPL结成伙伴,建立一种基本服务或高标准的服务, 那么这种结合将具有巨大的潜力。
亚利桑那大学信息资源与图书馆学学院查尔斯·西弗依说,从许多方面来看,因特网的组织是我们面临的一个最紧迫的问题,要把100 年来所学到的知识应用到这种全新的流动性极大的信息源组织上,还有一段漫长的道路要走。