图书馆编目的困境与未来--随图书馆生存与死亡而编撰元数据_元数据论文

图书馆编目的困境与未来--随图书馆生存与死亡而编撰元数据_元数据论文

图书馆编目的困境与未来——与图书馆共存亡的元数据编制工作,本文主要内容关键词为:图书馆论文,目的论文,困境论文,未来论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      与图书馆共存亡的元数据编制工作

       图书馆信息组织,旧称图书馆编目,包括对各种文献信息资源的客观描述与著录、主题揭示与标引,及以检索、浏览、导航推荐服务为目的的资源内容与形式的有序组织。图书馆信息组织的“产品”为元数据,包括传统书目、机读目录、以各种检索点为序形成的索引以及规范元数据检索点的元数据(分类法、主题词表、名称规范的元数据),即书目型与规范控制型元数据。

      近些年来,在互联网迅速发展的外部环境下,出现了大数据包括冗余数据处理的困境,图书馆结构化元数据的社会化开放获取、关联化建设及与数字资源元数据整合等方面显得尤为重要。国外图书馆界在信息组织方面的研究也极为活跃,以欧美图书馆和IFLA为代表,在书目功能需求、元数据RDF化、关联数据建设、联合目录共建共享以及与互联网搜索引擎联合共建语义网等方面的研究与实践较为突出。同时,在信息组织领域也出现了从名称到内容的转型,如IFLA于2004年在书目控制部下成立“知识管理组”,以创建、储存、共享和复用知识为目的;作为图书馆编目的权威规则即《英美编目条例》修订改名为《资源描述与检索》,其目的在于改变传统编目理念,以知识组织为目的,满足网络环境下所有资源描述与检索的新要求。在我国,图书馆信息组织工作面临更多的却是困惑与困境。

      一、我国图书馆信息组织工作社会化后的困境

      一方面是对图书馆的书目元数据、名称与主题揭示的规范元数据,从内容到形式提出更多获取要求,面临着走出行业、走出国门、去专业化、直观可视化的技术应用困境;另一方面,面对信息资源膨胀及图书馆经费不足等环境,图书馆出现社会化的信息组织需求,形成不同行业的各级联机联合目录建设,共享套录元数据,同时也出现书商生产元数据并直接免费提供给图书馆或联机编目中心的现象。良莠不齐的元数据不仅缺少系统性、一致性的保障,而且各类联合编目中心或图书馆也同样缺少必要的名称与主题的规范元数据控制、元数据整合、特定资源的深度揭示以及国内或国际联合编目中心之间共建共享式的合作。

      社会化的信息组织工作给图书馆带来了高效率、低成本、资源能够及时上架服务等益处,但带来的负面影响也极大,出现信息组织产品质量明显下降的事实:权威经典元数据越来越少,需深度挖掘揭示的元数据越来越少,不能准确或针对性或关联化地揭示文献主题、提供有效的主题检索点的元数据越来越多。逐渐膨胀的元数据重客观描述著录,轻主题揭示及分类标引,轻关联数据揭示等智力要求较高的知识组织。这些问题与信息组织工作社会化后,编目员没有及时转型,或编目理念、图书馆管理理念没有及时转变或错误转型有关。

      信息组织是信息服务的基础,在信息爆炸及大数据时代,信息组织理应成为图书馆的核心业务。但事实上,信息组织工作社会化后,我国图书馆的核心业务即编目工作却在市场经济的大潮下被边缘化了。图书馆多年积累的经典的信息组织方法,如分类法、主题法、名称规范法、目录索引组织法等软实力,不仅没有加强反而越来越淡化。但这些越来越多地被网络信息组织及搜索引擎所利用,应用到“本体”“分众分类法”“标签系统”“发现系统”“导航系统”等。更重要的是,能够领会分类法、主题法以及书目和索引组织的专业编目员也越来越少。如国家图书馆和中国图书馆学会信息组织专业委员会组织召开的全国编目会议以及知识组织方面的会议,以此为题来撰写论文的数量极少。

      二、我国图书馆馆藏目录机读化、自动化后的困境

      图书馆馆藏目录机读化后,目录编制由自动生成数据库索引替代,虚拟索引的编制越来越成为纯技术的通用产品,知识组织理念及编目员的用心和重点揭示内容很难体现在检索系统的索引中。元数据组织与应用流程致使编目员不能参与虚拟索引的编制,甚至导致其对虚拟索引的编制方法、编制形式越来越陌生,造成信息检索系统与信息组织工作越来越脱节,图书馆的核心价值产品即元数据或二次文献(书目或索引系统)及其应用严重“缺损”。功能体现在文献检索途径、浏览途径、检索方法的索引越来越不能满足读者需要,检索系统在技术上缺少可视化、关联化的索引界面,在类型上缺少权威规范的内容检索途径或分类浏览界面,令读者失去利用图书馆元数据查找资源的兴趣等。

      其后果将造成进入图书馆知识殿堂大门的“钥匙”不在图书馆人手里或图书馆人不会使用元数据及其工具,那么图书馆人如何开展读者服务,图书馆与书店、展览馆还有没有区别,图书馆还有无存在的必要及是否能存在等问题,值得图书馆人深思。数字图书馆、移动图书馆及数字资源获取有其网络技术以及全文检索技术的便利,但仍然代替不了元数据提供的系统性、专指性和关联性的检索方法。先进的网络技术、移动技术、数字技术、云技术必须与信息组织方法、原理有机结合,才能够发挥出元数据应有的功能,对元数据内容系统地组织与揭示,图书馆才可能成为资源利用中心,才可能游刃有余地处理大数据。

      如2014年国家图书馆应用ALIPH系统的元数据库索引技术,成功实现了我国基于叙词的资源主题的规范控制功能,解决了数据库建设以来国家图书馆书目元数据与主题规范元数据的动态同步更新的问题。又如2009年《中国分类主题词表》Web版研制上线,通过互联网技术集成多个OPAC检索系统,解决了从知识角度、学科角度跨库浏览和检索分布在我国各图书馆及各主题网关内的信息资源,满足了一站式的分类与主题检索文献的需求,同时也有助于用户对新知识的学习和发现,帮助实现更多关联知识与资源的获取。这些都是国家图书馆应用软件技术与内容元数据组织需求结合较好的案例。因此说技术不是万能的,能够实现书目功能、直观揭示和优化书目功能的技术才是万能的技术。

      三、与图书馆共存亡的元数据编制与应用

      不言而喻,与在互联网获取资源相比,国家图书馆及各级各类图书馆都有着各自的核心价值及特有功能,但任何功能的实现都离不开形形色色的资源服务,开展任何资源服务没有优良的资源建设与信息组织将是寸步难行。具有悠久性、稳定性、系统性、连续性、唯一性、多样化、结构化的图书馆书目系统及其支撑系统(分类法、主题词表、规范控制系统)即元数据系统是图书馆生存的基础,如此核心的图书馆业务不能因为它专业性强、复杂、精细、投资大、耗时耗力而简之远之弃之,这样就如同废弃《四库全书总目》来了解中国上下五千年的历史文化典籍一样。因此,元数据编制工作与图书馆共存亡,图书馆编目工作应为元数据的编制完善与应用拓展而正确转型。

      首先,编目员应转型为精准和深度揭示资源的元数据编审专家、各类资源元数据的整合专家,资源主题揭示(分类与标引)、关联揭示、名称规范等完善元数据的生产者,成为分类知识库、主题知识库、名称知识库元数据的生产者,知识组织系统的设计者、参与者,成为新技术应用于元数据的“桥梁”及其设计者,成为检索系统需求的规划者、索引需求的设计者。总之,面对图书馆编目工作的社会化、自动化,编目员应从机械量化的体力劳动中解脱出来,及时转型成为生产元数据的脑力劳动的创造者,能够对馆藏资源元数据制作提出不同层次的标准,并参与不同层次的元数据细化和整合,开展培训指导,对特色资源、重点保存资源或学术资源等进行主题深度揭示、关联揭示,开展元数据内容组织和控制,参与目录索引组织,提出自动编制索引的软件需求。

      其次,对于编目流程而言,元数据的初加工、客观描述、简单套录、形式与格式的校验等工作应社会化或自动化,并对社会化、自动化工作开展与时俱进的需求培训。图书馆或各级联编中心面对套录的或书商提供的元数据应制定必要的、有针对性的审校和规范控制流程,开展主题揭示与规范控制工作。还应联合共建规范数据并开展本地特色数据整合工作,细化各类内容各种形式资源的编目流程,如大众通俗读物和学术著作的编目流程与揭示深度应区别对待。

      第三,树立跨行业兼容的资源组织理念,对来自不同行业的数字资源应以统一服务为目的进行虚拟整合与互操作。面对资源膨胀,社会化、自动化的分解工作,图书馆或联编中心应从文献形式到文献内容的揭示深度、广度以及规范控制等方面制定必要的质量控制规则并进行控制工作。特别是国家图书馆及各级联合编目中心,应联合共建主题规范数据或分类法数据,并编制所需的各范畴主题或分类揭示体系及领域本体,为中文信息资源虚拟组织、内容组织、知识组织提供权威的、可复用的知识元数据。

      第四,分类法、主题词表是图书馆、情报系统中长期广为应用的、经实践检验的、权威的学术资源组织的有效工具,也是以知识为单元的结构化、系统化的元数据。我国主要以《中国图书馆分类法》《中国分类主题词表》为代表,该元数据长期由国家图书馆《中国图书馆分类法》编委会负责组织业界编目专家进行维护与修订,出版或发布了机读化、电子化、网络化的相应产品,满足了业界用户的使用需求。在互联网环境下,仍需发扬光大。这同样需要编目员及广大互联网用户以新的参与模式,应用语义网技术、移动技术、可视化技术、云技术搭建动态的编制更新平台,以改造主题元数据体系结构,增补新知识及入口检索途径,对知识重组、复用,建设新型的兼容各行业资源组织需求的知识组织系统的元数据,满足互联网用户查找学术资源的需求。

      最后,随着我国经济的发展,政府对信息资源开发利用投资的加大,我国图书馆在组织管理、经费投入、专业队伍及业内外合作等方面应采取必要措施,加强信息组织工作,生产出传统文献与数字资源组织的元数据精品、权威文档。图书馆编目员应成为我国信息组织的主力军、引导者、内容揭示者、知识组织者,为我国学术资源组织、深度挖掘提供适用的元数据,为学术资源获取、良性增长与应用做出应有的贡献。

       文献编目:图书馆的最后专业技术领地

      2006年,在美国国会图书馆MARCXML研发进入最后阶段的时刻,主张技术创新的刘炜、李海青等图书馆学人开始列举MARC的“七宗罪”,诅咒传统的MARC,提出“MARC必须去死”或者“让MARC安乐死”,而图书馆编目专家胡小菁则认为应该“让MARC继续活”,由此引发了图书馆学界的网络热议。乃至2008年4月13日在杭州举行的“Web/Lib2.0第三次研讨会”上,组织者专门举办了以“2.0时代究竟是让MARC安乐死还是让MARC继续活?”为主题的“技术酒徒PK人文烟鬼”(刘炜PK程焕文)学术娱乐辩论赛[1-6]。胡小菁曾撰著《编目的未来》,客观分析了这两种截然不同的看法,提出“在互联网时代,实际的编目工作已经显现了四大发展趋势,即编目格式简单化、编目外包普遍化、数据来源多样化及联合目录本地化。”[7、8]其后,有关编目未来的学术争鸣一直不绝于耳,今后这种争论也不会休止,如同“图书馆消亡论”一样,只要有新的技术挑战出现,就会有新的“安乐死”论调出现。虽然MARC面临着数字时代的各种严峻挑战,但是,笔者认为MARC不会沦落到生命垂危乃至需要采取“安乐死”以表达“临终关怀”的境地。

      1.编目是图书馆的核心技术方法

      图书馆的技术方法众多,但是关于究竟什么是图书馆的核心技术方法,一百个人可能有一百个不同的说法。如今,也许人们根本就说不清什么是图书馆的核心技术方法。尽管如此,这个问题始终是无法回避的,或者迟早都是要面对的,因为这个问题关乎图书馆的专业特性。

      回顾图书馆的发展历史,图书馆的主要技术方法基本上都是围绕信息资源的整理和利用展开的。正因为如此,图书馆的技术方法大致可以分为两类:一类是建立在纸质信息资源基础上的技术方法,例如:分类法、主题法、编目法、索引法、文摘法、卡片目录法、检字法、闭架法、开架法、参考咨询法、缩微法、文献复制法等;另一类是建立在数字信息资源基础上的技术方法,例如:联机检索法、电子文献传递法、元数据法、知识发现法、网络信息检索法、网络参考咨询法等。

      严格地说,这两类技术方法在本质上并没有差别,不过是不同形式信息资源的不同处理技术方法而已,因为图书馆馆藏信息资源的发展变化必然引发图书馆专业技术方法的发展变化。这不仅是自然规律,而且是不可抗拒的自然规律。

      然而,新世纪以来图书馆馆藏信息资源的发展变化引发了图书馆的彻底革命,这场革命主要体现在两个方面:其一,图书馆从信息资源的所有者开始蜕变为信息资源的使用者;其二,图书馆开始从信息资源技术方法的研发者蜕变为应用者。

      在纸质信息资源为主的时代,图书馆是信息资源的拥有者和主宰者,具有至高无上的主导权和话语权:一切技术方法都以图书馆为中心,如何整理信息资源和提供信息资源,都以图书馆的意志为转移。虽然其中也有读者需求的因素,但基本上都是次要的。正因为如此,图书馆的分类法、编目法等技术方法在自以为是的发展中,不断由简入繁,与读者的需求渐行渐远,以至于进入数字时代以后颇为读者诟病,亦不为业内待见。

      在数字信息资源为主的时代,图书馆开始沦为信息资源的使用者和被宰者,其主导权和话语权悄然沦入数据商或者技术商之手:一切技术方法都以数据商或者技术商为中心,如何整理信息资源和提供信息资源利用,都以数据商或者技术商的意志为转移。虽然其中也有图书馆需求的因素,但基本上都是次要的。正因为如此,新的技术方法抛弃了过去“思想性、科学性和实用性”三性相结合的特性,只注重实用性。一切删繁就简,以便利为原则,与用户的需求越来越贴近,以至于图书馆业界倍感失落,而用户喜闻乐见。

      这正是新世纪以来文献编目陷入困窘的原因之所在。惟其如是,建立在纸质信息资源基础上的图书馆技术方法才是图书馆特有的技术方法,而建立在数字信息资源基础上的技术方法则是泛在的技术方法,与图书馆并没有本质的联系。从这种意义上讲,无论今后图书馆的技术方法如何变化,文献编目始终是图书馆特有的核心技术方法。

      2.编目是永不凋谢的图书馆之花

      虽然“让MARC安乐死”的声音一直不绝于耳,但是,文献编目仍然具有顽强的生命力,在未来仍然会长久地存在和发展。

      在过去的两百年间,文献编目的发展变化直接导致了图书馆的革命性变化:卡片目录的出现彻底地改变了图书馆馆藏信息资源的利用方式,成为近代图书馆发展的技术主导,由此引发了分类法、编目法、检字法、索引法等技术方法的飞速发展;机器可读目录(MARC)的诞生标志着图书馆开始进入以计算机为主的自动化时代,推动了图书馆界的信息资源共享。在这种意义上讲,编目的发展造就了图书馆的昔日辉煌。

      这种昔日的辉煌直到今天仍然光彩照人。可以毫不夸张地说,在当今世界上,没有哪一个社会机构能够像图书馆一样如此高度地标准化,而这种标准化全赖于国际书目著录标准(ISBD)和各国与此相匹配的文献著录规则,以及MARC和UNIMARC。如果“让MARC安乐死”,那么,也就意味着图书馆自动放弃近一个世纪以来的标准化,无异于自毁长城。况且,即使在元数据如日中天的今天,虽然MARC过于繁琐且有诸多瑕疵,但是MARC仍然是揭示文献资源的最全面的“元数据”。罔顾这个事实,就会陷入专业“虚无主义”的泥潭,不能自拔。

      20世纪初年,当杜威法和西文编目法传入中国以后,四库法也经历了一场革命,可是半个多世纪过去了,如今各个图书馆的古籍编目基本上又回到了四库法的老路上来了。这种编目法的“复辟”说明了一个道理:特定的信息资源不灭,特定的技术方法就不会死。同理,纸质信息资源不灭,文献编目或者MARC就不会死。

      20世纪80年代以来,中国的纸质出版物数量一直在持续增长,现在的年出版量已经超过40万种,高居世界各国年出版量之首。图书馆的馆藏纸质书刊同样在飞速增长,与数字资源比翼齐飞,编目或者MARC编目仍然是各图书馆整理纸质信息资源的基本方法。OCLC的联机编目并没有因为数字资源的飞速增长而衰落,各个图书馆的编目数据也在与日俱增。只不过书目数据的重要性不再像过去那么重要,正如图书馆自动化集成系统曾经是图书馆现代化的标志,现在已退居次要地位一样。但是,次要不等于不重要,更不等于可以不要,因为如果没有文献编目,没有图书馆自动化集成系统,那么,图书馆的运转将难以想象。

      虽然编目外包越来越普遍,但是这并不能说明编目越来越不重要,只能说明编目技术的推广应用越来越广泛,是发展壮大,而不是技术旁落。

      可以说,只要纸质书刊存在,文献编目就不会消亡。

      3.守护图书馆的专业技术领地

      在数字信息资源飞速增长的今天,纸质信息资源的地位日趋式微,信息资源整理与利用的技术方法越来越异化和泛化。建立在纸质信息资源基础上的传统编目方法固然存在种种弊端,但是,这不能成为“安乐死”的理由,只能成为与时俱进的发展动力。

      数据商的数据垄断和技术垄断正在严重阻碍图书馆的发展和知识的交流,以数据商和技术商为主导的图书馆技术方法同样在侵蚀图书馆的专业领地。在欢迎技术创新,拥抱新技术的同时,图书馆界必须保持清醒的头脑和长远的眼光,不被眼花缭乱的新技术方法迷惑了心智,从而失去自我。

      创新固然重要,守护同样重要。创新并非都是“砸烂一个旧世界,建立一个新世界”,在大多数情况下是继承和发扬。文献编目需要创新,但是也需要继承,特别是守望呵护,因为文献编目是图书馆最后的专业技术领地。

      在闭架时,分类排架法非常重要;在开架时,分类排架法比较重要;在RFID时,分类排架法仍然重要。虽然编目的重要性在逐渐减弱,索书号(排架号)在不断由繁入简,但是,编目始终必不可少。同样,在现有的各种数据库检索系统中,数字资源与纸质资源的关联始终是必不可少的,如果没有图书馆的编目,何来这种关联?

      图书馆编目应该不断创新和发展,这是大势所趋。尽管如此,迄今为止还没有哪个图书馆废除了编目部或者编目工作。这说明,不论重要与否,编目都是不可或缺的。

      守护文献编目这块图书馆的专业技术领地,就是守护图书馆的文化传统,守护图书馆的专业精神。尊重文献编目,对文献编目心存敬意,并且使之在数字时代不断发扬光大,是图书馆人应当保持的基本态度。

标签:;  ;  ;  ;  ;  ;  ;  

图书馆编目的困境与未来--随图书馆生存与死亡而编撰元数据_元数据论文
下载Doc文档

猜你喜欢